JP2670372B2 - Binarization method - Google Patents

Binarization method

Info

Publication number
JP2670372B2
JP2670372B2 JP1327230A JP32723089A JP2670372B2 JP 2670372 B2 JP2670372 B2 JP 2670372B2 JP 1327230 A JP1327230 A JP 1327230A JP 32723089 A JP32723089 A JP 32723089A JP 2670372 B2 JP2670372 B2 JP 2670372B2
Authority
JP
Japan
Prior art keywords
image
labeling
histogram
binarized
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1327230A
Other languages
Japanese (ja)
Other versions
JPH03188587A (en
Inventor
明生 佐野
章 笠野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1327230A priority Critical patent/JP2670372B2/en
Publication of JPH03188587A publication Critical patent/JPH03188587A/en
Application granted granted Critical
Publication of JP2670372B2 publication Critical patent/JP2670372B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は、濃淡画像を2値化画像に変換するための
2値化方式に関する。
DETAILED DESCRIPTION OF THE INVENTION [Purpose of the Invention] (Field of Industrial Application) The present invention relates to a binarization method for converting a grayscale image into a binary image.

(従来の技術) ITVカメラ等の画像入力装置により取込まれた濃淡画
像(濃淡ディジタルデータで表現される画像)に含まれ
る文字を認識して読取る文字認識装置では、濃淡画像を
2値化画像に変換し、この2値化画像上で面積(独立し
た領域の画素数)が所定値以上の図形を切出して、文字
認識対象とするのが一般的であった。この具体例を、第
4図を参照して以下に説明する。
(Prior Art) In a character recognition device that recognizes and reads characters included in a grayscale image (an image represented by grayscale digital data) captured by an image input device such as an ITV camera, a grayscale image is converted into a binary image. It has been general to convert the image into a figure and cut out a figure having an area (the number of pixels in an independent area) of a predetermined value or more on the binarized image to be a character recognition target. This specific example will be described below with reference to FIG.

2値化処理 まず、ITVカメラ等により取込まれた濃淡画像をデー
タ変換機能を用いて2値化画像に変換する。この際、低
い濃度レベルで2値化すると(即ち低濃度レベルを閾値
として2値化すると)、第4図において符号41で示され
るように、文字がほぼ完全に抽出されると同時にノイズ
(雑音)も抽出された2値化画像が得られる。一方、高
い濃度レベルで2値化すると、第4図において符号42で
示されるように、ノイズは除去されるものの、文字がか
すれたり一部が消えてしまう2値化画像が得られる。こ
のような2値化画像42では文字認識は不可能であるた
め、従来は、低い濃度レベルで2値化することで文字が
くっきりと浮び上った2値化画像41が用いられる。
Binarization Processing First, a grayscale image captured by an ITV camera or the like is converted into a binary image using a data conversion function. At this time, if binarization is performed at a low density level (that is, binarization is performed using the low density level as a threshold value), as shown by reference numeral 41 in FIG. ) Is also extracted to obtain a binarized image. On the other hand, if the binarization is performed at a high density level, as shown by reference numeral 42 in FIG. 4, although the noise is removed, a binarized image in which the characters are faint or a part thereof disappears is obtained. Since character recognition is not possible with such a binarized image 42, conventionally, the binarized image 41 in which characters are clearly highlighted by binarizing at a low density level is used.

ラベリング処理 低い濃度レベルで2値化することで得られる2値化画
像41には、上記したようにノイズが含まれている。そこ
で、このノイズを、抽出された文字に影響を及ぼさずに
除去するための第1ステップとして、ラベリング処理、
即ち2値化画像41内で真値を持つ画素(値が“1"の画
素)が連結した各々の領域毎に独立のラベル値(番号)
を各画素に付すラベリング処理を行い、第4図において
符号43で示されるようなラベリング画像を求める。な
お、第4図のラベリング画像43において、符号L2,L3…L
30はそれぞれラベル値2,3…30を持つ独立の画像領域
(ここでは文字、ノイズの領域)を示す。
Labeling Processing The binarized image 41 obtained by binarizing at a low density level contains noise as described above. Therefore, as a first step for removing this noise without affecting the extracted characters, a labeling process,
That is, an independent label value (number) is provided for each region where pixels having true values (pixels having a value of “1”) in the binarized image 41 are connected.
Is performed on each pixel to obtain a labeling image indicated by reference numeral 43 in FIG. In the labeling image 43 of FIG. 4, reference characters L2, L3 ... L
Reference numeral 30 denotes an independent image area (here, a character and noise area) having label values of 2, 3,...

ヒストグラム処理 ノイズ除去の第2ステップとして、で求めたラベリ
ング画像43のヒストグラム、即ちラベリング画像のラベ
ル値毎の画素数(面積)を表す第4図において符号44で
示すようなヒストグラムを作成する。ここでは、ヒスト
グラム値がある一定値、例えば10より低い小領域(画素
数が10以下の領域)の画像は、次に述べるようにノイズ
と見なされる。
Histogram Processing As the second step of noise removal, a histogram of the labeling image 43 obtained in step 1, that is, a histogram as shown by reference numeral 44 in FIG. 4 showing the number of pixels (area) for each label value of the labeling image is created. Here, an image in a small region (a region where the number of pixels is 10 or less) lower than a certain constant value, for example, 10 is regarded as noise as described below.

データ変換処理 ノイズ除去の最終ステップとして、で求めたヒスト
グラム44上で、ヒストグラム値(画素数)が一定値以上
(ここでは10)となる領域の画像(ここでは、図から明
らかなように、ラベル値が6の領域の画像のみ)を“1"
とするように、ラベリング画像43を対象にデータ変換
(2値化)する。この結果、第4図において符号45で示
されるように、一定値(10)より低いヒストグラム値と
なる領域の画像(ノイズ)が除去された2値化画像が求
められる。この2値化画像45が、文字認識等に用いられ
る。
Data conversion process As the final step of noise removal, the image of the area where the histogram value (number of pixels) is a certain value or more (here, 10) on the histogram 44 obtained in (here, as is clear from the figure, the label "1" for the image of the area where the value is 6)
As described above, the labeling image 43 is subjected to data conversion (binarization). As a result, as indicated by reference numeral 45 in FIG. 4, a binarized image in which the image (noise) in the area having a histogram value lower than the constant value (10) is removed is obtained. This binary image 45 is used for character recognition and the like.

(発明が解決しようとする課題) 上記したように従来の2値化方式では、目的画像(図
形)を完全に抽出するために濃淡画像を低濃度レベルで
2値化することで、ノイズも抽出されてしまっても、そ
のノイズ(を構成する連結画素の領域)が小さい場合に
は、上記の〜のラベリング、ヒストグラムおよびデ
ータ変換の各処理によりノイズを除去することができ
る。しかし、上記の2値化処理で第5図に示す2値化
画像51のように大きいノイズ52が残った場合には、その
ノイズ52の画素数が一定値(閾値)以上となることか
ら、そのノイズ52は除去できず、第5図に示すように、
最終的に求められる2値化画像53中に残ってしまう。こ
の結果、2値化画像53に残ったノイズ52は、例えば文字
認識の場合には、文字の一部として誤判断されてしま
う。
(Problems to be Solved by the Invention) As described above, in the conventional binarization method, noise is also extracted by binarizing the grayscale image at a low density level in order to completely extract the target image (figure). Even if it is done, if the noise (the area of the connected pixels constituting the noise) is small, it is possible to remove the noise by each of the processes of labeling, histogram, and data conversion described above. However, when a large noise 52 remains like the binarized image 51 shown in FIG. 5 in the above binarization processing, the number of pixels of the noise 52 becomes a certain value (threshold value) or more, The noise 52 cannot be removed, and as shown in FIG.
It remains in the binarized image 53 finally obtained. As a result, the noise 52 remaining in the binarized image 53 is erroneously determined as a part of a character in the case of character recognition, for example.

この発明は上記事情に鑑みてなされたものでその目的
は、目的画像(図形)を確実に2値化して抽出するため
に濃淡画像を低濃度レベルで2値化した際に、大きなノ
イズ(ノイズ領域)が抽出されても確実に除去できる2
値化方式を提供することにある。
The present invention has been made in view of the above circumstances, and its object is to generate a large noise (noise) when a grayscale image is binarized at a low density level in order to surely binarize and extract a target image (graphic). (Area) can be reliably removed even if extracted 2
It is to provide a valuation method.

[発明の構成] (課題を解決するための手段) この発明は、濃淡画像を低濃度レベルで2値化するこ
とで得られた2値化画像(第1の2値化画像)を対象と
するラベリング処理を行ってラベリング画像を得、しか
る後に、このラベリング画像のヒストグラムを作成する
際に、上記の濃淡画像を高濃度レベルで2値化すること
で得られる2値化画像(第2の2値化画像)をマスクと
して用い、上記ラベリング画像のうち、高濃度レベルの
濃淡画像部分に対応する画像部分に対してのみヒストグ
ラムが作成される構成とし、このヒストグラム上で所定
値以上のヒストグラム値(画素数)を持つ領域のラベル
値を検出し、この検出したラベル値を持つ領域の画像の
みを上記ラベリング画像から抽出して2値化すること
で、求める2値化画像(第3の2値化画像)を得るよう
にしたことを特徴とするものである。
[Configuration of the Invention] (Means for Solving the Problems) The present invention is intended for a binarized image (first binarized image) obtained by binarizing a grayscale image at a low density level. A labeling image is obtained by performing a labeling process, and thereafter, when a histogram of this labeling image is created, a binarized image (second image) obtained by binarizing the grayscale image at a high density level is used. (Binarized image) is used as a mask, and a histogram is created only for an image portion corresponding to a high-density grayscale image portion of the labeling image, and a histogram value of a predetermined value or more on this histogram is set. The label value of the area having the (number of pixels) is detected, and only the image of the area having the detected label value is extracted from the labeling image and binarized to obtain the binarized image (the third image). It is characterized in that to obtain a binary image).

(作用) 上記の構成において、第1の2値化画像は濃淡画像を
低濃度レベルで2値化することで求められる。このため
第1の2値化画像には、文字等の目的画像(図形)がほ
ぼ完全に抽出されるばかりでなく、ノイズも抽出されて
含まれる。このため、上記した第1の2値化画像を対象
としてラベリング処理を行ってラベリング画像を得、こ
のラベリング画像のヒストグラムを作成した場合、この
ヒストグラム中にはノイズ部分のヒストグラムデータも
含まれしまう。そこで、ラベリング画像のヒストグラム
を作成する際に、上記のように濃淡画像を高濃度レベル
で2値化することで得られる第2の2値化画像をラベリ
ング画像に対するマスクとして用い、ラベリング画像全
体でなく、第2の2値化画像が有効な部分(“1"の部
分)、即ち高濃度レベルの濃淡画像部分に対応する画像
部分だけを対象としてヒストグラムを作成することで、
ノイズ部分をヒストグラムデータに含まないようにする
こと(含むとしても低いヒストグラム値とすること)が
可能となる。したがって、このようなヒストグラム上で
所定値以上のヒストグラム値を持つ領域のラベル値を検
出し、この検出したラベル値を持つ領域の画像のみを上
記ラベリング画像から抽出して2値化することで、ノイ
ズが除去された2値化画像を得ることが可能となる。
(Operation) In the above configuration, the first binarized image is obtained by binarizing the grayscale image at a low density level. For this reason, the first binary image not only extracts the target image (graphic) such as a character almost completely, but also extracts and includes noise. Therefore, when the labeling process is performed on the first binarized image described above to obtain the labeling image and the histogram of the labeling image is created, the histogram data of the noise portion is also included in the histogram. Therefore, when the histogram of the labeling image is created, the second binarized image obtained by binarizing the grayscale image at the high density level as described above is used as a mask for the labeling image, and the entire labeling image is used. Instead, the histogram is created by targeting only the portion where the second binarized image is effective (the portion of "1"), that is, the image portion corresponding to the grayscale image portion of the high density level.
It is possible to exclude the noise portion from the histogram data (even if it does, a low histogram value). Therefore, by detecting the label value of the area having the histogram value of the predetermined value or more on such a histogram and extracting only the image of the area having the detected label value from the labeling image and binarizing it. It is possible to obtain a binarized image from which noise has been removed.

(実施例) 第1図はこの発明を適用する2値化装置の一実施例を
示すブロック構成図である。同図において、11は画像入
力装置(図示せず)によって入力された濃淡(多値)デ
ィジタルデータ表現の濃淡画像が格納される入力画像メ
モリ、12は入力画像メモリ11に格納されている濃淡画像
を一定の濃度レベルで2値化するデータ変換器である。
本実施例において、データ変換器12は上記濃淡数画像を
第1の濃度レベル(ここでは低い濃度レベル)で2値化
する第1の2値化機能と、第2の濃度レベル(ここでは
高い濃度レベル)で2値化する第2の2値化機能とを有
している。13はデータ変換器12により低い濃度レベルで
2値化された画像を格納するための2値化画像メモリ、
14はデータ変換器12により高い濃度レベルで2値化され
た画像を格納するための2値化画像メモリである。15は
2値化画像メモリ13内の2値化画像を対象にラベリング
処理を行ってラベリング画像を得るラベリング器、16は
ラベリング器15によって得られたラベリング画像を格納
するためのラベリング画像メモリである。
(Embodiment) FIG. 1 is a block diagram showing an embodiment of a binarizing apparatus to which the present invention is applied. In the figure, 11 is an input image memory for storing a grayscale image of a grayscale (multivalued) digital data input by an image input device (not shown), and 12 is a grayscale image stored in the input image memory 11. Is a data converter for binarizing at a constant density level.
In this embodiment, the data converter 12 performs a first binarization function of binarizing the grayscale number image at a first density level (here, a low density level), and a second density level (here, a high density level). It has a second binarizing function for binarizing at a density level). A binarized image memory 13 for storing an image binarized at a low density level by the data converter 12;
Reference numeral 14 denotes a binarized image memory for storing an image binarized at a high density level by the data converter 12. Reference numeral 15 is a labeling device that obtains a labeling image by performing a labeling process on the binarized image in the binarized image memory 13, and 16 is a labeling image memory for storing the labeling image obtained by the labeling device 15. .

17はラベリング画像メモリ16内のラベリング画像に2
値化画像メモリ14内の2値化画像をマスクしてラベリン
グ値毎のヒストグラムを求めるヒストグラム器、18はヒ
ストグラム器17で求められたラベリング画像のヒストグ
ラムを格納するためのヒストグラムテーブルである。19
はヒストグラムテーブル18上で所定値以上の画素数(ヒ
ストグラム値)を持つラベル値を検出し、この検出した
ラベル値を持つ画像のみを上記ラベリング画像から抽出
して2値化して最終的な2値化画像を求めるデータ変換
器、20はデータ変換器19によって求められた2値化画像
を格納するための2値化画像メモリである。なお、第1
図の各要素、即ち入力画像メモリ11、データ変換器12、
2値化画像メモリ13、2値化画像メモリ14、ラベリング
器15、ラベリング画像メモリ16、ヒストグラム器17、ヒ
ストグラムテーブル18、データ変換器19および2値化画
像メモリ20を画像データバスにより相互接続したシステ
ムにより、2値化装置を構成することも可能である。
17 is for the labeling image in the labeling image memory 16
A histogram device for masking the binarized image in the binarized image memory 14 to obtain a histogram for each labeling value, and a histogram table 18 for storing the histogram of the labeling image obtained by the histogram device 17. 19
Detects a label value having a number of pixels (histogram value) greater than or equal to a predetermined value on the histogram table 18, extracts only the image having the detected label value from the labeling image, binarizes the final binary value. A data converter 20 for obtaining a binarized image is a binarized image memory for storing the binarized image obtained by the data converter 19. The first
Each element of the figure, that is, the input image memory 11, the data converter 12,
The binarized image memory 13, the binarized image memory 14, the labeling device 15, the labeling image memory 16, the histogram device 17, the histogram table 18, the data converter 19, and the binarized image memory 20 are interconnected by an image data bus. It is also possible to configure a binarization device by the system.

第2図は第1図の2値化装置における2値化処理の流
れを説明するための図、第3図は第1図に示すヒストグ
ラム器17の動作を説明するための図である。
FIG. 2 is a diagram for explaining the flow of the binarization processing in the binarization device of FIG. 1, and FIG. 3 is a diagram for explaining the operation of the histogram device 17 shown in FIG.

次に、第1図の構成の動作を、文字認識等のための文
字切出しに必要な濃淡画像の2値化処理を例に、第2図
および第3図を適宜参照して説明する。
Next, the operation of the configuration shown in FIG. 1 will be described with reference to FIGS. 2 and 3 as appropriate, taking as an example the binarization processing of a grayscale image necessary for character extraction for character recognition and the like.

濃淡画像入力処理 まず、図示せぬITVカメラ等の画像入力装置により、
濃淡ディジタルデータに変換された2値化対象濃淡画像
21(第2図参照)が入力され、入力画像メモリ11に格納
される。
Grayscale image input processing First, using an image input device such as an ITV camera (not shown)
Binary target grayscale image converted to grayscale digital data
21 (see FIG. 2) is input and stored in the input image memory 11.

低レベルベルでの2値化処理 データ変換器12は、入力画像メモリ11に格納された濃
淡画像21を予め定められた第1の閾値レベル(低濃度レ
ベル)で2値化し、2値化画像22(第2図参照)を得
る。この2値化画像22は、低濃度レベルで2値化された
ものであることから、文字(図ではj)が完全に抽出さ
れているものの、ノイズも抽出されている。2値化画像
22は2値化画像メモリ13に格納される。
Low level bell binarization process The data converter 12 binarizes the grayscale image 21 stored in the input image memory 11 at a predetermined first threshold level (low density level). 22 (see FIG. 2) is obtained. Since the binarized image 22 is binarized at a low density level, the character (j in the figure) is completely extracted, but noise is also extracted. Binary image
22 is stored in the binarized image memory 13.

高レベルベルでの2値化処理 またデータ変換器12は、上記濃淡画像21を予め定めら
れた第2の閾値レベル(高濃度レベル)で2値化し、2
値化画像23(第2図および第3図参照)を得る。この2
値化画像23は、高濃度レベルで2値化されたものである
ことから、ノイズが除去されているものの、文字がかす
れたり、一部が消えている。2値化画像23は2値化画像
メモリ14に格納される。なお、およびの2値化処理
は並列に行うことが可能である。
Binarization Processing by High Level Bell Further, the data converter 12 binarizes the grayscale image 21 at a predetermined second threshold level (high density level).
A binarized image 23 (see FIGS. 2 and 3) is obtained. This 2
Since the binarized image 23 is binarized at a high density level, the noise is removed, but the characters are faint or a part thereof disappears. The binarized image 23 is stored in the binarized image memory 14. Note that the binarization processes and can be performed in parallel.

ラベリング処理 2値化画像メモリ14に格納された2値化画像(低濃度
レベルで2値化された2値化画像)22はラベリング器15
に供給される。ラベリング器15は、この2値化画像22を
対象として、同画像22内で真値を持つ画素(値が“1"の
画素)が連結した各々の領域毎に独立のラベル値(番
号)を各画素に付すラベリング処理を行い、ラベリング
画像24(第2図および第3図参照)を求める。このラベ
リング画像24はラベリング画像メモリ16に格納される。
なお、第2図および第3図に示すラベリング画像24にお
いて、符号L2,L3…L20はそれぞれラベル値2,3…20を持
つ独立の画像領域(ここでは文字、ノイズの領域)を示
す。
Labeling Processing The binarized image (binary image binarized at a low density level) 22 stored in the binarized image memory 14 is labeled with a labeling unit 15.
Supplied to The labeling device 15 targets the binarized image 22 with an independent label value (number) for each region in which pixels having a true value (pixels with a value of “1”) are connected in the image 22. A labeling process is performed on each pixel to obtain a labeling image 24 (see FIGS. 2 and 3). The labeling image 24 is stored in the labeling image memory 16.
It should be noted that in the labeling images 24 shown in FIGS. 2 and 3, the symbols L2, L3 ... L20 represent independent image areas (here, character and noise areas) having label values 2, 3 ... 20, respectively.

ヒストグラム処理 上記でラベリング画像24に格納されたラベリング画
像24はヒストグラム器17に供給される。このヒストグラ
ム器17には、2値化画像メモリ14内の2値化画像(高濃
度レベルで2値化された2値化画像)23も供給される。
ヒストグラム器17は、ラベリング画像24に2値化画像23
をマスクし、第3図に示すようにマスク画像(2値化画
像23)が有効な部分(“1"の部分)に対応するラベリン
グ画像24の部分、即ち濃淡画像の高濃度部分(ここでは
文字部分)に対応するラベリング画像24の部分について
のみ、ラベル値毎の画素数(面積)を表すヒストグラム
を求める。この結果、本実施例では、文字部分(ラベル
値が5と8の各文字部分)についてのみのヒストグラム
25(第2図および第3図参照)が求められる。このヒス
トグラム25には、ノイズ部分(ラベル値が3や4などの
小領域のノイズ部分だけでなく、ラベル値が7や20など
の大領域のノイズ部分)のヒストグラムデータが含まれ
ていない(含まれていてもヒストグラム値は小さい)こ
とに注意されたい。ヒストグラム25は、ヒストグラムテ
ーブル18に格納される。
Histogram processing The labeling image 24 stored in the labeling image 24 is supplied to the histogram unit 17. The binarized image (binarized image binarized at a high density level) 23 in the binarized image memory 14 is also supplied to the histogram device 17.
The histogram unit 17 converts the binarized image 23 into the labeling image 24.
3 is masked, and as shown in FIG. 3, the portion of the labeling image 24 corresponding to the effective portion (the portion of "1") of the mask image (binarized image 23), that is, the high density portion of the grayscale image (here, For only the portion of the labeling image 24 corresponding to the character portion), a histogram representing the number of pixels (area) for each label value is obtained. As a result, in this embodiment, the histogram of only the character portion (each character portion having label values of 5 and 8) is obtained.
25 (see Figures 2 and 3) is required. This histogram 25 does not include the histogram data of the noise part (not only the noise part of the small area such as label value 3 or 4 but also the noise part of the large area such as label value 7 or 20) However, the histogram value is small). The histogram 25 is stored in the histogram table 18.

データ変換処理 ヒストグラム器17によってヒストグラムテーブル18に
ヒストグラム25が求められると、ラベリング画像メモリ
16内のラベリング画像を2値化画像に変換するデータ変
換器19が起動される。データ変換器19は、ヒストグラム
テーブル18上のヒストグラム25により、予め定められた
値以上のヒストグラム値(画素数、面積)となっている
ラベル値(ここでは5と8)を検出し、この検出したラ
ベル値を持つラベリング画像24内の画像部分のみを抽出
して2値化する。この結果、文字だけが確実に抽出され
た2値化画像26、即ち文字j(を構成するラベル値が5
と8の各文字部分)だけが抽出され、ラベル値が3や4
などの小領域のノイズ部分は勿論、ラベル値が7や20な
どの大領域のノイズ部分が除去された2値化画像26が求
められる。この2値化画像26は2値化画像メモリ20に格
納され、文字認識装置による認識処理に供される。
Data Conversion Processing When the histogram 25 is obtained in the histogram table 18 by the histogram unit 17, the labeling image memory
A data converter 19 for converting the labeling image in 16 into a binary image is activated. The data converter 19 detects a label value (here, 5 and 8) having a histogram value (number of pixels, area) equal to or larger than a predetermined value from the histogram 25 on the histogram table 18, and detects this. Only the image portion in the labeling image 24 having the label value is extracted and binarized. As a result, the binarized image 26 in which only the character is reliably extracted, that is, the label value of the character j (
And each character part of 8) is extracted, and the label value is 3 or 4.
The binarized image 26 from which the noise portion of the large region such as 7 or 20 as well as the noise portion of the small region such as is removed is obtained. The binarized image 26 is stored in the binarized image memory 20 and is used for recognition processing by the character recognition device.

以上は、文字認識等のための文字切出しに必要な濃淡
画像の2値化処理について説明したが、本発明は正しい
2値化画像をノイズを含まずに抽出することが要求され
る2値化処理全般に応用可能である。
Although the binarization processing of the grayscale image necessary for character cutting for character recognition and the like has been described above, the present invention is required to binarize a correct binarized image without noise. It can be applied to all processes.

[発明の効果] 以上詳述したようにこの発明によれば、目的画像(図
形)を確実に2値化して抽出するために濃淡画像を低濃
度レベルで2値化し、そのラベリング画像のヒストグラ
ムを作成する際に、濃淡画像を高濃度レベルで2値化す
ることで得られる2値化画像をマスク画像として用い、
このマスク画像の有効部分に対応するラベリング画像部
分だけを対象としてヒストグラムを作成することで、ノ
イズ部分のヒストグラム値を零、或は極めて小さい値と
することが可能となり、このようなヒストグラム上で所
定値以上のヒストグラム値を持つ領域のラベル値を検出
して、この検出したラベル値を持つ領域の画像のみをラ
ベリング画像から抽出して2値化することで、目的画像
を正しく残しながら、小領域のノイズは勿論のこと、大
領域のノイズが除去された2値化画像を得ることができ
る。
As described above in detail, according to the present invention, the grayscale image is binarized at a low density level in order to surely binarize and extract the target image (graphic), and the histogram of the labeling image is displayed. At the time of creation, a binary image obtained by binarizing a grayscale image at a high density level is used as a mask image,
By creating a histogram only for the labeling image portion corresponding to the effective portion of the mask image, the histogram value of the noise portion can be set to zero or an extremely small value. By detecting the label value of the area having the histogram value equal to or more than the value and extracting only the image of the area having the detected label value from the labeling image and binarizing it, the small area can be retained while the target image is left correctly. It is possible to obtain a binarized image from which noise of a large area is removed as well as the noise.

【図面の簡単な説明】[Brief description of the drawings]

第1図はこの発明を適用する2値化装置の一実施例を示
すブロック構成図、第2図は第1図の2値化装置におけ
る2値化処理の流れを説明するための図、第3図は第1
図に示すヒストグラム器17の動作を説明するための図、
第4図は従来の2値化処理の流れを説明するための図、
第5図は従来の2値化処理の問題を説明するための図で
ある。 11……入力画像メモリ、12,19……データ変換器、13,1
4,20……2値化画像メモリ、15……ラベリング器、16…
…ラベリング画像メモリ、17……ヒストグラム器、18…
…ヒストグラムテーブル。
FIG. 1 is a block diagram showing an embodiment of a binarizing apparatus to which the present invention is applied, and FIG. 2 is a diagram for explaining the flow of binarizing processing in the binarizing apparatus of FIG. Figure 3 is the first
Diagram for explaining the operation of the histogram unit 17 shown in the figure,
FIG. 4 is a diagram for explaining the flow of conventional binarization processing,
FIG. 5 is a diagram for explaining the problem of the conventional binarization processing. 11 …… Input image memory, 12,19 …… Data converter, 13,1
4,20 …… Binary image memory, 15 …… Labeling device, 16 ・ ・ ・
… Labeling image memory, 17… Histogram device, 18…
… Histogram table.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】濃淡ディジタルデータで表現される濃淡画
像を第1の濃度レベルで2値化して第1の2値化画像を
得、上記濃淡画像を上記第1の濃度レベルより高い第2
の濃度レベルで2値化して第2の2値化画像を得る第1
の2値化手段と、 上記第1の2値化画像内の独立した各領域毎に独立のラ
ベル値を付すラベリング処理を行ってラベリング画像を
得るラベリング手段と、 上記第2の2値化画像をマスクとして、上記ラベリング
画像のラベル値毎の画素数を示すヒストグラムを求める
ヒストグラム手段と、 上記ヒストグラム上で所定値以上の画素数を持つラベル
値を検出し、この検出したラベル値を持つ画像のみを上
記ラベリング画像から抽出して2値化して目的とする第
3の2値化画像を得る第2の2値化手段と、 を具備することを特徴とする2値化方式。
1. A grayscale image represented by grayscale digital data is binarized at a first density level to obtain a first binarized image, and the grayscale image is secondly higher than the first density level.
First binarization to obtain a second binarized image
Binarizing means, a labeling means for performing a labeling process for giving an independent label value to each independent region in the first binary image, and a labeling image for obtaining a labeling image; and the second binary image. With a mask as a mask, a histogram means for obtaining a histogram showing the number of pixels for each label value of the labeling image, and a label value having a pixel number of a predetermined value or more on the histogram is detected, and only the image having the detected label value is detected. And a second binarizing means for extracting the target image from the labeling image and binarizing it to obtain a target third binarized image.
JP1327230A 1989-12-19 1989-12-19 Binarization method Expired - Lifetime JP2670372B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1327230A JP2670372B2 (en) 1989-12-19 1989-12-19 Binarization method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1327230A JP2670372B2 (en) 1989-12-19 1989-12-19 Binarization method

Publications (2)

Publication Number Publication Date
JPH03188587A JPH03188587A (en) 1991-08-16
JP2670372B2 true JP2670372B2 (en) 1997-10-29

Family

ID=18196773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1327230A Expired - Lifetime JP2670372B2 (en) 1989-12-19 1989-12-19 Binarization method

Country Status (1)

Country Link
JP (1) JP2670372B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4119290B2 (en) * 2003-03-28 2008-07-16 松下電器産業株式会社 Video processing apparatus and imaging system
JP4777024B2 (en) 2005-09-06 2011-09-21 キヤノン株式会社 Image processing apparatus and image processing apparatus control method

Also Published As

Publication number Publication date
JPH03188587A (en) 1991-08-16

Similar Documents

Publication Publication Date Title
US6886136B1 (en) Automatic template and field definition in form processing
JPH0467234B2 (en)
JP2004280334A (en) Image reading device
JP2670372B2 (en) Binarization method
JPH0565911B2 (en)
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
EP0917349A3 (en) Region extraction method and apparatus
JPH10105647A (en) Device and method for reading container number
JPH069062B2 (en) Area extraction device
JPH06223156A (en) License plate extracting device
JPS6254380A (en) Character recognizing device
JPS6410872B2 (en)
JPH10171924A (en) Character recognizing device
JPS63184886A (en) Binarizing system for picture processing
JPS62247473A (en) Picture processor
JP2874362B2 (en) Character extraction device
JP2870640B2 (en) Figure recognition method
JP2022054632A (en) Program and device for recognizing license plate
JPS617988A (en) Pattern restoring system
JPH0520488A (en) Number plate character recognizing device
JPS63167992A (en) Segmenting method for character
JP3199033B2 (en) Optical character reading method and optical character reading device
JPH05225383A (en) Character segmenting device
Kumar et al. Text data extraction from microfilm images of punched cards
JPH05225384A (en) Character segmenting device