JPH11312218A - Character optimally binarizing device - Google Patents

Character optimally binarizing device

Info

Publication number
JPH11312218A
JPH11312218A JP10132579A JP13257998A JPH11312218A JP H11312218 A JPH11312218 A JP H11312218A JP 10132579 A JP10132579 A JP 10132579A JP 13257998 A JP13257998 A JP 13257998A JP H11312218 A JPH11312218 A JP H11312218A
Authority
JP
Japan
Prior art keywords
histogram
character
threshold value
evaluation value
valley position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10132579A
Other languages
Japanese (ja)
Inventor
Yoshiyuki Matsuyama
好幸 松山
Chihiro Ueki
千尋 植木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10132579A priority Critical patent/JPH11312218A/en
Publication of JPH11312218A publication Critical patent/JPH11312218A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a character optimally binarizing device, capable of correctly segmenting a character by calculating an optimal binarized threshold value for each character. SOLUTION: This device consists of a histogram acquiring means which acquires the histogram by each character, a histogram smoothing means 2 taking the moving average of histogram to smooth the histogram, a histogram valley position detecting means 3 detecting the valley position of the histogram, a histogram evaluation value calculating means 4 for calculating an evaluation value expressing the form of the histogram, a binarized threshold setting means 5 for setting the binarized threshold from a histogram evaluation value.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字認識に利用さ
れる文字最適2値化装置に関し、特に一文字毎の最適2
値化しきい値を決定してこれに基づいて文字を一文字毎
正確に切り出し得るよう構成したものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optimal character binarizing apparatus used for character recognition, and more particularly to an optimal character binarizing apparatus for each character.
A threshold value is determined and a character can be cut out one character at a time based on the threshold value.

【0002】[0002]

【従来の技術】文字を切り出して文字情報を2値化する
2値化装置は、OCR(光学的文字読取装置)に普通に
備えられているものである。OCR(光学的文字読取装
置)の2値化装置は、通常、帳票に記載されている全文
字を固定しきい値で2値化している。
2. Description of the Related Art A binarizing apparatus for extracting characters and binarizing character information is commonly provided in an OCR (optical character reading apparatus). 2. Description of the Related Art A binarizing device of an OCR (optical character reading device) usually binarizes all characters described in a form with a fixed threshold.

【0003】従来、帳票に記載されている文字は、活字
印刷・スタンプ・手書き等様々な文字種であり、さらに
薄いもの、濃いもの、かすれているもの、ノイズで汚れ
ているもの等文字の濃度も様々である。帳票に記載され
ている全文字を固定しきい値で2値化したのでは、2値
化文字イメージのかすれ又はつぶれが生じ、後の文字認
識に悪影響を与えてしまう。
Conventionally, characters written on a form are of various character types such as printing, stamping, and handwriting. Further, the density of characters such as thin, dark, blurred, and stained with noise is also reduced. Various. If all the characters described in the form are binarized with a fixed threshold, the binarized character image will be blurred or crushed, which will adversely affect later character recognition.

【0004】そこで、たとえば特開昭61−14607
0号公報に開示された技術では、文字2値化回路とは別
にしきい値の異なる2値化回路を領域判定に使用するこ
とにより、画像特性に応じた最適な2値化処理を可能と
しているが、文字2値化回路とは別にしきい値の異なる
2値化回路を用意しなければならないので回路構成が複
雑になるという問題があった。
Accordingly, for example, Japanese Patent Application Laid-Open No. 61-14607
According to the technology disclosed in Japanese Patent Publication No. 0-200, an optimal binarization process according to image characteristics can be performed by using a binarization circuit having a different threshold value in addition to a character binarization circuit for area determination. However, there is a problem that the circuit configuration becomes complicated because a binarization circuit having a different threshold value must be prepared separately from the character binarization circuit.

【0005】[0005]

【発明が解決しようとする課題】そこで本発明は、ヒス
トグラムに基づいて一文字毎に最適な2値化しきい値を
決定し、正確な文字の切り出しを行なえる文字最適2値
化装置を提供することを目的とする。
SUMMARY OF THE INVENTION Accordingly, an object of the present invention is to provide a character optimum binarizing apparatus which determines an optimum binarization threshold for each character based on a histogram and can cut out an accurate character. With the goal.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するため
に本発明は、一文字毎のヒストグラムを取得するヒスト
グラム取得手段と、ヒストグラムの移動平均をとりヒス
トグラムを平滑化するヒストグラム平滑化手段と、ヒス
トグラムの谷位置を検出するヒストグラム谷位置検出手
段と、ヒストグラムの形状を表す評価値を算出するヒス
トグラム評価値算出手段と、ヒストグラム評価値から2
値化しきい値を決定する2値化しきい値決定手段を備え
ることを特徴とする。
In order to achieve the above object, the present invention provides a histogram acquiring means for acquiring a histogram for each character, a histogram smoothing means for taking a moving average of the histogram and smoothing the histogram, Histogram valley position detection means for detecting the valley position of the histogram, histogram evaluation value calculation means for calculating the evaluation value representing the shape of the histogram,
It is characterized by comprising a binarization threshold value determining means for determining a binarization threshold value.

【0007】上記構成により、本発明は、一文字毎に最
適な2値化しきい値を決定できるので、正確な文字の切
り出しを行なうことができる。
With the above configuration, according to the present invention, an optimum binarization threshold can be determined for each character, so that a correct character can be cut out.

【0008】[0008]

【発明の実施の形態】本発明の請求項1に記載の発明
は、一文字毎のヒストグラムを取得するヒストグラム取
得手段と、ヒストグラムの移動平均をとりヒストグラム
を平滑化するヒストグラム平滑化手段と、ヒストグラム
の谷位置を検出するヒストグラム谷位置検出手段と、ヒ
ストグラムの形状を表す評価値を算出するヒストグラム
評価値算出手段と、ヒストグラム評価値から2値化しき
い値を決定する2値化しきい値決定手段を備えることを
特徴とする文字最適2値化装置としたものであり、一文
字毎に最適な2値化しきい値を決定できるという作用を
有する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The invention according to claim 1 of the present invention comprises a histogram acquiring means for acquiring a histogram for each character, a histogram smoothing means for taking a moving average of the histogram and smoothing the histogram, and a histogram smoothing means. The apparatus includes a histogram valley position detecting means for detecting a valley position, a histogram evaluation value calculating means for calculating an evaluation value representing the shape of the histogram, and a binarization threshold value determining means for determining a binarization threshold value from the histogram evaluation value. This is a character-optimized binarizing apparatus characterized in that it has an effect that an optimal binarization threshold can be determined for each character.

【0009】本発明の請求項2に記載の発明は、一文字
毎のヒストグラムを取得するヒストグラム取得手段と、
ヒストグラムの移動平均をとりヒストグラムを平滑化す
るヒストグラム平滑化手段と、ヒストグラムの谷位置を
検出するヒストグラム谷位置検出手段と、ヒストグラム
の形状を表す評価値を算出するヒストグラム評価値算出
手段と、ヒストグラム評価値から2値化しきい値を決定
する2値化しきい値決定手段と、2値化後の全面積に対
する黒画素割合を算出する黒画素割合算出手段と、黒画
素割合から2値化しきい値を補正する2値化しきい値補
正手段を備えることを特徴とする文字最適2値化装置と
したものであり、ヒストグラム分布から文字の性質別に
最適な2値化しきい値を算出することができるという作
用を有する。
According to a second aspect of the present invention, there is provided a histogram obtaining means for obtaining a histogram for each character,
Histogram smoothing means for taking a moving average of the histogram and smoothing the histogram; histogram valley position detecting means for detecting a valley position of the histogram; histogram evaluation value calculating means for calculating an evaluation value representing the shape of the histogram; A binarization threshold value deciding unit for deciding a binarization threshold value from a value, a black pixel ratio calculation unit for calculating a black pixel ratio with respect to the entire area after binarization, This is a character optimum binarization device characterized by comprising a binarization threshold value correcting means for correcting, and it is possible to calculate an optimum binarization threshold value for each character property from a histogram distribution. Having.

【0010】以下、本発明の実施の形態について、図面
を用いて説明する。
An embodiment of the present invention will be described below with reference to the drawings.

【0011】(第1の実施の形態)図1は、本発明の第
1の実施の形態に係る文字最適2値化装置の構成を示す
ブロック図である。図1において、文字最適2値化装置
は、一文字毎のヒストグラムを取得するヒストグラム取
得手段1と、ヒストグラムの移動平均をとりヒストグラ
ムを平滑化するヒストグラム平滑化手段2と、ヒストグ
ラムの谷位置を検出するヒストグラム谷位置検出手段3
と、ヒストグラムの形状を表す評価値を算出するヒスト
グラム評価値算出手段4と、ヒストグラム評価値から2
値化しきい値を設定する2値化しきい値決定手段5とか
ら構成されている。
(First Embodiment) FIG. 1 is a block diagram showing a configuration of a character optimum binarizing apparatus according to a first embodiment of the present invention. In FIG. 1, the character optimum binarization device includes a histogram acquisition unit 1 for acquiring a histogram for each character, a histogram smoothing unit 2 for taking a moving average of the histogram and smoothing the histogram, and detecting a valley position of the histogram. Histogram valley position detection means 3
A histogram evaluation value calculation means 4 for calculating an evaluation value representing the shape of the histogram;
And a binarization threshold value determining means 5 for setting a binarization threshold value.

【0012】次に本発明の第1の実施の形態における文
字最適2値化装置の動作を説明する。ヒストグラム取得
手段1はよく知られているように一文字毎のヒストグラ
ムを取得する。ヒストグラム平滑化手段2は、よく知ら
れているように取得したヒストグラムの移動平均をとり
ヒストグラムを平滑化する。
Next, the operation of the character optimum binarizing device according to the first embodiment of the present invention will be described. The histogram acquisition unit 1 acquires a histogram for each character as is well known. The histogram smoothing means 2 smoothes the histogram by taking a moving average of the acquired histogram as is well known.

【0013】ヒストグラム谷位置検出手段3は上記の平
滑化したヒストグラムの谷位置を検出する。このヒスト
グラム谷位置の検出について、図2〜図4を用いてさら
に詳しく説明する。
The histogram valley position detecting means 3 detects a valley position of the smoothed histogram. The detection of the histogram valley position will be described in more detail with reference to FIGS.

【0014】図2は通常の文字ヒストグラムの一般的な
傾向を示すものである。図2において、一般に文字を外
接する矩形のヒストグラムは、濃度の一番低い側の山に
背景部分が含まれている。文字の2値化は文字と背景を
分離するために行なうので、背景部分の終わりつまり濃
度の一番低い山の谷位置th_lを求める必要がある。ま
た、濃度の一番高い側の山は文字部分の山であるので、
濃度の一番高い山の谷位置th_rを求める。そして最適な
2値化しきい値はth_l〜th_rの間に設定する。
FIG. 2 shows the general tendency of a normal character histogram. In FIG. 2, generally, a rectangular histogram circumscribing a character includes a background portion in a mountain having the lowest density. Since the binarization of the character is performed to separate the character from the background, it is necessary to find the end of the background, that is, the valley position th_l of the peak with the lowest density. Also, since the peak on the side with the highest concentration is the peak in the character part,
The valley position th_r of the peak having the highest concentration is obtained. The optimal binarization threshold is set between th_l and th_r.

【0015】図3および図4はヒストグラム谷位置th_
l、th_rを算出するための算出手順を説明するものであ
る。 文字ヒストグラムに対して移動平均幅17の移動平均を
かける。端末において、階調のサンプリング数が17に満
たない場合は、サンプル値0のデータが存在していると
して計算する。 階調値 x(0≦x≦255)に対してそのヒストグラムを h
(x)、h(x)に移動平均をかけたものを h_s(x)とする。5
階調間の差分ヒストグラムを h_sub(x)=h_s(x+5)−h_s
(x)を定義する。 x=0を始点として、h_sub(x)<0になる最初の階調値を
x0とすると、x0以降の階調値で h_sub(x)≦0かつh_sub
(x)>0になる階調値 th_l1=x+1を求める。 th_l1以降の連続上昇数(連続して h_sub(x)≧0となる
サンプル数) up_continue_countを求める。 th_l1≦x≦th_l1+up_continue_count間で連続して h_
sub(x)>2となる数 up_rate_countを求める(図3右端参
照)。 up_rate_count≧5の時はそれ以降に山が存在すると判
定してth_l1を谷位置th_lとするが、th_l1以前にh_sub
(x)=0が連続して存在する場合はth_l1をh_sub(x)=0の開
始点th_l2まで戻し処理を終了する。 up_rate_count<5の時(図4参照)は、th_l1以前に連続
してh_sub(x)=0または-1となる数 flat_countとその開
始点 th_l3を求める。 flat_count≧5の時は th_l3を th_lとする。flat_cou
nt<5の時は谷と判定せずに、に戻り始点 th_l1より同
様に繰り返す。 th_rの算出方法は階調の濃い側からサーチするのを除
いて上記〜のth_l算出方法と同様に行なう。
FIGS. 3 and 4 show a histogram valley position th_.
14 explains a calculation procedure for calculating l and th_r. Multiply the character histogram by a moving average with a moving average width of 17. In the terminal, when the gradation sampling number is less than 17, the calculation is performed assuming that the data of the sample value 0 exists. The histogram is expressed as h for the gradation value x (0 ≦ x ≦ 255).
h_s (x) is the value obtained by multiplying (x) and h (x) by the moving average. 5
H_sub (x) = h_s (x + 5) −h_s
Define (x). Starting from x = 0, the first gradation value that satisfies h_sub (x) <0
If x0, h_sub (x) ≤ 0 and h_sub
A gradation value th_l1 = x + 1 that satisfies (x)> 0 is obtained. The number of continuous rises after th_l1 (the number of samples that continuously satisfy h_sub (x) ≧ 0) is determined as up_continue_count. h_ continuously for th_l1 ≦ x ≦ th_l1 + up_continue_count
The number up_rate_count that satisfies sub (x)> 2 is obtained (see the right end of FIG. 3). When up_rate_count ≧ 5, it is determined that there is a peak after that, and th_l1 is set to the valley position th_l, but h_sub before th_l1
If (x) = 0 is continuously present, th_l1 is returned to the start point th_l2 of h_sub (x) = 0, and the process is terminated. When up_rate_count <5 (see FIG. 4), a number flat_count that becomes h_sub (x) = 0 or −1 continuously before th_l1 and its start point th_l3 are obtained. When flat_count ≧ 5, th_l3 is set to th_l. flat_cou
When nt <5, the process returns to the start point th_l1 without repeating determination as a valley, and repeats in the same manner. The th_r calculation method is the same as the above th_l calculation method, except that the search is performed from the side with the higher gradation.

【0016】上記した手順によってヒストグラム谷位置
の検出を実施する。そうしておいてから、ヒストグラム
評価値算出手段4はヒストグラムの形状を表す評価値を
算出する。
The detection of the histogram valley position is performed according to the above-described procedure. After that, the histogram evaluation value calculation means 4 calculates an evaluation value representing the shape of the histogram.

【0017】ここでヒストグラムの評価値を算出するこ
との有効性について説明する。帳票に記入された文字に
は、かすれた文字やノイズのある文字など濃度は様々で
ある。図5に示されるように、一般にかすれた文字のヒ
ストグラムは背景の山があり、その先はなだらかに推移
し、濃度の最濃な山の面積が小さいという傾向がある。
また、図6に示されるように、ノイズのある文字のヒス
トグラムは背景の山があり、その先には数個の山があり
起伏が激しく、濃度の最濃な山の面積が大きい。
Here, the effectiveness of calculating the evaluation value of the histogram will be described. The density of the characters written on the form such as faint characters and characters with noise varies. As shown in FIG. 5, generally, a histogram of a blurred character has a background mountain, and the tip of the histogram changes smoothly, and the area of the mountain having the highest density tends to be small.
Also, as shown in FIG. 6, the histogram of a character with noise has a background mountain, several peaks ahead of it, and undulations are severe, and the area of the peak with the highest density is large.

【0018】これらの文字種を判別するためには以下に
説明する評価値 th_paraが有効である。この評価値を用
いると、かすれた文字は評価値が低く、ノイズのある文
字は評価値が高く算出され、文字種の判別に有効であ
る。
In order to determine these character types, an evaluation value th_para described below is effective. When this evaluation value is used, a faint character has a low evaluation value, and a noisy character has a high evaluation value, which is effective for character type discrimination.

【0019】しきい値を決める評価値として、上記した
th_l以降のヒストグラム変化量に階調値の重みをかけ正
規化した値を用いる。すなわち、評価値を th_paraとす
ると、
As the evaluation value for determining the threshold value,
A weight normalized by multiplying the histogram change amount after th_l by a gradation value is used. That is, if the evaluation value is th_para,

【数1】 に基づいて算出される。(Equation 1) Is calculated based on

【0020】しきい値を決める評価値が算出されたの
で、2値化しきい値設定手段5は、ヒストグラム評価値
から2値化しきい値を決定する。
Since the evaluation value for determining the threshold value has been calculated, the binarization threshold value setting means 5 determines the binarization threshold value from the histogram evaluation value.

【0021】すなわち、上記したth_paraの値からしき
い値を次のように決定する。 th_para<TH_PARA_Lの場合 th=th_l TH_PARA_L≦th_para≦TH_PARA_Hの場合 th=th_l〜th_r間の面積比を0.5にする値 th_para>TH_PARA_Hの場合 th=th_r このようにして決定された2値化しきい値に基づいて文
字の切り出しを行なうことにより、正確な文字の切り出
すが行なえる。
That is, the threshold value is determined as follows from the value of th_para described above. When th_para <TH_PARA_L th = th_l When TH_PARA_L ≦ th_para ≦ TH_PARA_H A value that sets the area ratio between th = th_l and th_r to 0.5 th_para> When TH_PARA_H th = th_r By extracting characters based on the character, accurate characters can be extracted.

【0022】(第2の実施の形態)図7は、本発明の第
2の実施の形態に係る文字最適2値化装置の構成を示す
ブロック図である。図7において、文字最適2値化装置
は、一文字毎のヒストグラムを取得するヒストグラム取
得手段1と、ヒストグラムの移動平均をとりヒストグラ
ムを平滑化するヒストグラム平滑化手段2と、ヒストグ
ラムの谷位置を検出するヒストグラム谷位置検出手段3
と、ヒストグラムの形状を表す評価値を算出するヒスト
グラム評価値算出手段4と、ヒストグラム評価値から2
値化しきい値を設定する2値化しきい値決定手段5と、
2値化後の全面積に対する黒画素割合を算出する黒画素
割合算出手段6と、黒画素割合から2値化しきい値を補
正する2値化しきい値補正手段7とから構成されてい
る。
(Second Embodiment) FIG. 7 is a block diagram showing a configuration of a character optimum binarizing apparatus according to a second embodiment of the present invention. In FIG. 7, the character optimum binarization device includes a histogram acquisition unit 1 for acquiring a histogram for each character, a histogram smoothing unit 2 for taking a moving average of the histogram and smoothing the histogram, and detecting a valley position of the histogram. Histogram valley position detection means 3
A histogram evaluation value calculation means 4 for calculating an evaluation value representing the shape of the histogram;
A binarization threshold determining means 5 for setting a binarization threshold;
It comprises a black pixel ratio calculating means 6 for calculating a black pixel ratio with respect to the entire area after binarization, and a binary threshold value correcting means 7 for correcting a binary threshold value from the black pixel ratio.

【0023】次に本発明の第2の実施の形態における文
字最適2値化装置の動作を説明する。2値化しきい値決
定手段5により2値化しきい値を決定するところまで
は、上記した第1の実施の形態と同じである。
Next, the operation of the character optimum binarizing device according to the second embodiment of the present invention will be described. The operation up to the point where the binarization threshold value is determined by the binarization threshold value determination means 5 is the same as that of the first embodiment.

【0024】しかしながら、かすれた文字やノイズがか
った文字については、この方法でも十分とまではいかな
い場合がある。そこで、黒画素割合算出手段6により、
2値化後の全面積に対する黒画素割合を算出する。そし
て、2値化しきい値補正手段7により黒画素の割合から
上記した2値化しきい値決定手段5が決定した2値化し
きい値を補正する。この補正動作は最適な2値化しきい
値が決まるまで繰り返され、そして、最終的に決まった
補正2値化しきい値に基づいて文字の切り出しを実行す
ることで上記した第1の実施の形態よりも正確な文字の
切り出しを行なうことができる。
However, this method may not be sufficient for faint characters or characters with noise. Therefore, the black pixel ratio calculating means 6 calculates
The ratio of black pixels to the total area after binarization is calculated. Then, the binarization threshold value determined by the binarization threshold value determination unit 5 is corrected by the binarization threshold value correction unit 7 from the ratio of black pixels. This correction operation is repeated until an optimum binarization threshold value is determined, and the character is cut out based on the finally determined correction binarization threshold value. Can also accurately extract characters.

【0025】[0025]

【発明の効果】以上のように本発明の文字最適2値化装
置は、一文字毎に最適な2値化しきい値を算出するの
で、固定しきい値に比べ正確に文字を切り出すことがで
きるという効果を有する。
As described above, the character optimum binarization device of the present invention calculates the optimum binarization threshold value for each character, so that characters can be cut out more accurately than the fixed threshold value. Has an effect.

【0026】また、ヒストグラム分布から文字の性質別
に最適な2値化しきい値を算出するので、かすれた文字
やノイズがかった文字を2値化して正確な文字を切り出
すことができるという効果を有する。
Further, since an optimum binarization threshold is calculated for each character property from the histogram distribution, it is possible to binarize a blurred character or a noisy character to cut out an accurate character.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施の形態に係る文字最適2値
化装置の構成を示すブロック図、
FIG. 1 is a block diagram showing a configuration of a character optimum binarization device according to a first embodiment of the present invention;

【図2】通常の文字のヒストグラムの一般的な傾向を示
す図、
FIG. 2 is a diagram showing a general tendency of a histogram of a normal character;

【図3】ヒストグラム谷位置を算出するための算出手順
を説明するための図、
FIG. 3 is a diagram for explaining a calculation procedure for calculating a histogram valley position;

【図4】ヒストグラム谷位置を算出するための算出手順
を説明するための図、
FIG. 4 is a diagram for explaining a calculation procedure for calculating a histogram valley position;

【図5】かすれた文字のヒストグラムの一般的な傾向を
示す図、
FIG. 5 is a diagram showing a general tendency of a histogram of a blurred character;

【図6】ノイズのある文字のヒストグラムの一般的な傾
向を示す図、
FIG. 6 is a diagram showing a general tendency of a histogram of a noisy character;

【図7】本発明の第2の実施の形態に係る文字最適2値
化装置の構成を示すブロック図である。
FIG. 7 is a block diagram showing a configuration of a character optimum binarization device according to a second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 ヒストグラム取得手段 2 ヒストグラム平滑化手段 3 ヒストグラム谷位置検出手段 4 ヒストグラム評価値算出手段 5 2値化しきい値設定手段 6 黒画素割合算出手段 7 2値化しきい値補正手段 DESCRIPTION OF SYMBOLS 1 Histogram acquisition means 2 Histogram smoothing means 3 Histogram valley position detection means 4 Histogram evaluation value calculation means 5 Binary threshold value setting means 6 Black pixel ratio calculation means 7 Binary threshold correction means

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 一文字毎のヒストグラムを取得するヒス
トグラム取得手段と、ヒストグラムの移動平均をとりヒ
ストグラムを平滑化するヒストグラム平滑化手段と、ヒ
ストグラムの谷位置を検出するヒストグラム谷位置検出
手段と、ヒストグラムの形状を表す評価値を算出するヒ
ストグラム評価値算出手段と、ヒストグラム評価値から
2値化しきい値を決定する2値化しきい値決定手段を備
えることを特徴とする文字最適2値化装置。
A histogram acquisition unit for acquiring a histogram for each character; a histogram smoothing unit for taking a moving average of the histogram to smooth the histogram; a histogram valley position detection unit for detecting a valley position of the histogram; A character optimum binarizing apparatus comprising: a histogram evaluation value calculating unit that calculates an evaluation value representing a shape; and a binarization threshold value determining unit that determines a binarization threshold value from the histogram evaluation value.
【請求項2】 一文字毎のヒストグラムを取得するヒス
トグラム取得手段と、ヒストグラムの移動平均をとりヒ
ストグラムを平滑化するヒストグラム平滑化手段と、ヒ
ストグラムの谷位置を検出するヒストグラム谷位置検出
手段と、ヒストグラムの形状を表す評価値を算出するヒ
ストグラム評価値算出手段と、ヒストグラム評価値から
2値化しきい値を設定する2値化しきい値設定手段と、
2値化後の全面積に対する黒画素割合を算出する黒画素
割合算出手段と、黒画素割合から2値化しきい値を補正
する2値化しきい値補正手段を備えることを特徴とする
文字最適2値化装置。
2. A histogram acquisition unit for acquiring a histogram for each character, a histogram smoothing unit for taking a moving average of the histogram and smoothing the histogram, a histogram valley position detection unit for detecting a valley position of the histogram, and a histogram valley position detection unit. A histogram evaluation value calculating means for calculating an evaluation value representing a shape, a binarization threshold value setting means for setting a binarization threshold value from the histogram evaluation value,
A character optimum 2 comprising: a black pixel ratio calculating unit that calculates a black pixel ratio with respect to the entire area after binarization; and a binarization threshold value correcting unit that corrects a binarization threshold value from the black pixel ratio. Pricer.
JP10132579A 1998-04-28 1998-04-28 Character optimally binarizing device Pending JPH11312218A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10132579A JPH11312218A (en) 1998-04-28 1998-04-28 Character optimally binarizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10132579A JPH11312218A (en) 1998-04-28 1998-04-28 Character optimally binarizing device

Publications (1)

Publication Number Publication Date
JPH11312218A true JPH11312218A (en) 1999-11-09

Family

ID=15084636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10132579A Pending JPH11312218A (en) 1998-04-28 1998-04-28 Character optimally binarizing device

Country Status (1)

Country Link
JP (1) JPH11312218A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013211750A (en) * 2012-03-30 2013-10-10 Brother Ind Ltd Image processing device and image processing program
US9230186B2 (en) 2012-03-30 2016-01-05 Brother Kogyo Kabushiki Kaisha Image processing device generating binary image data by selecting specific component

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013211750A (en) * 2012-03-30 2013-10-10 Brother Ind Ltd Image processing device and image processing program
US9230186B2 (en) 2012-03-30 2016-01-05 Brother Kogyo Kabushiki Kaisha Image processing device generating binary image data by selecting specific component

Similar Documents

Publication Publication Date Title
US5784500A (en) Image binarization apparatus and method of it
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
JP4416365B2 (en) Automatic detection of scanned documents
JP3904840B2 (en) Ruled line extraction device for extracting ruled lines from multi-valued images
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US4941192A (en) Method and apparatus for recognizing pattern of gray level image
US20070253040A1 (en) Color scanning to enhance bitonal image
CN109584240B (en) Landslide trailing edge crack displacement image identification method
KR20030010530A (en) Image processing method, apparatus and system
JPH0737103A (en) Inclination angle detection device
US8442348B2 (en) Image noise reduction for digital images using Gaussian blurring
CN100410964C (en) Acquisition and splicing method of three-face rolling fingerprint
CN113239733B (en) Multi-lane line detection method
Saddami et al. Improvement of binarization performance using local otsu thresholding.
JPH08305795A (en) Character recognizing method
JPH10307889A (en) Character recognition method, its device and recording medium recording character recognition program
CN112818983A (en) Method for judging character inversion by using picture acquaintance
JPH11312218A (en) Character optimally binarizing device
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP2000048120A (en) Method for extracting character area of gray level image and recording medium having recorded the program thereon
CN114267035A (en) Document image processing method and system, electronic device and readable medium
JP5424694B2 (en) Image recognition apparatus and program
JPH0256688A (en) Character segmenting device
JP3230368B2 (en) Binarization processing method
JP3462727B2 (en) Character string binarization device