JP3037781B2 - データ二値化方法 - Google Patents

データ二値化方法

Info

Publication number
JP3037781B2
JP3037781B2 JP3137849A JP13784991A JP3037781B2 JP 3037781 B2 JP3037781 B2 JP 3037781B2 JP 3137849 A JP3137849 A JP 3137849A JP 13784991 A JP13784991 A JP 13784991A JP 3037781 B2 JP3037781 B2 JP 3037781B2
Authority
JP
Japan
Prior art keywords
data
image
binarization
binarized
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3137849A
Other languages
English (en)
Other versions
JPH04362791A (ja
Inventor
寛則 須崎
昭彦 金近
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Furuno Electric Co Ltd
Original Assignee
Furuno Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Furuno Electric Co Ltd filed Critical Furuno Electric Co Ltd
Priority to JP3137849A priority Critical patent/JP3037781B2/ja
Publication of JPH04362791A publication Critical patent/JPH04362791A/ja
Application granted granted Critical
Publication of JP3037781B2 publication Critical patent/JP3037781B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、多値データからなる
一次元または多次元のデータを二値化するデータ二値化
方法に関する。
【0002】
【従来の技術】たとえば文字・図形の認識処理を行う場
合のように、本質的に白または黒の二つの濃度レベルで
表現される画像データを扱う場合であっても、実際に観
測されるデータはアナログ量であるため、これを二値化
する必要がある。画像データ等の二値化方法としては、
一般にしきい値処理が用いられる。しきい値の設定方法
としては、濃度ヒストグラムに基づく方法が一般的であ
り、判別分析法(大津)等により設定される。
【0003】一般にデータを二値化する際に本来のデー
タに加わっているバイアス成分およびその変動が問題と
なる。たとえば二次元画像データの場合、取り込むべき
画像に対し均等な照明がなされず、撮像画面内で照明光
の偏りやムラが生じている場合、画像全体を二値化した
際に通常は陰部分が黒くつぶれてしまう。このような不
都合をなくすために、原画像を分割して、それぞれの区
画毎にしきい値を決定して二値化するという方法も採ら
れている。
【0004】
【発明が解決しようとする課題】ところが、このような
従来の画像の二値化方法では、たとえば白地に黒の文字
が書かれた画像である場合に、二値化すべき区画内に文
字またはその一部が全く存在しないことも生じる。この
ような場合、通常の二値化方法では、その区画に存在す
る最高濃度と最低濃度の範囲内で或るしきい値が設定さ
れ、無理に二値化されるため、ノイズが数多く発生する
ことになる。
【0005】図4はその例を示すものである。図4にお
いて(A)は二値化の対象となる原画像であり、図にお
いて左前方の上部から斜めに照明光が照射されて、撮像
画面内の左上ほど明るく、右下ほど暗くなるような照度
の偏りがある。この図4(A)に示す原画像を例えば4
×4に16分割して、各区画毎にそれぞれ二値化を行っ
た場合、D00、D01、D30、D31、D32およ
びD33で示すように対象となる文字の一部が全く存在
しない区画では、わずかな濃淡の差が二値化されて、同
図(B)においてN1、N2およびN3等で示すように
比較的大きなノイズが生じることになる。その他の比較
的細かな点状のノイズは、平滑化フィルタリング等によ
って取り除くことも可能であるが、このような大きなノ
イズはその後の文字認識に悪影響を及ぼす。
【0006】この発明の目的は、二値化すべきデータを
複数の区画に分けるとともに、各区画毎に二値化する場
合であっても、ノイズの発生を有効に防止することので
きるデータ二値化方法を提供することにある。
【0007】
【課題を解決するための手段】この発明の請求項1に係
るデータ二値化方法は、多値データである原データの
内、ほぼ均等に分布する点の値をバックグラウンドとは
逆の最大値または最小値に置換して二値化用データを作
成し、この二値化用データを複数の区画に分けるととも
に、各区画毎に二値化して二値化データを作成し、この
二値化データを平滑化することを特徴とする。
【0008】また、請求項2に係るデータ二値化方法
は、入力すべき対象に、その対象のバックグラウンドと
は逆の最大値または最小値を有する点を予めほぼ均等に
分布させておき、前記対象を二値化用データとして読み
込み、この二値化用データを複数の区画毎に分けるとと
もに、各区画毎に二値化して二値化データを作成し、こ
の二値化データを平滑化することを特徴とする。
【0009】
【作用】この発明の請求項1記載のデータ二値化方法で
は、まず多値データである原データの内、ほぼ均等に分
布する点の値が、バックグラウンドとは逆の最大値また
は最小値に置換されて二値化用データが作成される。た
とえば図4(A)に示した例では、バックグラウンドは
白レベル、対象となる文字は黒レベルであるから、黒レ
ベル(最も黒いレベル)の点がデータ中にほぼ均等に分
配される。続いて、二値化用データが複数の区画に分け
られ、各区画毎に二値化される。各区画にはバックグラ
ウンドとは逆の最大値または最小値の置換点が存在する
ため、対象物がない区画では、置換点が対象物として二
値化される。したがって図4に示したような画像データ
の二値化の場合には、区画D00、D01、D30、D
31、D32およびD33では白地に黒点(置換点)の
存在する二値化画像となる。
【0010】そして、最後に二値化データが平滑化され
る。たとえば二次元画像データの場合にはモード法、メ
ディアン法または最小・最大法等によって全データを平
滑化することによって、前記置換点はバックグラウンド
に吸収され消滅する。これにより元々対象物の無かった
区画はノイズのないバックグラウンドとなる。また、対
象物の存在する区画においては、その対象物が本来二値
データであって、バックグラウンドからレベルの離れた
データである場合には、置換点の存在により、二値化の
際におけるしきい値がバックグラウンドからより離れた
値に設定される。
【0011】そのため対象物の存在する区画においても
ノイズの発生が少なくなる。
【0012】また、請求項2記載のデータ二値化方法で
は、読み込むべき入力データに既にバックグラウンドと
は逆の最大値または最小値を有する点がほぼ均等に分布
されている。従って、読み込んだデータが複数の区画毎
に分けられ、各区画毎に二値化されて、その二値化デー
タが平滑化される。これにより、請求項1記載のデータ
二値化方法と同様の作用でノイズ発生を有効に防止する
ことができる。
【0013】
【実施例】この発明の一実施例であり、この発明が適用
される文字・図形認識装置のブロック図を図2に示す。
図2においてROM2にはCPU1の実行すべきプログ
ラムを予め書き込んでいる。CPU1はROM2に書き
込まれているプログラムを実行してこの装置全体を文字
・図形認識装置として機能させる。RAM3は個別に二
値化すべき各区画のしきい値の演算や平滑フィルタ演算
および文字・図形認識処理等の各種演算実行時のワーキ
ングエリアとして用いる。カメラ5は認識すべき文字・
図形の描かれた物体を撮像する。画像処理部図6はカメ
ラ5により撮像した映像信号をディジタルデータに変換
するとともに画像メモリ7へ書き込む。画像メモリ7は
一画像当たり8ビットで256階調の静止画像を記憶す
る。二値画像メモリ8は画像メモリ7に取り込んだ同一
範囲の画像についての二値化画像データを記憶する。C
PU1は画像メモリ7に取り込まれた画像データに対
し、後述する処理を行って二値画像メモリ8に二値化画
像データを構成した後、文字・図形認識を行う。インタ
フェース4は周辺装置との間で制御を行うものであり、
CPUはインターフェイス4を介して文字・図形の認識
結果を周辺装置へ出力する。
【0014】次に、請求項1記載のデータ二値化方法に
対応するCPUの処理手順をフローチャートとして図3
に示す。まず画像処理部6に対し画像の取り込みの指示
を行う(n1)。これにより画像メモリ7に原画像デー
タが取り込まれる。次に画像メモリ7の特定の画素を黒
点のデータとして置き換える(n2)。たとえば画像メ
モリ7に取り込まれた画像が図1(A)に示すように例
えば画像を4×4に16分割した際、各区画に必ず幾つ
かの黒点が分布するようにする。続いて各区画毎に二値
化のためのしきい値を算出する(n3)。例えば判別分
析法によりしきい値を求める。これは対象とする区画に
ついて濃度ヒストグラムを求め、或るしきい値で二つの
グループに分けた時、グループ間の分散が最大となる値
をしきい値とするものである。その後、各区画ごとに二
値化を行う(n4)。これにより図1(B)に示すよう
にバックグラウンドである白地から完全に分離された黒
点および文字「A」からなる二値化画像が得られる。図
1(A)において区画D00、D01、D30、D3
1、D32およびD33には対象物である文字の部分が
存在しないので、前述の判別分析法によって濃度ヒスト
グラムを求めた場合、ヒストグラムは双峰性を示さない
が、各区画に存在する黒点を仮の対象物として黒点を黒
レベル、その他の濃度を白レベルとするしきい値が決定
される。また文字の一部が存在する区画では、ヒストグ
ラムに双峰性が現れて、バックグラウンドと文字が確実
に分離される。その後、二値化された画像データをたと
えばメディアンフィルタ演算などの平滑フィルタ演算に
よって空間周波数の高いノイズ成分を除去する(n
5)。これにより、前処理で分配した黒点がバックグラ
ウンドの白レベルに再び置き換えられ、図1(C)に示
すように白地に黒色の文字「A」の二値化画像データが
得られる。このようにして求めた二値化画像データから
文字・図形の認識処理を行ってその結果を周辺装置へ出
力する(n6)。
【0015】さて、請求項2記載のデータ二値化方法を
実現するためには、読み込むべき画像の地色を均一濃度
とはせず、図1(B)に示したと同様に、紙面などに予
め黒点を印刷しておき、その上に文字や図形を書き込む
か、あるいは文字や図形を印刷で形成するのであれば、
黒点を同時に印刷しておく。この場合には、図3に示し
たステップn2の処理を省略して、n3以降の処理を同
様にして行う。
【0016】なお、上述した二つの実施例では、白地に
黒色の文字や図形の存在する画像データの二値化につい
てであったが、たとえば黒地に白色の文字や図形の存在
する画像データを二値化する場合には、画像中に白点を
分配して、同様にして二値化処理を行えばよい。これに
より黒地に白色のノイズのない二値化画像データが得ら
れる。また、カラー画像を二値化する場合にも同様にし
て適用することができる。
【0017】さらに、実施例では二次元の画像データを
例として挙げたが、一次元または三次元以上のデータに
ついても同様に本願発明を適用することができる。
【0018】
【発明の効果】この発明によれば、二値化すべきデータ
に一定でないバイアスが加わっていて、データを複数の
区画に分けて二値化する場合、対象物のない区画に対し
ても最適なしきい値が設定される。これによりバックグ
ラウンドを無理に二値化した場合のような広く分布する
ノイズの発生もない。また、対象物の存在する領域につ
いても、バックグラウンドを確実に分離するしきい値が
設定されるため、ノイズの少ない二値化データが得られ
る。
【図面の簡単な説明】
【図1】実施例に係る文字・図形認識装置の処理例を示
す図であり、(A)は原画像に黒点を分配した画像、
(B)はそれを二値化した画像、(C)は平滑フィルタ
演算後の画像をそれぞれ示す。
【図2】実施例に係る文字・図形認識装置のブロック図
である。
【図3】同装置の処理手順を表すフローチャートであ
る。
【図4】従来の二値化方法を示す図であり、(A)は原
画像、(B)は二値化画像である。
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06T 1/00 G06K 9/38 G06T 5/00 H04N 1/403

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】多値データである原データの内、ほぼ均等
    に分布する点の値をバックグラウンドとは逆の最大値ま
    たは最小値に置換して二値化用データを作成し、この二
    値化用データを複数の区画に分けるとともに、各区画毎
    に二値化して二値化データを作成し、この二値化データ
    を平滑化するデータ二値化方法。
  2. 【請求項2】入力すべき対象に、その対象のバックグラ
    ウンドとは逆の最大値または最小値を有する点を予めほ
    ぼ均等に分布させておき、前記対象を二値化用データと
    して読み込み、この二値化用データを複数の区画毎に分
    けるとともに、各区画毎に二値化して二値化データを作
    成し、この二値化データを平滑化するデータ二値化方
    法。
JP3137849A 1991-06-10 1991-06-10 データ二値化方法 Expired - Fee Related JP3037781B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3137849A JP3037781B2 (ja) 1991-06-10 1991-06-10 データ二値化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3137849A JP3037781B2 (ja) 1991-06-10 1991-06-10 データ二値化方法

Publications (2)

Publication Number Publication Date
JPH04362791A JPH04362791A (ja) 1992-12-15
JP3037781B2 true JP3037781B2 (ja) 2000-05-08

Family

ID=15208243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3137849A Expired - Fee Related JP3037781B2 (ja) 1991-06-10 1991-06-10 データ二値化方法

Country Status (1)

Country Link
JP (1) JP3037781B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69822608T2 (de) 1998-05-28 2005-01-05 International Business Machines Corp. Binarisierungsverfahren in einem Zeichenerkennungssystem

Also Published As

Publication number Publication date
JPH04362791A (ja) 1992-12-15

Similar Documents

Publication Publication Date Title
US7177483B2 (en) System and method for enhancement of document images
US5568571A (en) Image enhancement system
JP3768052B2 (ja) カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体
US6628833B1 (en) Image processing apparatus, image processing method, and recording medium with image processing program to process image according to input image
JP4633907B2 (ja) 文書を表わす画像データ内の走査時アーチファクトをマスキングするための方法及び装置並びに画像データ処理システム
US7110607B2 (en) Image processing apparatus
JP3088010B2 (ja) 線画分離方法および装置
US6044179A (en) Document image thresholding using foreground and background clustering
US8229214B2 (en) Image processing apparatus and image processing method
JP2003008909A (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
JPH09130614A (ja) 画像処理装置
JP3772262B2 (ja) 画像の型を識別する方法
JP3037781B2 (ja) データ二値化方法
US7280253B2 (en) System for identifying low-frequency halftone screens in image data
EP0600613A2 (en) Improvements in image processing
US20070047812A1 (en) Apparatus, system, and method for scanning segmentation
JP2003219180A (ja) 画像処理方法、画像処理装置、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
US6411735B1 (en) Method and apparatus for distinguishing between noisy continuous tone document types and other document types to maintain reliable image segmentation
US7418138B2 (en) Image processor for and method of performing tonal transformation on image data
JP3763954B2 (ja) 文字認識用の学習データ作成方法および記録媒体
EP0870276A1 (en) A method for transforming a gray-level image into a black-and-white image
Solihin et al. Noise and background removal from handwriting images
JP2879800B2 (ja) 電子走査ピクチャの背景除去方法
JP3989647B2 (ja) 画像処理方法,装置および記録媒体
JP4324532B2 (ja) 画像処理装置および記憶媒体

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees