JP2005354287A - 画像の二値化或いは多値化方法及び装置並びにプログラム - Google Patents

画像の二値化或いは多値化方法及び装置並びにプログラム Download PDF

Info

Publication number
JP2005354287A
JP2005354287A JP2004171454A JP2004171454A JP2005354287A JP 2005354287 A JP2005354287 A JP 2005354287A JP 2004171454 A JP2004171454 A JP 2004171454A JP 2004171454 A JP2004171454 A JP 2004171454A JP 2005354287 A JP2005354287 A JP 2005354287A
Authority
JP
Japan
Prior art keywords
value
class
image
filtered image
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004171454A
Other languages
English (en)
Inventor
Taiichi Saito
泰一 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2004171454A priority Critical patent/JP2005354287A/ja
Publication of JP2005354287A publication Critical patent/JP2005354287A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】 各クラスに属する画素数に大きな違いがあっても、濃淡画像から、良い二値画像あるいは多値画像が得られるようにする。
【解決手段】 画素の隣接性・二次元性が考慮されるようにするため、入力された濃淡画像の各画素、及び、隣接した画素と、フィルタ関数との算術演算によるフィルタ処理を施し、フィルタ処理画像を作成する。処理結果の画素値はディジタル化せず、アナログ値をそのまま使用して、各階級の区間内の度数を表す濃度ヒストグラム、区間内の代表値を割り当てた階級値、及び、区間内分散を求め、二値化・多値化を行うための統計量を計算する。この統計量を使い、最適しきい値選定用評価関数を最適にするしきい値を選定し、得られたしきい値によって、画素値がアナログであるフィルタ処理画像をしきい値処理する。
【選択図】 図1

Description

本発明は、画像の圧縮処理、分類処理として、あるいは、文字・画像認識における前処理として、濃淡画像を二値化、あるいは、多値化する方法、及び、装置、並びに、プログラムに関するものである。
文字・画像認識を単純化するための前処理として、あるいは、画像の分類処理(クラスタリング)や圧縮処理として、入力された濃淡画像を二値化することは、非常に多くの場面で要求される。それゆえ、これまでに多くの二値化手法が開発されている。その中で、処理が単純であり、多種の画像に対して適用可能であることから、判別規準に基づいた手法(非特許文献1参照)がよく使われる。この手法の処理方法を図2で説明する。
画像入力処理201により、画像6を入力して濃淡画像202を取り込む。この濃淡画像の画素値(濃度レベル)をg(x,y)とすると、これは正の整数値であるディジタル値で与えられ、1画素が8ビットであるとすると、0から255の値を取る。濃淡画像202の大きさNは、x軸方向の大きさをNx、y軸方向の大きさをNyとするとN=Nx×Nyとなる。濃度ヒストグラム作成処理205により、各階級の濃度ヒストグラムh(l)、相対濃度ヒストグラムp(l)208を作成する。ここで、Lを画素値の数(濃度レベル数)とすると、l(エル)は1(いち)からLの値を取る階級番号であり、h(l)は(l−1)なる画素値を持つ画素の度数(あるいは、頻度)である。相対濃度ヒストグラムは全画素数Nに対する度数の割合であり、p(l)=h(l)/Nである。これと同時に、階級値割当処理206により、階級値r(l)209を決める。階級値とは、画素値の度数がh(l)、あるいは、p(l)なる階級を代表する値が割り当てられるが、図2の判別規準に基づいた手法では、各階級の画素値は全て同じディジタル値であるため、画素値そのままの値をr(l)=(l−1)で与える。これを使い、統計量計算処理211により、仮のしきい値番号kでしきい値処理し、画素値を複数のクラスに分ける場合の統計量212を計算する。計算される統計量は、各クラスの生起確率、各クラスの平均、各クラスの分散、及び、級内分散であり、二値化を想定すると、次のようにして計算される。二値化の場合、1から(L−1)の値の中から1個の最適なkを検出する。
画素値(濃度レベル)g(x,y)が1クラス目、2クラス目に属する生起確率をω1=ω1(k)、ω2=ω2(k)とすると(ωはオメガ)、
ω1=Σp(l) (Σはl=1〜kにおける和)。
ω2=Σp(l) (Σはl=(k+1)〜Lにおける和)。
1クラス目、2クラス目の画素値の平均をμ1=μ1(k)、μ2=μ2(k)とすると(μはミュー)、
μ1=(1/ω1)Σr(l)p(l) (Σはl=1〜kにおける和)。
μ2=(1/ω2)Σr(l)p(l) (Σはl=(k+1)〜Lにおける和)。
1クラス目、2クラス目の画素値の分散をσ1 2=σ1(k)2、σ2 2=σ2(k)2とすると(σはシグマ)、
σ1 2=(1/ω1)Σ{r(l)−μ1}2p(l) (Σはl=1〜kにおける和)。
σ2 2=(1/ω2)Σ{r(l)−μ2}2p(l) (Σはl=(k+1)〜Lにおける和)。
級内分散をσ 2=σ(k)2とすると、σ 2=ω1σ1 2+ω2σ2 2で計算される。
次に、これらの統計量212を使い、最適しきい値選定用評価関数計算処理213により、評価関数値J(k)214を計算する。判別規準に基づいた手法において、この評価関数値J(k)は、J(k)=1/σ 2で与えられる。これは、仮のしきい値番号kの関数値であり、値が大きいほど良好なしきい値となる評価関数である。従って、最適しきい値番号検出処理215では、J(k)が最大値を取るkを最適しきい値番号216として検出する。
最後に、しきい値処理217により、最適しきい値番号k216を使って、濃淡画像g(x,y)202を二値化し、しきい値処理画像218を作成する。判別規準に基づいた手法の場合、最適しきい値は、厳密にはクラス1とクラス2それぞれの平均値の中間点にあたるa={μ1(k)+μ2(k)}/2のアナログ値で与えられる。しかし、aの小数点以下を切り捨てた値は最適しきい値番号kに対する階級値r(k)に一致するため、アナログしきい値aの計算は不要である。以上が、従来技術の、判別規準に基づいた手法による二値化処理である。従来技術による、Mクラスに分ける多値化も、(M−1)個のしきい値を同様な方法で検出することにより、実行可能である。
文字認識研究用の文字画像データとして、数字(10)、英大文字(26)、特殊記号(12)、片仮名(51)、計99の文字種を含み、各文字種につきサンプル数が約1,400の「手書き文字データベースETL1」(http://www.etl.go.jp/~etlcdb/)がある。このサンプルに対し、従来技術の手法で二値化を行うと、全141,319サンプルの内650サンプルがグランドノイズの付いた二値画像になってしまう。グランドノイズとは、画像の背景の大部分が黒いノイズで占められるものを言う。その一部(77サンプル)を図3に示す。グランドノイズが付く文字種は、特に特殊記号「.(ピリオド)」に多く、650の内の253サンプルに達している。「.」は、画像内の文字「ピリオド」自身を示す対象物の部分と背景部分の画素数が大きく異なる文字の典型である。
大津展之:"判別および最小2乗規準に基づく自動しきい値選定法", 「電子通信学会論文誌(D)」, Vol.63-D,No.4, pp.349--356 (1980-04).
上述のように、従来技術では、対象物と背景の画素数が大きく異なる場合に二値化性能が悪いという欠点がある。一般的な多値化においては、Mクラスに分けるときの各クラスに属する画素数に大きな違いがあると良好な多値化が行えないということである。最適しきい値選定用評価関数の計算で使用する濃度ヒストグラムは、各画素間の隣接性や二次元的な位置に無関係に作成されており、前述の欠点は、画素の隣接性・二次元性が考慮されていないことに起因すると考えられる。
本発明は、係る問題点を解決するために、フィルタ処理(フィルタリング)を行い、その処理結果であるフィルタ処理画像の画素値をアナログ値のまま使用し、各区間内の代表値で正確な階級値を求め、これらから計算される統計量を使用することにより、各クラスの画素値の頻度が大きく異なる場合でも、良好なしきい値処理結果を得ることを目的としている。
本発明では、画素の隣接性・二次元性が考慮されるよう、入力された濃淡画像の各画素に対し、フィルタ関数を使ってフィルタ処理を施す。フィルタ処理とは、画像とフィルタ関数との、主に、畳み込み演算(コンボリューション)として知られる算術演算によってなされる。畳み込み演算とは、ある画素、及び、それに隣接するまわりの画素と、フィルタ関数の要素値との積和演算を画像全体に対して実行するものである。隣接する画素は1個おき、あるいは、複数個離れていてもかまわない。フィルタ処理には、雑音(ノイズ)除去・平滑化を行うものや、画像を強調するものなどがあり、その目的に応じてフィルタ関数が異なる。
雑音除去・平滑化を行うためのフィルタ関数例を表1と表2に示す。表1、表2は、要素値の和が1になるように正規化しているが、各要素値を定数倍してもフィルタ関数の効果は全く同じである。表1は要素値が一様分布の例である。孤立点ノイズが存在する画像を表1のフィルタ関数を使ってフィルタ処理すると、孤立点ノイズが減少したフィルタ処理画像を作ることができる。表2は、中心位置の要素値が最大で、中心から離れるほど値が小さくなるような、ガウス分布の例である。ガウス分布は、形状を決めるパラメータである標準偏差の大きさによって要素値が決まり、標準偏差を無限大に近づけると一様分布に近づき、標準偏差が大きくなるほど雑音除去・平滑化の効果が大きくなる。ただ、一様分布に近いほど、雑音除去・平滑化の効果が大き過ぎてしまうこともある。
画像強調の中で、画像の濃淡変化が大きい部分である「エッジ」を強調するためのフィルタ関数が表3である。これは方向を限定しないでエッジを強調するものであり、フィルタ処理後の値は方向性の強さ(マグニチュード)になる。エッジを強調するフィルタ関数でも、水平方向のみを強調するものが表4であり、垂直方向のみを強調するものが表5である。表4のフィルタ関数によるフィルタ処理画像と、表5のフィルタ関数によるフィルタ処理画像を両方作成し、水平方向、及び、垂直方向の方向性の強さから、エッジの方向角度を求めることもできる。
このように、フィルタ関数の要素値を変えることで、様々な目的に対するフィルタ処理が行える。ここでは、3×3の大きさのフィルタ関数を例示したが、5×5、1×3など、どのような大きさでもよい。
本発明では、主に、雑音除去・平滑化用のフィルタ関数を使用するが、他のフィルタ関数を使用してもかまわない。
以上のようなフィルタ関数を使ってフィルタ処理を行い、その結果であるフィルタ処理画像の画素値から、濃度ヒストグラムを作成し、階級値を計算する。このとき、フィルタ処理画像の画素値はディジタル化せず、アナログ値をそのまま使用する。
濃度ヒストグラムは、画素値を適当な区間の階級に区切り、各階級の区間内に入る画素の個数を数えることで作成される。濃度ヒストグラムを作るための区間の幅は、通常は同一間隔1にするが、2、3、4、1.5、2.5、0.5、0.2、0.1など、任意の同一整数値間隔、同一実数値間隔でかまわない。各区間間隔は、可変でもかまわない。区間間隔が一定ならば、画素値を区間間隔で割ることにより、その画素値が何番目の区間に入るかを一度の処理で求めることができるが、区間間隔が可変の場合は、最少で1回、最悪で区間数と同じ回数の画素値との比較を行わなければならず、処理量が多くなる。
区間の幅を1にした場合、濃度ヒストグラムの1番目の区間には、画素値が0以下の画素数を入れ、2番目の区間には、0<画素値≦1である画素数を入れ、3番目の区間には、1<画素値≦2である画素数を入れていく。区間の幅を2にした場合、濃度ヒストグラムの1番目の区間には、画素値が0以下の画素数を入れ、2番目の区間には、0<画素値≦2である画素数を入れ、3番目の区間には、2<画素値≦4である画素数を入れていく。区間の幅を2にしたとき、区間の位置をずらし、濃度ヒストグラムの1番目の区間には、画素値≦1の画素数を入れ、2番目の区間には、1<画素値≦3である画素数を入れ、3番目の区間には、3<画素値≦5である画素数を入れていってもよい。
各区間に入るフィルタ処理画像の画素値は、ディジタルな画素値の場合と違って、全てが必ずしも同一ではないため、階級値は各区間内における代表値を割り当てる。代表値とは、複数の数値に関連する代表的な1つの数値であり、「平均値」、「中央値(メディアン)」、「中心値」などがある。
また、必要に応じて、各区間内の分散を計算しておく。
本発明は、フィルタ処理によって作成された、各画素がアナログ値であるフィルタ処理画像に関する、濃度ヒストグラム、並びに、各区間内における代表値が割り当てられた階級値、及び、必要に応じて各区間内の分散を使って統計量を計算し、最適しきい値選定用評価関数が最適となるしきい値番号を検出し、検出されたしきい値番号から求められるしきい値で、画素値がアナログであるフィルタ処理画像をしきい値処理することを特徴とする。
従来技術で使われる階級値r(l)は、{r(l+1)−r(l)}が全て同一間隔(通常1)であるが、本発明では、区間内の代表値を階級値にしているため、濃度ヒストグラムを作るときの区間間隔を同一にしても、{r(l+1)−r(l)}が必ずしも一定にならない。階級値を各区間内における代表値にすることは、正確な統計量を計算するために必要なことであり、階級値間隔が一定でないことには全く問題がない。
本発明では、フィルタ処理を行い、その処理結果であるフィルタ処理画像の画素値をアナログ値のまま使用し、各区間内の代表値で正確な階級値を求め、これらから計算される統計量を使用することにより、各クラスの画素値の頻度が大きく異なる場合でも、良好なしきい値処理結果が得られる。しかも、最適しきい値番号検出処理は、従来技術と同等の処理オーダーで計算できることが利点である。二値化の場合、入力された濃淡画像の画素値の数(濃度レベル数)に比例した処理量で計算できる。
二値化や多値化を行うときに使用する最適しきい値選定用評価関数は、従来技術でも本発明でも、濃度ヒストグラムで表現される、各クラスの画素値の頻度分布が正規分布であるとの仮定のもとに理論式が導かれている。しかし、実画像の頻度分布のほとんどは正規分布にはなっておらず、歪んだ形をしており、正規分布からの歪みが大きいほど、評価関数の信頼性が低くなると考えられる。本発明で良好なしきい値処理結果が得られるのは、フィルタ処理を行うことが、画素間の隣接情報を取り込むだけでなく、頻度分布の形を正規分布に近づける働きをしているからであると考えられる。
本発明を図1で説明する。
画像入力処理101により画像6を入力して、ディジタル値である濃淡画像g(x,y)102を取り込む。フィルタ処理103により、g(x,y)とフィルタ関数W(u,v)から、フィルタ処理画像f(x,y)104を作成する。W(u,v)の要素は表6の位置とし、要素の値は雑音除去・平滑化の効果があるガウス分布や一様分布などになるようにする。W(u,v)の具体例を表7、表8、表9に示す。表7は標準偏差が0.5のガウス分布であり、表8は標準偏差が0.6のガウス分布である。表9は一様分布であり、これはガウス分布の標準偏差を無限大にしたことと同じである。W(u,v)の大きさNu×Nvは、一般的に、u=−a〜b、v=−a〜b(a、bは負でない整数)とするとNu×Nv=(a+b+1)×(a+b+1)で与えられる。実際上は、例のように3×3あれば十分と考えられ、このとき、a=1、b=1である。ここでは、二次元画像の画素に対してフィルタ処理を行っているが、一次元でも、多次元でもよい。また、扱う数値は画素値でなくてもよい。例えば、対象物と背景との境で抽出することができる「エッジ」の「強さ(マグニチュード)」、あるいは、「エッジ」の「角度」でもよい。
このフィルタ関数を使い、f(x,y)は次のようにして計算される。
f(x,y)=ΣΣ{g(x+u,y+v)・W(u,v)}/ΣΣ{W(u,v)}
(ここで、ΣΣは、u=−a〜b、及び、v=−a〜bにおける和を示す。)
この式の分母が濃淡画像g(x,y)とフィルタ関数W(u,v)との畳み込み演算(コンボリューション)である。f(x,y)の値を、入力した濃淡画像g(x,y)と同程度にするため、ここではΣΣ{W(u,v)}で除算を行っているが、ΣΣ{W(u,v)}が1になるようにW(u,v)を正規化した要素値にしておくと、この除算は不要となる。前述の表1は表9を正規化したものであり、表2は表7を正規化したものである。ただし、正規化を行うと、要素値が全て小数点以下の値になり、計算誤差が大きくなることがあるため、表7、表8、表9を使用している。表3、表4、表5のように、ΣΣ{W(u,v)}がゼロになるフィルタ関数では、ΣΣ{W(u,v)}での除算は行わない。
雑音除去・平滑化を行うことは、画像にボカシをかけることに等しい。雑音除去・平滑化を行うフィルタ関数、特に、一様分布のフィルタ関数を使った場合、ボカシ効果が大き過ぎ、フィルタ処理画像f(x,y)そのままでは、文字画像がぼかされ、近接している2平行線が一本の線になるなど、画像の特徴を減少させてしまうことがある。これを防ぐために、パラメータとしてλ(ラムダ)を導入し、f(x,y)と元の濃淡画像の画素値g(x,y)の間のλ分割点{λf(x,y)+(1−λ)g(x,y)}を求め、これをフィルタ処理画像104の座標(x,y)での画素値f(x,y)とする(ただし、0≦λ≦1)。λ=0にすると、フィルタ処理しない画像g(x,y)と同じになり、λの値によって従来手法からの連続的な拡張になっている。フィルタ関数にガウス分布を使用する場合は、λ=1にして、g(x,y)の値は使わなくてもよい。ガウス分布の場合、分布の形を決めるためのパラメータである標準偏差が、パラメータλと定性的に同様の働きをする。
計算結果のフィルタ処理画像f(x,y)はアナログ値で与えられ、これは、ディジタル化せずアナログ値をそのまま使用する。アナログ値である、このフィルタ処理画像f(x,y)104に対して、濃度ヒストグラム作成処理105により、濃度ヒストグラムh(l)、相対濃度ヒストグラムp(l)108を求め、同時に、階級値計算処理106により、階級値r(l)109を計算する。l(エル)が1〜Lの値をとるとし、l(エル)番目の階級を表す区間をR(l)={Il−1<f(x,y)
≦I}とすると、f(x,y)から濃度ヒストグラムh(l)を作成するには、各区間R(l)にf(x,y)が入る個数を数えればよい。通常は、I=(l−1)とする(ただし、I0=0)。これは、区間の数を、入力した濃淡画像102の画素値の数(濃度レベル数)と同じにした場合であり、I=2(l−1)とすれば区間の数を半分に、I=(l−1)/2とすれば区間の数を倍にすることもできる。階級値r(l)109は、各区間内に入る画素値の「平均」を割り当てる。これは、各区間内に入る画素値の和をS(l)とするとS(l)/h(l)で与えられる。階級値としては、「平均」以外にも、「中央値(メディアン)」や「中心値」などがある。「中央値(メディアン)」は、画素値を大きさの順に並べたときのちょうど中央にある画素値である。「中心値」は、最小の画素値と最大の画素値の平均値である。
また、必要に応じて、区間内分散計算処理107により、区間内分散q(l)2110を計算しておく。これは、画素値f(x,y)がl(エル)番目の区間内に入るものの二乗和をV(l)とすると、q(l)2=V(l)/h(l)−r(l)2で計算される。
次に、フィルタ処理画像f(x,y)104から求められた、濃度ヒストグラムh(l)、相対濃度ヒストグラムp(l)108と階級値r(l)109、及び、区間内分散q(l)2110から、統計量計算処理111により、統計量112を計算する。ここでは、一般的な多値化としてM値化を行うことを想定して話を進めるが、二値化の場合は、Mに2を与えればよい。
仮のしきい値番号の組k={k1、…、k、…、kM−1}でしきい値処理し、L個の階級をM個のクラスに分ける場合の統計量を計算する。しきい値番号の組kはM値化を行う場合、(M−1)個のしきい値番号から成る。計算される統計量は、各クラスの生起確率、各クラスの平均、各クラスの分散、及び、級内分散である。級内分散の他に、級間分散、全分散があるが、どのしきい値の組でクラス分けしても全分散は一定であり、{全分散=級内分散+級間分散}という関係が成り立つことから、級内分散の代わりに級間分散を使うこともできる。
画素値(濃度レベル)g(x,y)がmクラス目に属する生起確率をω=ω(k)とすると、
ω=Σp(l) (Σはl=(km−1+1)〜kにおける和)。
mクラス目の画素値の平均をμ=μ(k)とすると、
μ=(1/ω)Σr(l)p(l) (Σはl=(km−1+1)〜kにおける和)。
mクラス目の画素値の分散をσ 2=σ(k)2とすると、
σ 2=(1/ω)Σ{r(l)−μ}2p(l)+(1/ω)Σq(l)2
(Σはl=(km−1+1)〜kにおける和)。
級内分散をσ 2=σ(k)2とすると、
σ 2=Σωσ 2 (Σはm=1〜Mにおける和)。
区間内分散を考慮しないようにする場合は、全てのl(エル)でq(l)2=0とすればよい。
次に、これらの統計量を使い、最適しきい値選定用評価関数計算処理113により、評価関数値114を計算する。最適しきい値選定用評価関数は、ゆう度規準(尤度規準)に基づいた手法を使用するが、これ以外でも、濃度ヒストグラムを使い、仮のしきい値の組でクラス分けを行う評価関数であれば、どのようなものでもよい。
ゆう度規準に基づいた手法では、濃度ヒストグラムがM個の正規分布の重畳であることを想定しており、そのM個の各正規分布を表すパラメータである生起確率と分散に対して、次の4種類の仮定をしている。第1番目として、各正規分布の生起確率が異なり、各正規分布の分散が等しいとする場合、これをJとする。第2番目として、各正規分布の生起確率、分散とも等しいとする場合、これをJとする。第3番目として、各正規分布の生起確率、分散とも異なるとする場合、これをJとする。第4番目として、各正規分布の生起確率は等しく、分散は異なるとする場合、これをJとする。M個の正規分布に対する、以上の仮定の違いから、最適しきい値選定用評価関数計算処理113で使用する評価関数計算式は、次の4種類J=J(k)になる。ただし、X={D,O,K,Q}、lnは自然対数。
J=Σ{ωln(1/σ 2)} (Σは、m=1〜Mにおける和)。
J=(1/σ 2)。
J=Σ{ωln(ω 2/σ 2)} (Σは、m=1〜Mにおける和)。
J=Σ{ωln(ω 2/σ 2)} (Σは、m=1〜Mにおける和)。
これらは、仮のしきい値番号の組kの関数値であり、値が大きいほど良好なしきい値となる評価関数である。従って、最適しきい値番号検出処理115では、J(k)を最大にするkが最適しきい値番号の組116として検出される。
m番目のクラスの分散であるσ 2は、区間内分散を考慮しないと、値が0になることがある。このとき、ゆう度規準を使った評価関数の中のJとJは、分母にσ 2があるため不定となり、評価関数としての信頼性がなくなる。区間内分散を考慮することは、統計量を補正するだけでなく、全てのσ 2がゼロにならないことから、JやJの評価関数の信頼性を高めるためにも有効である。
最後に、しきい値処理117により、最適しきい値番号の組k116を使って、アナログ値であるフィルタ処理画像f(x,y)104をしきい値処理する。このとき、最適しきい値番号の組116から、最適しきい値の組t={t1、…、t、…、tM−1}が、次式で計算される。
Jの場合、t=[μσm+1 2−μm+1σ 2±(√σ 2σm+1 2{(μm+1−μ)2+(σm+1 2―σ 2)ln(σm+1 2/σ 2)})]/(σm+1 2−σ 2)。
ただし、(μm+1)/2に近い方。
Jの場合、t=(μm+1)/2。
Jの場合、t=[μσm+1 2−μm+1σ 2±(√σ 2σm+1 2{(μm+1−μ)2+(σm+1 2―σ 2)ln((ω 2σm+1 2)/(ωm+1 2σ 2))})]/(σm+1 2−σ 2)。
ただし、(μm+1)/2に近い方。
Jの場合、t=(μm+1)/2+{σ 2/(μm+1−μ)}ln(ω/ωm+1)。
厳密には、このようにして計算されたtを使ってしきい値処理をしなければならないが、tの計算は実行せず、km−1+1番目からk番目の区間をmクラス目であるとする簡易法がある。この簡易法でも性能の大きな低下はない。
「手書き文字データベースETL1」のサンプルの一部(77サンプル)を本発明で二値化したものが図4である。これは、フィルタ関数W(u,v)を標準偏差0.5のガウス分布とし、最適しきい値選定用評価関数にJ(各正規分布の生起確率、分散とも等しいと仮定したゆう度規準)を使用し、区間内分散を考慮しない場合の処理結果である。図4で使用したサンプルは、従来手法でグランドノイズが付く図3と同じものである。
各ゆう度規準を最適しきい値選定用評価関数として使用し、従来技術でグランドノイズが付く650サンプルに対する二値化実験を行った結果を表10に示す。ほとんどのサンプルでグランドノイズがとれている。表10において、Jはフィルタ関数を標準偏差0.5のガウス分布とし、区間内分散を考慮した場合であり、Jはフィルタ関数を標準偏差0.5のガウス分布とし、区間内分散を考慮しない場合であり、Jはフィルタ関数を標準偏差0.6のガウス分布とし、区間内分散を考慮した場合であり、Jはフィルタ関数を標準偏差0.6のガウス分布とし、区間内分散を考慮しない場合である。評価関数Jで本発明を実行することにより、従来技術ではグランドノイズが付く650サンプル全てでグランドノイズがとれている。
二値化しきい値選定用評価関数に使用する各ゆう度規準に対し、最適なフィルタ関数を決めるため、ガウス分布の標準偏差を0.1刻みで0.1から1.0までのフィルタ関数を作成し、従来技術でグランドノイズが付く650サンプルの文字画像を対象に二値化実験を行った。0.3〜1.0の間のどの標準偏差でも、650サンプルのほとんどでグランドノイズが取れているが、1.0に近いほど、二値化結果の文字線が太くなっていたり、近接する2線が接触して1本の線になってしまうものがあった。この二値化実験の結果から、二値化性能、及び、二値画像の文字線の太さを考慮し、最良と思われる標準偏差を採用したものであり、J、J、J、Jに対し、それぞれ、0.5、0.5、0.6、0.6とした。
本発明の第一の実施例を図5で説明する。第一の実施例は、しきい値処理は二値化であり、統計量計算処理で区間内分散を考慮しない場合である。
図5は、しきい値処理を行う装置の構成を示している。装置の各部は、バス1に接続され、全体の制御は制御部2により制御される。演算部3では、各種の計算処理を行う。処理方法を記述したプログラムは、ハードディスク4からメモリ50に格納され、制御部2がメモリ50内のプログラムに従って処理を制御し、演算部3で計算処理が実行される。
まず、最初の処理では、画像6を入力装置7により入力し、濃淡画像をメモリ51に格納する。この濃淡画像はディジタル値であるため、データの型は整数である。この濃淡画像にフィルタ処理を施し、フィルタ処理画像を作成し、メモリ52に格納する。これは、処理結果のアナログ値をそのまま使用できるようにするため、データの型は浮動小数点数として格納する。フィルタ処理画像に対して、濃度ヒストグラム作成処理、及び、階級値計算処理により、濃度ヒストグラム、階級値を計算し、これらから統計量を計算して、メモリ53のワークエリアに格納する。この統計量を使って、最適しきい値選定用評価関数計算処理により、評価関数値を計算し、最適しきい値番号検出処理により、最適しきい値番号を検出する。最後に、しきい値処理により、最適しきい値番号から最適しきい値を計算し、メモリ52に格納されているフィルタ処理画像をしきい値処理した二値化結果をメモリ54に格納する。メモリ54の画像は、ハードディスク4に保存するか、あるいは、出力装置8に出力する。
本発明の第二の実施例を前述と同様図5で説明する。第二の実施例は、しきい値処理は二値化であり、統計量計算処理で区間内分散を考慮する場合である。
まず、最初の処理では、画像6を入力装置7により入力し、濃淡画像をメモリ51に格納する。この濃淡画像はディジタル値であるため、データの型は整数である。この濃淡画像にフィルタ処理を施し、フィルタ処理画像を作成し、メモリ52に格納する。これは、処理結果のアナログ値をそのまま使用できるようにするため、データの型は浮動小数点数として格納する。フィルタ処理画像に対して、濃度ヒストグラム作成処理、階級値計算処理、及び、区間内分散計算処理により、濃度ヒストグラム、階級値、区間内分散を計算し、これらから統計量を計算して、メモリ53のワークエリアに格納する。この統計量を使って、最適しきい値選定用評価関数計算処理により、評価関数値を計算し、最適しきい値番号検出処理により、最適しきい値番号を検出する。最後に、しきい値処理により、最適しきい値番号から最適しきい値を計算し、メモリ52に格納されているフィルタ処理画像をしきい値処理して二値化結果をメモリ54に格納する。メモリ54の画像は、ハードディスク4に保存するか、あるいは、出力装置8に出力する。
本発明の第三の実施例を前述と同様図5で説明する。第三の実施例は、しきい値処理はM個のクラスへの多値化であり、統計量計算処理で区間内分散を考慮しない場合である。
まず、最初の処理では、画像6を入力装置7により入力し、濃淡画像をメモリ51に格納する。この濃淡画像はディジタル値であるため、データの型は整数である。この濃淡画像にフィルタ処理を施し、フィルタ処理画像を作成し、メモリ52に格納する。これは、処理結果のアナログ値をそのまま使用できるようにするため、データの型は浮動小数点数として格納する。フィルタ処理画像に対して、濃度ヒストグラム作成処理、及び、階級値計算処理により、濃度ヒストグラム、階級値を計算し、これらから統計量を計算して、メモリ53のワークエリアに格納する。この統計量を使って、最適しきい値選定用評価関数計算処理により、評価関数値を計算し、最適しきい値番号検出処理により、(M−1)個の最適しきい値番号を検出する。最後に、しきい値処理により、最適しきい値番号の組から(M−1)個の最適しきい値を計算し、メモリ52に格納されているフィルタ処理画像をしきい値処理し、M値化した結果をメモリ54に格納する。メモリ54の画像は、ハードディスク4に保存するか、あるいは、出力装置8に出力する。
本発明の第四の実施例を前述と同様図5で説明する。第四の実施例は、しきい値処理はM個のクラスへの多値化であり、統計量計算処理で区間内分散を考慮する場合である。
まず、最初の処理では、画像6を入力装置7により入力し、濃淡画像をメモリ51に格納する。この濃淡画像はディジタル値であるため、データの型は整数である。この濃淡画像にフィルタ処理を施し、フィルタ処理画像を作成し、メモリ52に格納する。これは、処理結果のアナログ値をそのまま使用できるようにするため、データの型は浮動小数点数として格納する。フィルタ処理画像に対して、濃度ヒストグラム作成処理、階級値計算処理、及び、区間内分散計算処理により、濃度ヒストグラム、階級値、区間内分散を計算し、これらから統計量を計算して、メモリ53のワークエリアに格納する。この統計量を使って、最適しきい値選定用評価関数計算処理により、評価関数値を計算し、最適しきい値番号検出処理により、(M−1)個の最適しきい値番号を検出する。最後に、しきい値処理により、最適しきい値番号の組から(M−1)個の最適しきい値を計算し、メモリ52に格納されているフィルタ処理画像をしきい値処理し、M値化した結果をメモリ54に格納する。メモリ54の画像は、ハードディスク4に保存するか、あるいは、出力装置8に出力する。
本発明は、画像処理に関する基本的な処理方法であり、単純であるにもかかわらず高性能なことから、画像処理全般で有効な手法であると考えられる。
本発明である、二値化、及び、多値化を行う方法を示したブロック図。 従来技術による、二値化・多値化を行う方法を示したブロック図。 従来技術で二値化を行ったときに、グランドノイズが付く文字画像例。 従来技術ではグランドノイズが付く文字画像に対し、本発明によって二値化を行った結果、グランドノイズがとれた例。 本発明の実施例である、二値化・多値化を行う装置の構成を示すブロック図。
符号の説明
1:バス
2:制御部
3:演算部
4:ハードディスク
5、50、51、52、53、54:メモリ
6:画像
7:入力装置
8:出力装置
101、201:画像入力処理
102、202:濃淡画像
103:フィルタ処理
104:フィルタ処理画像
105、205:濃度ヒストグラム作成処理
106:階級値計算処理
206:階級値割当処理
107:区間内分散計算処理
108、208:濃度ヒストグラム
109、209:階級値
110:区間内分散
111、211:統計量計算処理
112、212:統計量
113、213:最適しきい値選定用評価関数計算処理
114、214:評価関数値
115、215:最適しきい値番号検出処理
116:最適しきい値番号の組
216:最適しきい値番号
117、217:しきい値処理
118、218:しきい値処理画像

Claims (12)

  1. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成し、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、及び、代表値を計算することにより得られる階級値を求め、
    前記濃度ヒストグラム、及び、前記階級値から、統計量を計算し、
    前記統計量を使用して、二値化しきい値選定用評価関数を最適にする二値化しきい値を求め、
    前記二値化しきい値により、前記フィルタ処理画像を二値化する方法。
  2. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成し、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、代表値を計算することにより得られる階級値、及び、区間内分散を求め、
    前記濃度ヒストグラム、前記階級値、及び、前記区間内分散から、統計量を計算し、
    前記統計量を使用して、二値化しきい値選定用評価関数を最適にする二値化しきい値を求め、
    前記二値化しきい値により、前記フィルタ処理画像を二値化する方法。
  3. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成し、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、及び、代表値を計算することにより得られる階級値を求め、
    前記濃度ヒストグラム、及び、前記階級値から、統計量を計算し、
    前記統計量を使用して、多値化しきい値選定用評価関数を最適にする多値化しきい値の組を求め、
    前記多値化しきい値の組により、前記フィルタ処理画像を多値化する方法。
  4. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成し、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、代表値を計算することにより得られる階級値、及び、区間内分散を求め、
    前記濃度ヒストグラム、前記階級値、及び、前記区間内分散から、統計量を計算し、
    前記統計量を使用して、多値化しきい値選定用評価関数を最適にする多値化しきい値の組を求め、
    前記多値化しきい値の組により、前記フィルタ処理画像を多値化する方法。
  5. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成する手段と、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、及び、代表値を計算することにより得られる階級値を求める手段と、
    前記濃度ヒストグラム、及び、前記階級値から、統計量を計算する手段と、
    前記統計量を使用して、二値化しきい値選定用評価関数を最適にする二値化しきい値を求める手段と、を備え、
    前記二値化しきい値により、前記フィルタ処理画像を二値化する装置。
  6. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成する手段と、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、代表値を計算することにより得られる階級値、及び、区間内分散を求める手段と、
    前記濃度ヒストグラム、前記階級値、及び、前記区間内分散から、統計量を計算する手段と、
    前記統計量を使用して、二値化しきい値選定用評価関数を最適にする二値化しきい値を求める手段と、を備え、
    前記二値化しきい値により、前記フィルタ処理画像を二値化する装置。
  7. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成する手段と、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、及び、代表値を計算することにより得られる階級値を求める手段と、
    前記濃度ヒストグラム、及び、前記階級値から、統計量を計算する手段と、
    前記統計量を使用して、多値化しきい値選定用評価関数を最適にする多値化しきい値の組を求める手段と、を備え、
    前記多値化しきい値の組により、前記フィルタ処理画像を多値化する装置。
  8. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成する手段と、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、代表値を計算することにより得られる階級値、及び、区間内分散を求める手段と、
    前記濃度ヒストグラム、前記階級値、及び、前記区間内分散から、統計量を計算する手段と、
    前記統計量を使用して、多値化しきい値選定用評価関数を最適にする多値化しきい値の組を求める手段と、を備え、
    前記多値化しきい値の組により、前記フィルタ処理画像を多値化する装置。
  9. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成し、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、及び、代表値を計算することにより得られる階級値を求め、
    前記濃度ヒストグラム、及び、前記階級値から、統計量を計算し、
    前記統計量を使用して、二値化しきい値選定用評価関数を最適にする二値化しきい値を求める、
    各手順を実行することから成る、前記二値化しきい値により前記フィルタ処理画像を二値化するプログラム。
  10. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成し、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、代表値を計算することにより得られる階級値、及び、区間内分散を求め、
    前記濃度ヒストグラム、前記階級値、及び、前記区間内分散から、統計量を計算し、
    前記統計量を使用して、二値化しきい値選定用評価関数を最適にする二値化しきい値を求める、
    各手順を実行することから成る、前記二値化しきい値により前記フィルタ処理画像を二値化するプログラム。
  11. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成し、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、及び、代表値を計算することにより得られる階級値を求め、
    前記濃度ヒストグラム、及び、前記階級値から、統計量を計算し、
    前記統計量を使用して、多値化しきい値選定用評価関数を最適にする多値化しきい値の組を求める、
    各手順を実行することから成る、前記多値化しきい値の組により前記フィルタ処理画像を多値化するプログラム。
  12. 濃淡画像を画素の隣接情報が加わるようフィルタ処理して、各画素がアナログ値であるフィルタ処理画像を作成し、
    前記フィルタ処理画像から、各階級を表す区間における、濃度ヒストグラム、代表値を計算することにより得られる階級値、及び、区間内分散を求め、
    前記濃度ヒストグラム、前記階級値、及び、前記区間内分散から、統計量を計算し、
    前記統計量を使用して、多値化しきい値選定用評価関数を最適にする多値化しきい値の組を求める、
    各手順を実行することから成る、前記多値化しきい値の組により前記フィルタ処理画像を多値化するプログラム。
JP2004171454A 2004-06-09 2004-06-09 画像の二値化或いは多値化方法及び装置並びにプログラム Pending JP2005354287A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004171454A JP2005354287A (ja) 2004-06-09 2004-06-09 画像の二値化或いは多値化方法及び装置並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004171454A JP2005354287A (ja) 2004-06-09 2004-06-09 画像の二値化或いは多値化方法及び装置並びにプログラム

Publications (1)

Publication Number Publication Date
JP2005354287A true JP2005354287A (ja) 2005-12-22

Family

ID=35588381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004171454A Pending JP2005354287A (ja) 2004-06-09 2004-06-09 画像の二値化或いは多値化方法及び装置並びにプログラム

Country Status (1)

Country Link
JP (1) JP2005354287A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833327A (zh) * 2020-07-14 2020-10-27 中国建筑第二工程局有限公司 一种基于图像识别的砂石检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0522598A (ja) * 1991-07-12 1993-01-29 Toppan Printing Co Ltd 画像入力装置
JPH11191844A (ja) * 1997-12-25 1999-07-13 Agency Of Ind Science & Technol 画像処理方法、画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体及び画像処理装置
JP2004104318A (ja) * 2002-09-06 2004-04-02 National Institute Of Advanced Industrial & Technology 画像処理方法及び装置並びにプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0522598A (ja) * 1991-07-12 1993-01-29 Toppan Printing Co Ltd 画像入力装置
JPH11191844A (ja) * 1997-12-25 1999-07-13 Agency Of Ind Science & Technol 画像処理方法、画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体及び画像処理装置
JP2004104318A (ja) * 2002-09-06 2004-04-02 National Institute Of Advanced Industrial & Technology 画像処理方法及び装置並びにプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833327A (zh) * 2020-07-14 2020-10-27 中国建筑第二工程局有限公司 一种基于图像识别的砂石检测方法

Similar Documents

Publication Publication Date Title
CN107609549B (zh) 一种自然场景下证件图像的文本检测方法
CN114418957B (zh) 基于机器人视觉的全局和局部二值模式图像裂缝分割方法
CN106407883B (zh) 一种复杂表格及其内部手写数字识别方法
Duan et al. A highly effective impulse noise detection algorithm for switching median filters
CN109636824B (zh) 一种基于图像识别技术的多目标计数方法
CN110472479B (zh) 一种基于surf特征点提取和局部lbp编码的指静脉识别方法
JP6487576B2 (ja) 指紋隆線点認識方法および装置
CN110263595B (zh) 一种二维码检测方法及装置
JPH0693250B2 (ja) 光学読取装置のキャラクタ情報抽出方法
CN109815762B (zh) 远距离识别二维码的方法、存储介质
CN116403094B (zh) 一种嵌入式图像识别方法及系统
CN112507782A (zh) 文本图像的识别方法及装置
CN107578011A (zh) 视频关键帧的判定方法及装置
CN114820631A (zh) 一种抗纹理干扰的面料缺陷检测方法
CN111292346B (zh) 一种噪声环境下浇铸箱体轮廓的检测方法
Saini Document image binarization techniques, developments and related issues: a review
CN110287752B (zh) 一种点阵码检测方法及装置
JP2016071800A (ja) 情報処理装置、情報処理方法及びプログラム
CN113033562A (zh) 一种图像处理方法、装置、设备及存储介质
Partio et al. An ordinal co-occurrence matrix framework for texture retrieval
JP2005354287A (ja) 画像の二値化或いは多値化方法及び装置並びにプログラム
CN110276260B (zh) 一种基于深度摄像头的商品检测方法
CN113643274A (zh) 一种二维码候选区筛选的方法及装置
CN113763407A (zh) 一种超声图像的结节边缘分析方法
CN111797838A (zh) 一种图片类文档盲去噪系统、方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061005

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080819