JP3749282B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP3749282B2 JP3749282B2 JP11745895A JP11745895A JP3749282B2 JP 3749282 B2 JP3749282 B2 JP 3749282B2 JP 11745895 A JP11745895 A JP 11745895A JP 11745895 A JP11745895 A JP 11745895A JP 3749282 B2 JP3749282 B2 JP 3749282B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- run
- image
- signal
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color, Gradation (AREA)
Description
【産業上の利用分野】
本発明は、例えば、スキャナ、FAX、複写機といったOA機器で入力される一般オフィスで用いられる文書画像を対象として、処理対象画像中の文字や写真といった特徴の異なる画像領域を識別して、その特徴に応じた画像処理を施し、高品質な複製画像の生成等を行う画像処理装置に関する。
【0002】
【従来の技術】
一般にコード情報だけでなくイメージ情報をも扱える文書画像処理装置においては、スキャナなどの読取手段で読み取った原稿に対して文字や線図などのコントラストのある画像情報は固定閾値により単純2値化を行い、写真などの階調を有する画像情報は、誤差拡散法などの擬似階調化手段によって2値化を行っている。
【0003】
読み取った画像情報を固定閾値により単純2値化処理を行うと、文字、線画像の領域は解像性が保存されるため画質劣化は生じないが、写真画像の領域では階調性が保存されないために画質劣化が生じた画像となってしまう。
【0004】
一方、読み取った画像情報を誤差拡散法などで階調化処理を行うと、写真画像の領域は階調性が保存されるため画質劣化は生じないが、文字、線画像の領域では解像性が低下するため画質の劣化した画像となってしまう。
【0005】
すなわち、読み取った画像情報に対して、単純に単一の2値化処理を行うと特徴の異なるそれぞれの領域の画質を同時に満足することは不可能である。従って、文字や写真が混在する文書画像を文字の解像性と写真の階調性を同時に満足する2値化を行うためには、文書画像から文字、写真、網点等の領域を像域分離し、それぞれの領域に適した2値化を行うか、あるいはそれぞれの領域に適した空間フィルタ処理(例えば、文字領域は高域強調フィルタ、写真領域はフィルタ無し、網点領域はローパスフィルタ)を行い特定の擬似階調化手段により2値化を行う必要がある。
【0006】
同様に、ファクシミリ等読みとった原稿を電送する際も文字、線画に対し圧縮率の良い圧縮方式と写真に対し圧縮率の良い方式を領域毎に選択することが望ましい。
【0007】
以上の問題に対し、文字、写真、網点写真の3領域を分離する方法として、「ブロック分離変換法」(Block Separate Transformation Method:BSET法;掲載文献「網点写真の識別処理方法」電子情報通信学会論文誌 '87/2 Vol.J70-B No.2 )が提案されている。
【0008】
この方法は、対象画像をブロックに分割し、ブロック内の濃度変化により3領域を分離する方法である。その際、
・写真はブロック内の濃度変化が小さい
・文字及び網点写真はブロック内の濃度変化が大きい
・文字は濃度変化の周期が大きい
・網点写真は濃度変化の周期が小さい
といった濃度変化の性質を利用する。以下に、その処理手順を紹介する。
【0009】
(1)対象画像を(m×n)画素のブロックに分割する。
(2)ブロック内の最大濃度信号Dmaxと最小濃度信号Dminを求め、ブロック内最大濃度差信号ΔDmaxを算出する。
【0010】
(3)あらかじめ設定した閾値Th1とΔDmaxとを比較し、以下の条件で写真領域と非写真領域(文字および網点写真領域)とを分離する。
ΔDmax≦Th1のとき、そのブロックを写真領域とする。
【0011】
ΔDmax>Th1のとき、そのブロックを非写真領域とする。
(4)ブロック内信号の平均信号Daでブロック内各画素を2値化(0/1)する。
【0012】
(5)ブロック内主走査方向に連続する画素間の0/1変化回数Khを求める。
同様に副走査方向についても変化回数Kvを求める。
【0013】
(6)あらかじめ設定した閾値Th2とKh、Kvとを比較し、以下の条件で文字領域と網点写真領域を分離する。
Kh≧Th2かつKv≧Th2のとき、そのブロックを網点写真領域とする。
【0014】
Kh<Th2またはKv<Th2のとき、そのブロックを文字領域とする。
以上の手順で、対象画素から文字、写真、網点写真領域を分離でき、各領域に対し適切な2値化処理を施すことが可能となる。
【0015】
しかしながら、領域の分離に誤りが生じた場合、その判定の画像単位は画素または数画素のブロックであるため、対象画像の複製画像を生成する際には不要な原稿上の輪郭やムラ等の画像領域も抽出されて再現されてしまう。
【0016】
このような問題を解決するための文書画像の領域分割の別のアプローチとして文献「Document Analysis System」(IBM J.RES.Develp Vol.26 No.6(1982))では、文書画像を大局的に処理し文字領域を抽出する方法が述べられている。
【0017】
この方法は文書画像における文字の分布特徴(文字は主走査または副走査に文字列として連続的に配置される)を利用した方法で、以下に、その処理手順を紹介する。
【0018】
(1)対象画像を2値化する(画像A)。
(2)画像Aの黒画素部を主走査方向に膨張する(画素B)。
(3)画像Aの黒画素部を副走査方向に膨張する(画素C)。
【0019】
(4)画像Bと画像Cの論理和をとる(画素D)。
(5)画像Dの連結する黒画素部に外接する矩形のサイズ(長さx・高さH)を求める。
【0020】
(6)矩形中の画像Aにおける黒画素数DCを求める。
(7)矩形中の画像Aにおける主走査方向の白/黒反転回数TCを求める。
(8)矩形中の画像Aにおける黒ランの平均長Rを次式で求める。
【0021】
R=DC/TC
(9)全矩形に対するH、Rの平均をHm、Rmとして求める。
(10)以下の条件を満たす領域を文字領域とする。
【0022】
R<C1・Rm
H<C2・Hm
以上の手順により、文字領域と非文字領域の判別が可能となる。この方法では画素単位に領域を識別するのではなく、文字列等の矩形単位に識別が可能となり、領域毎に均一な処理ができる。
【0023】
【発明が解決しようとする課題】
前述したような画像領域判別方法の手順を概略的に示すと、図17に示したようになる。すなわち、対象画像である原画像(画像G1)に対し、単純2値化を行い、その2値化画像(画像G2)の黒画素を膨脹して得られた黒画素部(画像G3参照)に外接する矩形を求めて画像領域(画像G4参照)を抽出するようになっている。
【0024】
ここで、原画像G1には、背景がグレーの領域上に人物が配されている写真と文字が混在する画像である。この画像G1を単純に2値化すると画像G2に示したように、グレーの領域は白くなり、人物と文字部のみが黒となる。従ってこの画像をもとに膨張および矩形化を行うと、それぞれ画像G3、G4に示したように、写真の画像領域が正しく抽出されない。すなわち、対象画像に含まれる階調を有する画像である写真の背景のグレーの領域が2値化により消失し、写真の画像領域が正確に抽出されないという問題点があった。
【0025】
そこで、本発明は、処理対象画像中の文字や写真といった特徴の異なる画像領域を正確に抽出して、その画像領域を識別することが容易に行え、画像処理の精度の向上が図れる画像処理装置を提供することを目的とする。
【0026】
【課題を解決するための手段】
本発明の画像処理装置は、種類の異なる複数の画像を含む処理対象画像における注目画素の画素値を、あらかじめ設定された閾値範囲内をランダムに変化して決定される閾値をもとに2値化し、2値化画素信号を提供する2値化手段と、この2値化手段から提供される2値化画素信号をもとに、黒画素を主走査方向に膨張する膨張手段と、この膨張手段で黒画素を膨張して得られた複数の黒画素領域を連結する連結手段と、この連結手段で連結された領域の外接矩形を抽出する外接矩形抽出手段と、この外接矩形抽出手段で抽出された外接矩形の特徴をもとに、その外接矩形の領域にある画像の種別を前記各外接矩形ごとに判別する画像判別手段とを具備する。前記2値化手段は、直列に接続された複数のシフトレジスタと、前記複数のシフトレジスタの出力信号のうち2以上の出力信号が供給され、前記複数のシフトレジスタの初段のシフトレジスタに排他的論理和演算結果を供給する排他論理和回路と、前記複数のシフトレジスタの出力信号から得られる閾値と、前記注目画素の画素値とを比較し、比較結果を前記2値化画素信号として提供する比較回路とを具備する。
【0028】
【作用】
処理対象画像における注目画素の画素値をその注目画素および周辺画素の画素値とは独立に決定される閾値をもとに2値化し、この2値化された前記注目画素と、その周辺の黒画素をもとに、黒画素を膨張し、この黒画素が膨脹されて得られた複数の黒画素領域を連結し、その結果得られた領域の外接矩形を抽出して、その外接矩形の特徴をもとに、その領域の画像の種別を前記各外接矩形毎に判別することにより、前記処理対象画像中の文字や写真といった特徴の異なる画像領域を正確に抽出して、その画像領域を識別することが容易に行え、画像処理の精度の向上が図れる。
【0030】
【実施例】
以下、本発明の一実施例について図面を参照して説明する。
図1は本実施例に係る画像処理装置の構成を概略的に示した図である。図1において、例えば、イメージ・スキャナ等により読み取られた、文字、写真等を含む一般オフィスで用いられる文書の画像(入力画像)について、例えば、1画素あたり8ビットのデジタル濃度データ(画素値)である画素信号S0が、この画像処理装置に入力されると、まず、2値化手段1に入力され、ここで、入力画像に対して後述するような2値化処理を行って2値化画像を求め、2値化画素信号S2が出力されるようになっている。
【0031】
2値化手段1で出力された2値化画素信号S2は、ラン膨脹手段2に入力され、ここで、2値化画素信号S1をもとに、後述するような2値化画像の黒画素を膨脹する処理を行い、黒画素部(以下、「ラン」とも呼ぶ。)を求め、ラン膨張信号S2を出力するようになっている。
【0032】
ラン膨脹手段2から出力されたラン膨脹信号S2は、ラベリング手段3に入力され、ここで、ラン膨張信号S2をもとに連結するランを1つの領域として統合(ラベリング)し、その統合された領域の特徴を示す情報を信号S3として出力するようになている。
【0033】
ラベリング手段3から出力された信号S3は、外接矩形抽出手段4に入力され、ここで、信号S3をもとに、ラベリングされたそれぞれの領域に外接する矩形の大きさを求め、その結果を信号S4として出力するようになっている。
【0034】
外接矩形抽出手段4から出力された信号S4は、判定手段5に入力され、ここで、信号S4をもとに、外接矩形の大きさから各矩形領域の画像の種別、すなわち、例えば、文字画像領域であるか、写真画像領域であるかを判定し、その結果を信号S5として出力するようになっている。
【0035】
判定手段5から出力された信号S5は、入力画像から抽出され、画像の種別が判定された各画像領域の情報であり、この情報をもとに、後続の処理部、あるいは、画像処理装置において、それぞれの画像領域の特徴に応じた画像処理を施し、高品質な複製画像の生成等を行うようになっている。
【0036】
次に、図1の2値化手段2について説明する。ここでの2値化処理は、注目画素の画素値とは独立に決定される閾値または周辺画素の画素値に応じて決定される閾値により2値化する方法で次に示す5通りの方法がある。
(1)2値化誤差を周辺画素に分配し階調を保存する誤差拡散法による2値化処理…第1の2値化処理
(2)注目画素の2値化誤差を次に処理される画素において補償し階調を保存する2値化処理…第2の2値化処理
(3)ランダムな閾値による2値化処理…第3の2値化処理
(4)閾値が規則的に変化する組織ディザ法による2値化処理…第4の2値化処理
(5)注目画素を含む(n×n)のウインドウ内の平均値を閾値とする2値化処理…第5の2値化処理
まず、図2を参照して、第1の2値化処理について説明する。すなわち、この第1の2値化処理は、注目画素の濃度データである画素信号S0に既に2値化した周辺画素の2値化誤差にある重み係数を乗じたものを加え、固定閾値で2値化する方法である。
【0037】
図2において、スキャナ等の画像入力装置で読み取られた画素信号S0は、補正部10において、後述する補正信号S10を加算して補正処理を行い、補正信号S11を出力する。
【0038】
補正信号S11は、比較部11において、固定2値化閾値Th(例えば「80」h:hは16進数であることを示す)と比較処理を行い、補正信号S11が2値化閾値Thより大きければ2値化画素信号S1として「1」(黒画素)を出力し、小さければ「0」(白画素)を出力する。この比較部11は、補正信号S11のデータ長に応じて、例えば、この本実施例の場合、8ビット単位で8ビットの固定閾値Thと比較し、8ビットの2値化画素信号S1を出力するようになっている。
【0039】
2値化誤差算出部12では、補正信号S11と2値化画素信号S1(ただし、ここでは2値化画素信号が「0」のときは「00」h、「1」のときは「ff」hとする)との差(2値化誤差)を算出し、これを2値化誤差信号S12として出力する。
【0040】
重み誤差算出部13では、2値化誤差信号S12に重み係数記憶部14の重み係数A、B、C、D(ただし、A=7/16、B=1/16、C=5/16、D=3/16)を乗じ、重み誤差S13を算出する。ここで、図2の重み係数記憶部14における「*」で示した画素は、注目画素の位置を示し、注目画素の2値化誤差に重み係数A、B、C、Dを乗じて、注目画素の周辺4画素(重み係数A、B、C、Dの位置に対応する画素)の重み誤差を算出する。
【0041】
誤差記憶部15は、重み誤差算出部13で算出した重み誤差S13を記憶するものであり、重み誤差算出部13で算出した4画素分の重み誤差は、図2の注目画素*に対してそれぞれeA 、eB 、eC 、eD に位置する画素に対する補正量として加算して記憶するようになってる。
【0042】
前述した補正信号S10は、図2の誤差記憶部15に示した*印の位置の画素の信号であり、以上の手順で算出した計4画素分の重み誤差の累積した信号である。
【0043】
次に、図3を参照して第2の2値化処理について説明する。すなわち、この第2の2値化処理は第1の2値化処理である「誤差拡散法」の変形例であり、注目画素の画素値に、既に2値化した前画素の2値化誤差を加算し、固定閾値で2値化する方法である。なお、図3において、図2と同一部分には同一符号を付し、異なる部分について説明する。
【0044】
図3において、補正部10、比較部11、2値化誤差算出部12は、図2に示した構成と同様である。第1の2値化処理と異なる部分は、図1において、補正部10で画素信号S0を補正するために入力される信号が補正信号S10であるところを、図3では、2値化誤差算出部12から出力される2値化誤差信号S12をそのまま補正部10に入力して、画素信号S0と加算されて、画素信号S0を補正するようになっている。
【0045】
このように、第1の2値化処理では2値化誤差信号S12を次のラインを含む周辺画素に拡散するため、誤差演算用のメモリ(重み係数記憶部14)や乗算器(重み誤差算出部13)、さらにはラインメモリ(誤差記憶部15)を必要とする。これに対し、第2の2値化処理方法では2値化で生じた誤差(2値化誤差信号S12)は全て次の画素で補正するため、メモリや乗算器等の回路が削減できる。
【0046】
次に、第3の2値化処理について説明する。この第3の2値化処理では、前述した第1、第2の2値化処理のように、比較部11において、固定閾値Thと補正信号S11を比較して、2値化画素信号S1を出力するのではなく、閾値 Thrは可変のもので、しかも、その可変閾値Thrと画素信号S0を比較して2値化画素信号S1を出力するようになっている。従って、第3の2値化処理を実現するための具体的な構成は、図4に示すように、比較部11のみで実現できる。すなわち、比較部11の一方の入力端子に、可変閾値Thrが入力され、他方の入力端子に画素信号S0が入力されて、これらの値を比較することにより、図1で説明したように、例えば8ビットの2値化画素信号S1を出力するようになってる。
【0047】
さて、この第3の2値化処理の特徴は、図4の閾値Thrがランダムな値をとることで、そのランダムな閾値の発生方法について、図5を参照して説明する。図5は、8ビットのランダムな閾値の発生回路の一具体例を示したものであり、1ビットのシフトレジスタ22a〜22h、排他論理和(EXOR)回路21から構成される。
【0048】
シフトレジスタ22a〜22hには、あらかじめ任意の値(ただし全て「0」の場合は除く)がセットされ、図示しない画像クロックに同期してシフトレジスタ22a〜22hに保持されている値が出力されて、それぞれ次のシフトレジスタ22b〜22hに入力される。ただし、このとき、シフトレジスタ22aには、排他論理和回路21から出力された、シフトレジスタ22b、22c、22g、22hからの出力値の排他論理和の値が入力され、またシフトレジスタ22hの出力は、排他論理和回路21の入力端子に入力するようになっている。
【0049】
ここで、画像クロックとは、スキャナ等により入力画像が読み取られる際に、その入力画像の画素信号S0とともに本実施例の画像処理装置に入力される、画素信号S0に同期した1画素毎のタイミング信号である。
【0050】
このようにして、画像クロックが1クロックづつシフトレジスタ22a〜22hに入力される毎に、各シフトレジスタ22a〜22hのそれぞれから出力される値Thr0〜Thr7が8ビットの閾値Thrとして、図4の比較部11に入力される。
【0051】
図5に示した構成により、各シフトレジスタ22a〜22hのそれぞれから出力される値Thr0〜Thr7は、画像クロックが入力される度に、異なる値となり、ランダムな閾値Thrを得ることができる。
【0052】
図4の比較部11で、1画素毎に異なるランダムな閾値Thrと画素信号S0としての画素値を比較し、画素値が閾値Thrより小さければ2値化画像信号S1として「0」を出力し、画素値が閾値以上であれば「1」を出力する。
【0053】
次に、第4の2値化処理について説明する。この第4の2値化処理は、画素信号S0と閾値とを比較して2値化を行う際、閾値が規則的に変化する組織ディザ法によるものである。
【0054】
図6は組織的ディザ法の原理を説明するための図で、(4×4)のディザマトリックスによる2値化の一例である。(4×4)のディザでは閾値は主走査方向(画像のi方向)、副走査方向(画像j方向)のそれぞれ4画素の周期で閾値が周期的に変化する。すなわち、図6(a)に示すような(4×4)のマトリックス状に位置する入力画像の画素について、図6(b)に示すような(4×4)のディザマトリックス上の各数値はそれぞれに対応する位置にある図6(a)のマトリックス上の画素の閾値となり、この(4×4)のマトリックス単位に、閾値が周期的に変化する。
【0055】
図6(a)は入力画像からi方向、j方向にそれぞれ4画素づつの(4×4)のマトリックスを抽出したもので、各画素値は、この例では一様に「90」とする。尚、画素値は8ビットで、その範囲は「0」〜「255」であり、「0」が白画素、「255」が黒画素を表すものである。
【0056】
図6(c)は、図6(a)の(4×4)のマトリックス状の入力画像に対し、図6(b)のディザマトリックスを用い、組織ディザ法により2値化処理を行った結果の2値化画像を示す図である。
【0057】
組織ディザ法による2値化処理は、具体的には、マトリックス上の各画素の主走査方向i、副走査方向jの位置を(i、j)と座標表現すると、図6(a)の入力画像の座標(i、j)に位置する画素の画素値(画素信号S0)を、図6(b)のディザマトリックス上の座標(i mod 4、j mod 4)に位置する閾値と比較され、画素信号S0の値がその対応の閾値より小さければ2値化画素信号S1として「0」を出力し、画素信号S0の値がその対応の閾値以上であれば「1」を出力する。ここで mod 4は4で割ったときの余数を表す。
【0058】
例えば、図6(a)の入力画像の座標(0、0)の画素についてみると、その画素値は「90」で、図6(b)の座標(0、0)の閾値は「16」であるので、比較処理により「1」が出力される。すなわち、図6(c)の2値化画像の座標(0、0)の画素は黒画素となる。
【0059】
同様に、図6(a)の入力画像の座標(1、0)の画素では、その画素値「90」で、図6(b)の座標(1、0)の閾値は「144」であるので、比較処理により「0」出力される。すなわち、図6(c)の2値化画像の座標(1、0)の画素は白画素となる。
【0060】
以下同様に処理すれば2値化処理結果として図5(c)に示される2値化画像が得られる。
また、入力画像の座標(i、j)の画素の画素値(画素信号S0)と、それに対応するディザマトリクッス上の閾値とを比較する際、図4に示したように、比較部11を用いるようにしてもよい。
【0061】
尚、図6では、ディザマトリックスとして(4×4)の場合を示したが、ディザマトリックスは(n×n)の任意のサイズでよい。
次に、第5の2値化処理について説明する。この第5の2値化処理は、入力画像について、(n×n)単位の画素の領域を1つのウィンドウとして、そのウインドウ内の画素値の平均値を閾値として2値化処理を行うものである。
【0062】
図7は、注目画素Pとその注目画素Pの画素値(画素信号S0)を2値化するための閾値となる画素値の平均値を算出する画素の領域であるウィンドウWとの位置関係を示すものであり、この例では、ウインドウWの範囲を(4×4)の場合を示している。なお、ウィンドウサイズは任意の値n(ただしn>1)の(n×n)で差し支えない。
【0063】
図7において、このウィンドウW内の各画素の位置をx方向、y方向にそれぞれ座標(i、j)で表すと、ウインドウW内の座標(1、1)に注目画素Pが位置している。このようなウインドウを入力画像全体に渡って設定し、全画素が注目画素Pとして、その画素信号S0を2値化して2値化画像信号S1を求めるようになっている。なお、注目画素PとウインドウWとの位置関係は、図7に示した場合に限らず、任意である。
ウインドウW内の座標(i、j)の画素の画素値、すなわち、濃度値をDi、j とすれば、閾値となる平均濃度値Daは次式(数1)で算出される。
【0064】
【数1】
【0065】
平均濃度値Daを算出するための具体例として、図8に示すような平均値算出回路(平滑化回路)が考えられる。
図8において、この平滑化回路には、入力画像の8ビットの画素信号S0が画像クロックCLKに同期して、列(ライン)方向(主走査方向)の連続した4画素が8ビット入力端子で構成されるデータ入力ポートにそれぞれに入力される。
【0066】
平滑化回路に入力された4画素分の画素信号S0は、まず、セレクタ25のそれぞれが8ビットデータ入力端子で構成される4つの入力ポートにそれぞれ順次入力される。
【0067】
カウンタ26では、画像クロックCLKをカウントすることにより、4画素分の画素信号S0がセレクタ25に入力される毎に2ビットの選択信号を出力するようになっている。
【0068】
セレクタ25では、カウンタ26から出力される選択信号に応じて、それぞれが4つの8ビットデータ出力端子から構成される4つの出力ポートのうちいずれか1つの出力ポートから列単位の4画素分の画素信号S0が出力されるようになっている。すなわち、この4つの出力ポートからは、それぞれ、図7のウインドウW内の第1ライン目の連続する4画素(座標(i、0)の画素)、第2ライン目の連続する4画素(座標(i、1)の画素)、第3ライン目の連続する4画素(座標(i、2)の画素)、第4ライン目の連続する4画素(座標(i、3)の画素)がそれぞれ出力される。
【0069】
セレクタ25の4つの出力ポートは、それぞれ、加算器27a〜27dに接続され、1ライン毎の4画素分の画素信号S0が、加算器27a〜27dにそれぞれ分配されて、加算器27a〜27dのそれぞれでは、ライン方向に連続した4画素分の画素値が加算される。
【0070】
加算器27a〜27dのそれぞれにおいて算出された1ライン毎の4画素分の画素値の加算結果は、加算器28に入力され、ここで、ライン毎にそれぞれ算出された4画素分の画素値の加算結果をさらに、全ライン(4ライン)について加算して、図7の(4×4)の範囲のウインドウ内の全ての画素の画素値(濃度値)の合計が得られる。
【0071】
加算器28での加算結果、すなわち、ウインドウ内の全ての画素の画素値(濃度値)の合計は、除算器29に入力され、この合計値をウィンドウ内の画素数「16」(=4×4)で除算し、図7に示したような(4×4)画素のウインドウの領域内における画素値(画素信号S0)の平均値が出力される。この平均値を閾値として、その閾値と図7の注目画素Pの画素値(画素信号S0)とを比較し、画素値が閾値より小さければ2値化画像信号S1として「0」を出力し、画素値が閾値以上であれば「1」を出力し、全画素に対して、このような2値化処理を施して、2値化画像が得られる。
【0072】
閾値と注目画素Pの画素値とを比較する際、図4に示したように、比較部11を用いるようにしてもよい。
図1の2値化手段1で、画素信号S0に対し、第1〜第5の2値化処理のうちいづれかの2値化処理がほどこされて出力された2値化画素信号S1は、ラン膨張手段2に入力され、ここで、2値化画素信号S1をもとに主走査方向に黒画素の膨張処理が行われる。
【0073】
ラン膨張処理は1つの注目画素(黒画素)を主走査方向の所定の画素数範囲内に黒画素がある場合、その注目画素とその画素までの間の画素をすべて黒画素に置き換える処理である。
【0074】
次に、ラン膨張処理について、図9を参照して説明する。ここでは、簡単のため、前記画素数範囲を「4」として説明する。図9において、2値化画像の画素の位置をx方向、y方向にそれぞれ座標(i、j)で表すことにする。
【0075】
図9(a)において、座標(2、1)か主走査方向に(5、1)まで黒画素が連続し、2画素おいて、座標(8、1)から主走査方向に座標(12、1)まで黒画素が連続している場合、座標(2、1)から座標(12、1)の全ての画素を黒画素に置き換え、図9(b)に示すように、ラン(黒画素部)L1を得る。
【0076】
次に、図9(a)の座標(1、2)の画素についてみると、主走査方向に座標(3、2)まで黒画素が連続しているが、それより右には4画素以内に黒画素が存在しない。従って、これらの画素には変更を加えず、そのまま、図9(b)に示すように、ランL2とする。
【0077】
同様に、図9(a)の座標(9、2)から座標(11、2)まで連続する黒画素と、座標(13、2)から座標(16、2)まで連続する黒画素について、座標(9、2)から座標(16、2)までを全て黒画素に置き換え、図9(b)に示すように、ランL3を得る。
【0078】
このように、主走査方向に4画素の範囲内に黒画素がある場合は、これらを黒画素の間を全て黒画素に置き換える。
図10はラン膨張処理を実行するための具体的な回路構成例を示したものである。なお、図10では、膨張の範囲、すなわち、画素数範囲を「8」とした場合を示している。また、2値化画素信号S1の値、すなわち、2値化画素値は、その画素が黒画素のとき「1」、白色画素のとき「0」とする。
【0079】
図10において、ラッチ回路30aには2値化画素信号S1が入力され、ラッチ回路30b〜30gは、それぞれの前段にあるラッチ回路30a〜30fからの出力が入力されるように接続され、ラッチ回路30hには、ラッチ回路30gの出力が入力されている。すなわち、ラッチ回路30aに、画像クロックとともに1画素目の2値化画素信号S1(2値化画素値)が入力されて、その値が画像クロックのタイミングに従って、FF回路30aにラッチ(一時保持)され、そのとき、後段のラッチ回路30bに1画素目の2値化画素値が出力される。ラッチ回路30bでは、2画素目の画像クロックのタイミングで1画素目の2値化画素値をラッチし、このとき、ラッチ回路30aでは、2画素目の2値化画素値がラッチされ、以下、同様に、画素クロックのタイミングに従って前段のラッチ回路でラッチされた2値化画素値を後段のラッチ回路でラッチして、さらに後段のラッチ回路に出力するような構成になっている。
【0080】
ラッチ回路30a〜30gの出力はオア回路31に入力され、さらに、オア回路31には、ラッチ回路30aに入力される2値化画素信号S1の値も入力され、これらの論理和を求め、その結果を信号FLAG1としてアンド回路32に出力する。
【0081】
ラッチ回路30hの出力である2値化画素値はオア回路33に入力されるとともに、その2値化画素値を論理反転してアンド回路32にも入力される。
ここで、ラッチ回路30hでラッチされている2値化画素値BINを注目画素とすると、ラッチ回路30a〜30gにラッチされる2値化画素値およびラッチ回路30aに入力される2値化画素値は、注目画素の次の画素から8番目の画素のものであり、オア回路31では、それらの画素の中に黒画素が1つでも存在すれば信号FLAG1として「1」を出力し、全て白画素のときは信号FLAG1として「0」を出力する。すなわち、信号FLAG1により、注目画素から8画素の範囲内に黒画素があるかどうかが判断できる。
【0082】
アンド回路32には、注目画素の2値化画素値BIN、信号FLAG1、後述する注目画素の1画素前の膨脹画像信号EXOが入力され、ラッチ回路30hにラッチされている注目画素が白画素の場合に、その画素が8画素の範囲内の2つの黒画素の間に位置するかどうかを判定し、その判定結果として信号FLAG2を出力するものである。その際の判定条件は、
信号BIN=「0」かつ信号FLAG1=「1」かつ信号EX0=「1」のとき、信号FLAG2=「1」
上記条件以外のとき、信号FLAG2=「0」
となる。
【0083】
オア回路33には、注目画素の2値化画素値BINとアンド回路32からの出力信号FLAG2が入力されて、これらの値から以下の判定条件に基づきラン膨張信号S2を出力するものである。その際の判定条件は、
信号BIN=「1」または信号FLAG2=「1」のとき、ラン膨脹信号S2=「1」
信号BIN=「0」かつ信号FLAG2=「0」のとき、ラン膨脹信号S2=「0」
となる。
【0084】
前述の注目画素の1画素前のラン膨張信号EXOは、オア回路33の出力であるラン膨張信号S2をラッチ回路34において、画像クロックにより1画素分遅延させてたものである。
【0085】
このようにして、2値化画像から抽出されたラン(黒画素部)の情報として出力されるラン膨脹信号S2をもとに、抽出された1つのラン毎にそのランの始点座標、終点座標、そのランの長さが得られる。
【0086】
次に、図1のラベリング手段3について説明する。ここでは、ラン膨張手段2で出力されたラン膨脹信号S2をもとに連結するランを1つの領域として統合(ラベリング)する処理を行う。
【0087】
図11(a)は、ラン膨張手段2により抽出されたランの具体例を示し、図11(b)は、図11(a)に示したランについて、ラン膨脹信号S2から得られるラン情報の記憶例である。
【0088】
図11(b)において、抽出された各ラン毎に、番号を付して、それぞれのランの始点座標、終点座標、ランの長さが記憶されている。ラベリング手段3では、このようなラン情報をもとに、ラベリングを行う。なお、このような情報は、本実施例の画像処理装置に具備された所定のメモリ領域に記憶するようにしてもよい。
【0089】
図11(a)において、ラン番号が「1」のランL10は、ラン番号が「2」のランL11と連結している。さらに、ラン番号が「1」のランL10は、ラン番号が「3」のランL12とも連結している。つまり、ランL10〜L12は、すべて連結している。このようにラベリング手段3では連結しているランを1つの領域として統合(ラベリング)する。
【0090】
図12は、図11(a)に示したランに対してラベリングした結果、その統合された領域に関する情報の記憶例を示したものである。図12において、その統合された領域には、ラベル「A」が付されて、その領域の特徴を示す情報としてその領域に連結されたランのラン番号「1」、「2」、「3」が記憶されている。
【0091】
図12に示したような情報は、信号S3として外接矩形抽出手段4に出力される。
次に、外接矩形抽出手段について説明する。ここでは、ラベリング手段3でラベリングされたそれぞれの領域に外接する矩形の位置および大きさを求める。
【0092】
まず、図13を参照して外接矩形の抽出方法の原理について説明する。
図13(a)は、外接矩形を抽出する対象となる統合領域の具体例を示したもので、図11で説明したものと同一のラベル「A」と付された領域である。すなわち、図13(a)に示した領域には、ラン番号「1」、「2」、「3」のランが統合されている。この統合領域の大きさを判定するには、注目ラインとその前ラインとの2本のライン単位に、左から右に向かって、その2ライン上のランの開始点、終了点、長さ等を比較する。
【0093】
まず、図13(a)において、ランL11およびその前ラインのランL10に注目すると、ランL11の始点はランL10より前方に位置するので、それらに外接する矩形領域の始点は、ランL11の始点上にあり、また、ランL10の終点は、ランL11の終点より後方に位置するので、外接する矩形領域の終点はランL10の終点上にあることになる。従って、ランL10、L11に外接する矩形は、図13(b)に太線で示したようなものとなる。
【0094】
次に、図13(b)において、ランL12とランL10に注目すると、ランL10の始点はランL12より前方に位置するので、それらに外接する矩形領域の始点は、ランL10の始点上にあり、また、ランL12の終点は、ランL10の終点より後方に位置するので、外接する矩形領域の終点はランL12の終点上にあることになる。さらに、図13(b)に太線で示したような外接矩形を考慮して、結局、ランL10、L11、L12に外接する矩形は、図13(c)に太線で示したようなものとなる。
【0095】
このように、図13(a)に示したランL10、L11、L12が統合されたラベル「A」と付された領域について、外接矩形抽出手段4では、これらのランの始点(x1、y1)、(x2、y2)、(x3、y3)のうち最も小さいx座標および最も小さいy座標を外接矩形の始点(xs、ys)として求める。つまり、対象ラベルに含まれるn個のランの始点をそれぞれ(x1、y1)、(x2、y2)…(xn、yn)としたとき、外接矩形の始点(xs、ys)は、
xs=min(x1、x2、…xn)
ys=min(y1、y2、…yn)
と求めることができる。
【0096】
また、始点の算出と同様に、外接矩形の終点(xe、ye)は、
xs=max(x1、x2、…xn)
ys=max(y1、y2、…yn)
と求めることができる。
【0097】
さらに、外接矩形の大きさ、すなわち、x方向およびy方向の長さ(xl、yl)は、
xl=xe−xs+1
yl=ye−ys+1
と求めることができる。
【0098】
以上の手順で図11(b)に示したラン情報をもとに算出した外接矩形情報S4は、例えば、図14に示すように記憶される。図14に示した外接矩形情報の記憶例では、図13(c)に示したラベル「A」と付された外接矩形について、その始点の座標(xs、ys)と、大きさ(xl、yl)が記憶されている。
【0099】
ここで、外接矩形の大きさを判定するための判定条件を図15を参照して説明する。
図15において、第1ライン目のランL20のラン情報として、ラン開始位置のx座標X0、y座標Y0、ラン長M0をまとめて(X0、Y0、M0)と表し、第2ライン目のランL21のラン情報として、ラン開始位置のx座標X1、y座標Y1、ラン長M1をまとめて(X1、Y1、M1)と表す。また、判定の結果得られる外接矩形の始点を(x方向の座標、y方向の座標)と、外接矩形の大きさを(x方向の長さ、y方向の長さ)と表す。
【0100】
外接矩形の大きさを判断する際、第1ライン目のランL20と第2ライン目のランL21の位置関係が判断基準となるが、その対象となる位置関係としては、図15(a)〜(f)に示すような6つの場合が考えられる。
【0101】
図15(a)は、第1の判定条件の対象を示したもので、ランL20とランL21との位置関係が、第2ライン目のランL21は、第1ライン目のランL20より前方にあり、かつ、互いに連結されていない場合である。すなわち、X0>X1+M1のとき、L20とランL21は非連結であると判定され、その結果、得られる外接矩形の始点は(X1、Y1)、大きさは(M1、Y−Y1+1)となる。ここで、Yは処理中のライン番号を表し、図15の場合、Y=Y1である。
【0102】
図15(b)は、第2の判定条件の対象を示したもので、ランL20とランL21との位置関係が、第2ライン目のランL21の始点は第1ライン目のランL20の始点より前方にあり、かつ、第2ライン目のランL21の終点は第1ライン目のランL20の終点より前方にあり、互いに連結されている場合である。すなわち、X0>X1、X0≦X1+M1、X0+M0>X1+M1のとき、判定される外接矩形の始点は(X1、Y0)、大きさは(X0+M0−X1+1、Y−Y0+1)となる。
【0103】
図15(c)は、第3の判定条件の対象を示したもので、ランL20とランL21との位置関係が、第2ライン目のランL21の始点は第1ライン目のランL20の始点より前方にあり、かつ、第2ライン目のランL21の終点は第1ライン目のランL20の終点より後方にあり、互いに連結されている場合である。すなわち、X0>X1、X0≦X1+M1、X0+M0≦X1+M1のとき、判定される外接矩形の始点は(X1、Y0)、大きさは(M1、Y−Y0+1)となる。
【0104】
図15(d)は、第4の判定条件の対象を示したもので、ランL20とランL21との位置関係が、第2ライン目のランL21の始点は第1ライン目のランL20の始点より後方にあり、かつ、第2ライン目のランL21の終点は第1ライン目のランL20の終点より前方にあり、互いに連結されている場合である。すなわち、X0≦X1、X0≦X1+M1、X0+M0>X1+M1のとき、判定される外接矩形の始点は(X0、Y0)、大きさは(M0、Y−Y0+1)となる。
【0105】
図15(e)は、第5の判定条件の対象を示したもので、ランL20とランL21との位置関係が、第2ライン目のランL21の始点は第1ライン目のランL20の始点より後方にあり、かつ、第2ライン目のランL21の終点は第1ライン目のランL20の終点より後方にあり、互いに連結されている場合である。すなわち、X0≦X1、X0≦X1+M1、X0+M0≦X1+M1のとき、判定される外接矩形の始点は(X0、Y0)、大きさは(X1+M1−X0+1、Y−Y0+1)となる。
【0106】
図15(f)は、第6の判定条件の対象を示したもので、ランL20とランL21との位置関係が、第2ライン目のランL21は、第1ライン目のランL20より後方にあり、かつ、互いに連結されていない場合である。すなわち、X0+M0<X1のとき、第1ライン目のランL20との連結の終了が判定され、その結果、得られる外接矩形の始点は(X0、Y0)、大きさは(M0、Y−Y0+1)となる。
【0107】
図16は、ラベリング手段3および外接矩形抽出手段4の回路構成の具体例を示したものである。
図16において、ラン膨張手段2からのラン膨脹信号S2について、まず第1ライン目のランのラン情報(ラン開始位置のX座標、Y座標、ラン長)がセレクタ40を介してメモリ41に記憶される。メモリ41に記憶されたラン情報はセレクタ42を介し、比較器43a〜43eに供給され、第2ライン目のランのラン情報とが比較されるようになっている。さらに、メモリ41に記憶されたラン情報はセレクタ42を介し、加減算器44にも供給され、第2ライン目のランと第1ライン目のランが連結している場合等に、これらのラン情報に対し加減算を行い、統合したランの始点座標、大きさ等を算出するようになっている。
【0108】
比較器43aでは、第1ライン目の第1番目のランの始点座標X0と第2ライン目の第1番目のランの始点座標X1を比較する。このとき、
X0>X1
であれば比較信号S30として「1」をそれ以外では「0」を出力する。
【0109】
比較器43bでは、第1ライン目の第1番目のランの始点座標X0と第2ライン目の第1番目のランの終点座標X1+M1を比較する。このとき、
X0>X1+M1
であれば比較信号S31として「1」をそれ以外では「0」を出力する。
【0110】
比較器43cでは、第1ライン目の第1番目のランの終点座標X0+M0と第2ライン目の第1番目のランの終点座標X1+M1を比較する。このとき、
X0+M0>X1+M1
であれば比較信号S32として「1」をそれ以外では「0」を出力する。
【0111】
比較器43dでは、第1ライン目の第1番目のランの終点座標X0+M0と第2ライン目の第1番目のランの始点座標X1を比較する。このとき、
X0+L0>X1
であれば比較信号S33として「1」をそれ以外では「0」を出力する。
【0112】
比較器43eでは、第1ライン目の第1番目のランのy方向の始点座標Y0と第2ライン目の第1番目のランのy方向の始点座標Y1を比較する。このとき、
Y0>Y1
であれば比較信号S34として「1」をそれ以外では「0」を出力する。
【0113】
加減算器44ではランが連結した場合に統合したランの大きさ(長さ)として、
X0+M0−X1+1
または
X1+M1−X0+1
を演算し、その演算結果等を含む信号S35として、X0、Y0、X1、Y1、M0、M1、X0+M0−X1+1、X1+M1−X0+1をセレクタ46に出力する。
【0114】
判定テーブル45では比較信号S30、S31、S32、S33、S34をもとに、第1ライン目のランと第2ライン目のランとの位置関係を前述したように判定し、第1〜第6の判定条件に対応してセレクタ42、46、メモリ47、48に対する選択信号S36、S37、および、ラン選択信号S38を出力するようになっている。
【0115】
選択信号S37は4ビットの信号で下位3ビットは、前述の第1〜第6の判定条件に対応して決定されるもので、上位1ビットは比較信号S34がそのまま出力される。
【0116】
判定テーブル45で、第1の判定条件が満たされたとき、すなわち、比較信号S31が「1」のとき、図15(a)に示すように、第2ライン目のランは第1ライン目のランと連結していない。このとき、選択信号S36として「0」を、選択信号S37の下位3ビットとして「000」を、ラン選択信号S38として「1」を出力する。
【0117】
判定テーブル45で、第2の判定条件が満たされたとき、すなわち、比較信号S30が「1」、比較信号S31が「0」、比較信号S32が「1」のとき、図15(b)に示すように、第2ライン目のランは第1ライン目のランと連結している。このとき、選択信号S36として「0」を、選択信号S37の下位3ビットとして「001」を、ラン選択信号S38として「1」を出力する。
【0118】
判定テーブル45で、第3の判定条件が満たされたとき、すなわち、比較信号S30が「1」、比較信号S31が「0」、比較信号S32が「0」のとき、図15(c)に示すように、第2ライン目のランは第1ライン目のランと連結している。このとき、選択信号S36として「0」を、選択信号S37の下位3ビットとして「010」を、ラン選択信号S38として「0」を出力する。
【0119】
判定テーブル45で、第4の判定条件が満たされたとき、すなわち、比較信号S30が「0」、比較信号S31が「0」、比較信号S32が「1」のとき、図15(d)に示すように、第2ライン目のランは第1ライン目のランと連結している。このとき、選択信号S36として「0」を、選択信号S37の下位3ビットとして「011」を、ラン選択信号S38として「1」を出力する。
【0120】
判定テーブル45で、第5の判定条件が満たされたとき、すなわち、比較信号S30が「0」、比較信号S31が「0」、比較信号S32が「0」のとき、図15(e)に示すように、第2ライン目のランは第1ライン目のランと連結している。このとき、選択信号S36として「0」を、選択信号S37の下位3ビットとして「100」を、ラン選択信号S38として「0」を出力する。
【0121】
判定テーブル45で、第6の判定条件が満たされたとき、すなわち、比較信号S33が「0」のとき、図15(f)に示すように、第1ライン目のランとの連結が完了しいたことになる。このとき、選択信号S36として「1」を、選択信号S37の下位3ビットとして「101」を、ラン選択信号S38として「0」を出力する。
【0122】
加減算器44の出力はセレクタ46に入力され、セレクタ46では、選択信号S37の下位3ビットに応じたラベル情報を出力するようになっている。なお、ここで、ラベルとは、第1ライン目のランと第2ライン目のランとを統合した領域のことをいい、ラベル情報とは、そのラベルの始点、大きさ等を表す。
【0123】
選択信号S37の下位3ビットが「000」のとき、セレクタ46は、ラベルの始点座標として(X1、Y1)、ラベルの大きさとして(M1、Y−Y1+1)を出力する(図15(a)参照)。
【0124】
選択信号S37の下位3ビットが「001」のとき、比較器43での比較結果から座標値Y0とY1のうち小さい方の値をYpとすると、セレクタ46は、ラベルの始点座標として(X1、Yp)、ラベルの大きさとして(X0+M0−X1+1、Y−Yp+1)を出力する(図15(b)参照)。
【0125】
選択信号S37の下位3ビットが「010」のとき、セレクタ46は、ラベルの始点座標として(X1、Yp)、ラベルの大きさとして(M1、Y−Yp+1)を出力する(図15(c)参照)。
【0126】
選択信号S37の下位3ビットが「011」のとき、セレクタ46は、ラベルの始点座標として(X0、Yp)、ラベルの大きさとして(M0、Y−Yp+1)を出力する(図15(d)参照)。
【0127】
選択信号S37の下位3ビットが「100」のとき、セレクタ46は、ラベルの始点座標として(X0、Yp)、ラベルの大きさとして(X1+M1−X0+1、Y−Yp+1)を出力する(図15(e)参照)。
【0128】
選択信号S37の下位3ビットが「101」のとき、セレクタ46は、ラベルの始点座標として(X0、Y0)、ラベルの大きさとして(M0、Y−Y0+1)を出力する(図15(e)参照)。
【0129】
選択信号S36は、セレクタ46から出力されたラベル情報の記憶先として、内部演算用のメモリ47、ラベリング結果出力用のバッファメモリ48のいずれか一方を選択するものである。すなわち、判定テーブル45で第6の判定条件が満たされて、ランの連結が終了したとき(図15(f)参照)のみ、選択信号S36は「1」となり、そのとき、セレクタ46から出力されたラベル情報(信号S42)を、抽出された1つのラベルの外接矩形の情報としてメモリ48に記憶するようになっている。選択信号S36が「0」のとき、セレクタ46から出力されたラベル情報(信号S42)は、メモリ47に記憶されるようになっている。
【0130】
メモリ47は、セレクタ46から信号S42として出力されるラベル情報、すなわち、判定テーブル45で、例えば、第1ライン目と第2ライン目のランを判定した結果、得られたランの連結された領域の始点座標、大きさ等を含む、1ライン分のランの情報を記憶するメモリで、例えば、比較器43a〜43eで、第1ライン目と第2ライン目のランに対して比較処理を行っている場合、図15を参照して説明したような、それらのランの連結された領域の始点座標、大きさ、第1ライン目のランと連結されなかった第2ライン目のランの情報等が第2ライン目のラン情報として記憶されている。
【0131】
メモリ48には、1画像分(画像1ページ分)のランをもとに、判定テーブル45で判定した結果得られたラベルの情報、すなわち、複数のランが統合された結果得られたラベルの外接矩形の情報と記憶されるようになっていて、判定テーブル45で非連結と判定されたとき、1つの統合されたラベルが抽出されたとして、その外接矩形の始点座標と大きさが図14に示したように記憶されるようになっている。
【0132】
ラン選択信号S38は、比較器43a〜43eにおける比較対象および加算減算器44の演算対象を更新する際、第1ライン目のラン情報(メモリ41に記憶されているラン情報で信号S41として出力される)、第2ライン目のラン情報(ラン膨脹信号S2)のどちらにするかを選択するためのものである。すなわち、ラン選択信号S38が「0」の場合(判定テーブル45で第3、第5、第6の判定条件のいずれかを満たした場合)、第1ライン目のラン情報(信号S41)を比較対象および演算対象の次のランとして更新するようになっている。また、ラン選択信号S38が「1」の場合(判定テーブル45で第1、第2、第4の判定条件のいずれかを満たした場合)、第2ライン目のラン情報(ラン膨脹信号S2)を比較対象および演算対象の次のランとして更新するようになっている。
【0133】
セレクタ42では、選択信号S36が「1」で、ランの連結が終了したと判定されたとき、メモリ41に記憶された第1ライン目のラン情報(信号S41)を出力し、「0」のとき、セレクタ46からの出力であるラベル情報(信号S42)を出力するようになっていて、セレクタ42からの出力により比較器43a〜43eでの比較対象および加算減算器44での演算対象を更新するようになっている。
【0134】
以上の処理を1ライン終了まで繰りかえす。
第1ラインの処理が終了すると、メモリ47に記憶された第2ライン目のラン情報(信号S42)はセレクタ40を介してメモリ41に記憶され、その後、第2ライン目のラン情報S41と第3ライン目のラン情報(ラン膨脹信号S2)とにより前述の演算が行われる。以上を1ページ終了まで行う。
【0135】
以上説明した処理の結果、メモリ48には、1ページ内に抽出されたラベルの情報、すなわち、複数のランが統合された結果得られたラベルの外接矩形の情報として、その外接矩形の始点座標と大きさが図14に示したように記憶される。
【0136】
次に、判定手段5では、メモリ48に記憶された外接矩形情報S4をもとに、外接矩形として抽出された領域(ラベル)の種別を識別する。
識別方法の原理は、例えば、ラベルの大きさ(長さ)をx方向にXs、y方向にYsとしたとき、文字列領域は細長いという特徴を利用して、文字列領域の大きさに適当な制限を設定し、適当な閾値Ta、Tb、Tc、Tdを用いて、
Ta<Xs<Tb
かつ
Tc<Ys<Td
のとき、その領域を文字領域と判定する。さらに、写真領域についても同様で、その大きさに適当な制限を設定し、別の閾値を利用して、写真領域を判定する。
【0137】
なお、ここでは、抽出されたラベルの大きさを基にその領域の画像の種別を判定しているが、ラベル領域内の黒画素の密度、白/黒画素判定回数、平均濃度等様々な方法により判定が可能である。さらに、これらの情報により、文字領域の判定のみならず写真領域や網点領域の判定も可能となる。
【0138】
判定手段5での判定結果(信号S5)をもとに、後続の処理部、あるいは、画像処理装置において、それぞれの画像領域の特徴に応じた画像処理を施し、高品質な複製画像の生成等を行うようになっている。
【0139】
以上、説明したように、上記実施例によれば、入力画像の画素信号S0について2値化手段1で、(1)2値化誤差を周辺画素に分配し階調を保存する誤差拡散法による2値化処理(第1の2値化処理)、(2)注目画素の2値化誤差を次に処理される画素において補償し階調を保存する2値化処理(第2の2値化処理)、(3)ランダムな閾値による2値化処理(第3の2値化処理)、(4)閾値が規則的に変化する組織ディザ法による2値化処理(第4の2値化処理)、(5)注目画素を含む(n×n)のウインドウ内の平均値を閾値とする2値化処理(第5の2値化処理)のいずれかの2値化処理を行って、2値化画像を求め、2値化画素信号S1を出力し、ラン膨脹手段2で、2値化画素信号S1をもとに、2値化画像の黒画素を膨脹する処理を行い、黒画素部(ラン)を求め、ラン膨張信号S2を出力し、ラベリング手段3、外接矩形抽出手段4で、ラン膨張信号S2をもとに連結するランを1つの領域として統合(ラベリング)し、その統合された領域(ラベル)に外接する矩形の位置、大きさを求め、その結果を外接矩形情報S4として出力し、判定手段5で信号S4をもとに、外接矩形の大きさから文字画像領域であるか、写真画像領域であるかを判定し、その結果を信号S5として出力することにより、文字画像領域、写真画像領域といった特徴の異なる画像領域を正確に抽出し、その画像領域の識別が容易に行える。
【0140】
特に、写真画像領域の識別が高精度に行うことが可能となる。入力画像について2値化手段1で2値化を行う際、画像がぼんやりした写真の背景画像であるグレー領域も階調処理されるので、ラベル膨脹手段2、ラベリング手段3、外接矩形抽出手段4において、膨脹化および矩形化を行うことによって、写真画像全体の輪郭が消失されず、正しく抽出される。
【0141】
さらに、写真画像領域の抽出、識別が正確に行えるので、その後、その画像領域に応じて適切な画像処理を行うことによりファクシミリや複写機等様々な画像処理装置において、画像を伝送する際に伝送効率を向上させたり、複製画像を生成する際に画質を向上させることが可能となる。
【0142】
【発明の効果】
以上のように、本発明によれば、処理対象画像中の文字や写真といった特徴の異なる画像領域を正確に抽出して、その画像領域を識別することが容易に行え、画像処理の精度の向上が図れる画像処理装置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る画像処理装置の全体の構成を概略的に示したブロック図。
【図2】第1の2値化処理の具体例について説明するための図。
【図3】第2の2値化処理の具体例について説明するための図。
【図4】第3の2値化処理の具体例について説明するための図。
【図5】第3の2値化処理におけるランダムな閾値の発生方法の具体例について説明するための図。
【図6】第4の2値化処理における組織的ディザ法の原理を説明するための図。
【図7】第5の2値化処理で用いられるウインドウの概念を説明するための図。
【図8】第5の2値化処理で用いられる閾値としてのウインドウ内の平均濃度値を算出するための平均値算出回路の具体例を示した図。
【図9】ラン膨脹処理の原理を説明するための図で、図9(a)は、処理対象の2値化画像の黒画素の具体例を示し、図9(b)は、ラン膨脹処理を行った結果得られたランの具体例を示した図。
【図10】ラン膨脹処理を実行するための具体的な回路構成を示した図。
【図11】ラン膨脹処理について説明するための図で、図11(a)は、ラン膨張手段により抽出されたランの具体例を示し、図11(b)は、図11(a)に示したランについて、得られるラン情報の記憶例を示したものである。
【図12】図11(a)に示したランに対してラベリングした結果、その統合された領域に関する情報の記憶例を示した図。
【図13】外接矩形の抽出方法の原理について説明するための図で、図13(a)は、外接矩形を抽出する対象となる統合領域の具体例を示し、図13(b)、図13(c)は、図13(a)の統合領域の外接矩形を求める手順を説明するものである。
【図14】外接矩形抽出手段4における外接矩形情報の記憶例を示した図。
【図15】外接矩形の大きさを判定するための判定条件を説明するための図で、図15(a)は、第1の判定条件の場合、図15(b)は、第2の判定条件の場合、図15(c)は、第3の判定条件の場合、図15(d)は、第4の判定条件の場合、図15(e)は、第5の判定条件の場合、図15(f)は、第6の判定条件の場合を説明するものである。
【図16】ラベリング手段および外接矩形抽出手段の回路構成の具体例を示した図。
【図17】従来の画像領域判別方法の手順を説明するための図。
【符号の説明】
1…2値化手段、2…ラン膨脹手段、3…ラベリング手段、4…外接矩形抽出手段、5…判定手段、S0…画素信号、S1…2値化画素信号、S2…ラン膨脹信号、S3…統合された領域(ラン)の情報信号、S4…外接矩形情報信号、S5…判定信号。
Claims (1)
- 種類の異なる複数の画像を含む処理対象画像における注目画素の画素値を、あらかじめ設定された閾値範囲内をランダムに変化して決定される閾値をもとに2値化し、2値化画素信号を提供する2値化手段と、
この2値化手段から提供される2値化画素信号をもとに、黒画素を主走査方向に膨張する膨張手段と、
この膨張手段で黒画素を膨張して得られた複数の黒画素領域を連結する連結手段と、
この連結手段で連結された領域の外接矩形を抽出する外接矩形抽出手段と、
この外接矩形抽出手段で抽出された外接矩形の特徴をもとに、その外接矩形の領域にある画像の種別を前記各外接矩形ごとに判別する画像判別手段とを具備し、
前記2値化手段は、
直列に接続された複数のシフトレジスタと、
前記複数のシフトレジスタの出力信号のうち2以上の出力信号が供給され、前記複数のシフトレジスタの初段のシフトレジスタに排他的論理和演算結果を供給する排他論理和回路と、
前記複数のシフトレジスタの出力信号から得られる閾値と、前記注目画素の画素値とを比較し、比較結果を前記2値化画素信号として提供する比較回路とを具備することを特徴とする画像処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11745895A JP3749282B2 (ja) | 1995-05-16 | 1995-05-16 | 画像処理装置 |
US08/640,718 US5687252A (en) | 1995-05-16 | 1996-05-01 | Image processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11745895A JP3749282B2 (ja) | 1995-05-16 | 1995-05-16 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08317197A JPH08317197A (ja) | 1996-11-29 |
JP3749282B2 true JP3749282B2 (ja) | 2006-02-22 |
Family
ID=14712176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11745895A Expired - Fee Related JP3749282B2 (ja) | 1995-05-16 | 1995-05-16 | 画像処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5687252A (ja) |
JP (1) | JP3749282B2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1098613A (ja) * | 1996-09-24 | 1998-04-14 | Sharp Corp | 画像処理装置 |
JP3881439B2 (ja) * | 1998-01-23 | 2007-02-14 | シャープ株式会社 | 画像処理装置 |
WO2000027640A1 (en) * | 1998-11-09 | 2000-05-18 | Silverbrook Research Pty Ltd | Printer and methods of operation |
US7805000B2 (en) * | 2000-05-01 | 2010-09-28 | Minolta Co., Ltd. | Image processing for binarization of image data |
US6704449B1 (en) | 2000-10-19 | 2004-03-09 | The United States Of America As Represented By The National Security Agency | Method of extracting text from graphical images |
US7068398B2 (en) * | 2001-11-07 | 2006-06-27 | International Business Machines Corporation | System and method for efficient tile generation from complex raster data |
US20050078867A1 (en) * | 2003-10-14 | 2005-04-14 | Kabushiki Kaisha Toshiba | System and method for generating black and white reproductions of color documents |
EP1555804A3 (en) * | 2004-01-19 | 2006-08-16 | Ricoh Company, Ltd. | Image processing apparatus, image processing program and storage medium |
US20070098277A1 (en) * | 2004-03-09 | 2007-05-03 | Takashi Watanabe | Transmitting apparatus, image processing system, image processing method, program, and recording medium |
US7460735B1 (en) * | 2004-09-28 | 2008-12-02 | Google Inc. | Systems and methods for using image duplicates to assign labels to images |
JP4329764B2 (ja) | 2006-01-17 | 2009-09-09 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置および罫線抽出プログラム |
JP4424309B2 (ja) | 2006-01-23 | 2010-03-03 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、文字判定プログラム、および文字判定方法 |
JP4491488B2 (ja) * | 2008-03-03 | 2010-06-30 | シャープ株式会社 | 画像処理装置、画像読取装置、画像データ出力処理装置、および画像処理方法 |
US20090323134A1 (en) * | 2008-06-30 | 2009-12-31 | Kabushiki Kaisha Toshiba | Apparatus and method for generating segmentation data of a scanned image |
JP2014082541A (ja) * | 2012-10-12 | 2014-05-08 | National Institute Of Information & Communication Technology | 互いに類似した情報を含む複数画像のデータサイズを低減する方法、プログラムおよび装置 |
CN110674332B (zh) * | 2019-08-01 | 2022-11-15 | 南昌市微轲联信息技术有限公司 | 基于ocr与文本挖掘的机动车数字电子档案分类方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0722330B2 (ja) * | 1990-01-10 | 1995-03-08 | 富士ゼロックス株式会社 | 画像処理装置の画像領域識別方式 |
US5335290A (en) * | 1992-04-06 | 1994-08-02 | Ricoh Corporation | Segmentation of text, picture and lines of a document image |
-
1995
- 1995-05-16 JP JP11745895A patent/JP3749282B2/ja not_active Expired - Fee Related
-
1996
- 1996-05-01 US US08/640,718 patent/US5687252A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US5687252A (en) | 1997-11-11 |
JPH08317197A (ja) | 1996-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3749282B2 (ja) | 画像処理装置 | |
US5438634A (en) | Dither processing method | |
US5572603A (en) | Image processing method and device using such method | |
US6373990B1 (en) | Image processing utilizing luminance-density conversion | |
JPH08228282A (ja) | 文書画像の処理方法及びバイナリ画像画素処理装置 | |
JPH1084475A (ja) | 画像領域判別方法および画像処理装置 | |
EP0685959B1 (en) | Image processing apparatus for identifying character, photo and dot images in the image area | |
JPH02100575A (ja) | 画像処理装置 | |
JPH02165775A (ja) | 画像処理装置 | |
JP3514050B2 (ja) | 画像処理装置 | |
JP2880541B2 (ja) | ディザ画像の中間調推定方式 | |
JP3455078B2 (ja) | 画像処理装置及び画像処理方法 | |
JP3245600B2 (ja) | 画像処理装置 | |
JP2874592B2 (ja) | 文字・写真・網点領域を判別する画像処理装置 | |
JPS6359272A (ja) | 画像処理装置 | |
JP2898321B2 (ja) | ディザ画像の中間調推定方式 | |
JPH0974485A (ja) | マルチトーンをもつバイナリ画像の圧縮及び復元のための装置及び方法 | |
JP3679522B2 (ja) | 画像処理方法及びその装置 | |
JPH07262351A (ja) | 画像処理装置及びその制御方法 | |
JPH06348834A (ja) | 画像処理装置 | |
JP2878695B2 (ja) | 画像処理装置および多値画像推定方法 | |
JPH06152960A (ja) | 画像処理装置 | |
JP2898322B2 (ja) | ディザ画像の中間調推定方式 | |
JP2934971B2 (ja) | 画像2値化処理装置 | |
JP2903175B2 (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040210 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040921 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050426 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050627 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051201 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091209 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091209 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101209 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |