JP3073837B2 - 画像領域分離装置及び画像領域分離方法 - Google Patents

画像領域分離装置及び画像領域分離方法

Info

Publication number
JP3073837B2
JP3073837B2 JP04221931A JP22193192A JP3073837B2 JP 3073837 B2 JP3073837 B2 JP 3073837B2 JP 04221931 A JP04221931 A JP 04221931A JP 22193192 A JP22193192 A JP 22193192A JP 3073837 B2 JP3073837 B2 JP 3073837B2
Authority
JP
Japan
Prior art keywords
area
image
run
pixel
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04221931A
Other languages
English (en)
Other versions
JPH0654180A (ja
Inventor
正司 田村
勝 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP04221931A priority Critical patent/JP3073837B2/ja
Publication of JPH0654180A publication Critical patent/JPH0654180A/ja
Application granted granted Critical
Publication of JP3073837B2 publication Critical patent/JP3073837B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば、複写機等の画
像処理装置で文字部と写真部が混在した多階調文書画像
の文字領域と写真領域を分離する画像領域分離装置に関
する。
【0002】
【従来の技術】複写機等の画像処理装置で、文字画像に
代表される2値画像と写真画像に代表される階調画像を
含む文書画像を処理する場合、文字画像では信号レベル
の変化が急峻であるのに対し、写真画像は信号レベルの
変化がゆるやかであるため、文字画像と写真画像では画
像の持つ特徴が異なる。そのため、複写する際に文字画
像にはエッジ強調、写真画像には色変換などの所望の画
像処理を行うなど、文字領域と写真領域を分離して処理
する必要が生じる。
【0003】従来の機器搭載用の領域分割法について以
下に説明する。画像の領域分割アルゴリズムを搭載する
画像関連機器として、ディジタルファクシミリ装置やデ
ィジタル複写機の様なスキャナとプリンタ一体型の機器
が考えられる。ディジタル複写機では、スキャナ部分で
読み取った原稿画像をそのままあるいは所定の画像処理
を施した後、プリンタ部分で用紙に記録する。一方、
ィジタルファクシミリ装置では、スキャナ部分で読み取
った原稿画像を通信回線を介して伝送し、受信側のファ
クシミリ装置内のプリンタ部分で用紙に記録するという
大まかな流れを追っており、スキャナ部分からプリンタ
部分へデータが流れるという点においてディジタル複写
機と共通である。
【0004】画像関連機器での画像処理として領域分割
が必要な理由は、原稿画像に文字や図形などの2値画
像、あるいは写真などの中間画像、網点形成による疑似
中間調画像が含まれていることが挙げられる。以下、簡
単のために2値画像を文字画像、中間調画像を写真画
像、疑似中間調画像を網点画像と呼ぶ。ディジタルファ
クシミリ装置及びディジタル複写機の多くの場合、スキ
ャナ部分では原稿全体を中間調画像として読み取るが、
プリンタ部分では2値画像として記録するため、読み取
った原稿画像に対して2値化処理を行う必要が生じる。
また2値化の際画質の劣化を防止するために、文字画像
には解像度の保存、写真画像には階調性の再現、網点画
像にはモアレ縞の低減といった画像の性質に応じた要求
があり、これらの画像を一つの方法で良好に2値化する
のは困難である。従って、読み取り画像に対して領域分
割を施し文字画像、写真画像、網点画像を分離し、各々
の画像に適した2値化処理を行うことが一般的である。
【0005】また、画像関連機器に領域分割などの画像
処理装置を搭載するには、機器の特性を考慮して以下の
ような制約を受けることが多い。 (1)使用するメモリを最少限にとどめて処理を行う。 (2)スキャナ部分からの入力データに対してリアルタ
イムに近い高速処理を行う。 (1)は全体の装置コストを低減するための制約であ
り、特にファクシミリ装置での処理に要求される。また
(2)は、処理の高速性が必要であるのと同時に(1)
の制約に負うところもある。少ないメモリで処理を実現
するためには、スキャナあるいは通信回線からの入力デ
ータに対して数行毎の逐次処理が必要になる。また、こ
れらの条件の他に、領域分割の精度が保証される必要が
ある。以下に、文字画像と写真画像が混在する文字画像
から各領域を分離する手法として既に報告されている機
器搭載に適した領域分割法について説明する。
【0006】従来例1.非背景画素のランレングスを用
いる方法 文字画像と写真画像が混在する画像を主走査方向にスキ
ャンした場合、文字画像を構成する画素については非背
景画素のランレングスが短く、写真画像を構成する画素
については非背景画素のランレングスが長いという特徴
を用いた方法である。ライン逐次処理で実時間処理が行
えると共に、方式が単純で回路も構成し易いという特徴
がある。この方式を実現する場合のブロック図の例を図
22に示す。図22に従ってアルゴリズムの概要を説明
する。色相検出部では、各画素毎にY,M,C,K,
W,B,G,Rの8色の色相のいずれかを検出する。ブ
ロック化部では、数画素例えば4×4から8×8画素程
度に各画素をブロック化する。ここで作られたブロック
毎にブロック判定部で最大頻度色を判定し、それをブロ
ック色に判定する。また非背景のブロックについて、主
走査ランカウント部でブロックのランレングスを計測
し、判定及び抽出部で所定のしきい値以下ならば文字画
像候補に、しきい値以上ならば写真画像候補に判定す
る。また副走査方向のエッジ検出部では、注目ブロック
近傍の数ブロックの範囲にエッジを含むブロックがある
場合は文字画像部候補に判定し、エッジを含むブロック
がない場合は写真画像部候補に判定する。この処理は、
主走査方向のランレングスの判定で文字に含まれる横方
向の線が写真画像部に誤判定されることを防止するため
に、補正の意味で用いられる。この手法を用いることに
より写真と文字は良好に分離される。しかし、複数の画
素をブロック化して判定しているため、写真と背景の境
界部分の判定が厳密でない。これは各領域毎に適切な2
値化を行うような場合、境界領域で2値化方法の違いに
よるブロック歪の原因になる。また、文字サイズや写真
サイズによってランレングスの適切なしきい値が設定し
にくく、汎化するために動的しきい値決定法を導入する
などの工夫が必要である。
【0007】従来例2.小領域内の最大濃度差を用いる
方法 文字画像は濃度変化が急峻で背景と非背景画素にピーク
を持ち、写真画像は濃度分布が比較的平坦で濃度変化が
緩やかであるという特徴を利用した方式である。この方
式は、入力画像を数画素からなるブロック、あるいは画
素を逐次処理するために注目画素の周囲数画素を参照す
るウィンドウ単位に処理を行う。また、ラインを逐次処
理するため実時間処理が行えると共に、4ライン程度の
メモリと簡単な論理回路で実現できるという特徴があ
る。図23にこの方法を実現する場合のブロック図を示
す。図23に従ってアルゴリズムの概要を説明する。処
理系は3ラインのラインバッファを持ち、入力画像信号
が格納される。これを注目画素を中心にした例えば5×
3画素のウィンドウについて分割する。次に像域分離部
(画像領域分離部)で、ウィンドウ内の最大濃度差が所
定のしきい値T1以上ならば網点の可能性があるとして
網点判定を行う。網点判定の概略は、2値化後の0→1
あるいは1→0変化点数を計測し変化点数が所定のしき
い値以上ならば網点候補に、しきい値以下ならば非網点
候補に判定する。また、この時網点判定の精度を向上さ
せるためにパターンマッチングを用いた判定も併用す
る。次に、しきい値T1との比較で文字または写真画像
候補に判定された画素を含むウィンドウは、ウィンドウ
内の最大濃度差が、T1より大きい値であるT4以上の
時文字領域に、T4以下の時写真領域に細分される。ま
た、像域分離A変数は新たに導入された変数であり、網
点領域に属する度合いの強さを表す。ある網点領域候補
に対してメモリ2に格納された近傍画素の画像分離A変
数を参照して、ヒステリシスを持った網点検出を行う。
同様に文字領域候補のある画素に対してメモリ3に格納
された周囲8画素の像域分離Bを変数を参照すること
で、ヒステリシスを持った文字領域の検出を行う。領域
の検出にヒステリシスを持たせたのは、誤判定領域を減
少させることが目的の一つである。この方法を用いてウ
ィンドウ内の最大濃度差を用いて文字領域と写真領域を
分離すると、写真に含まれる濃度変化の急峻な領域が文
字に誤判定される。これは像域分離B変数を用いること
で減少するが、排除することはできていない。このこと
は、最終的に各画像領域を2値化して再度統合する場合
は問題にならないと考えられるが、文字画像と写真画像
の分離精度という点では改善の余地がある。
【0008】従来例3.その他の従来手法 文字画像、写真画像を含む画像を分離する方法として、
既に報告されているものを図24に示す。図24の方法
はいずれもブロック毎の処理を行うものであり、ブロッ
ク内の最大濃度差を用いる方式、パターンマッチングを
用いる方式、エッジを形成する画素の量を計算する方式
がある。また文字領域と写真領域の分離については、#
1はブロックまたは注目画素を含むウィンドウ内の最大
濃度差を用いている。前述のようにこの方法では、写真
内の濃度変化が急峻な部分を文字として誤判定する。#
2ではエッジを形成する画素を含まないブロックを写真
に判定しているため、写真内のエッジ部分の画素が文字
もしくは網点に誤判定される。#4はブロック内のエッ
ジ画素密度を用いて画像の種類を判定するため、写真内
のエッジを含む画素が文字または網点に誤判定され、さ
らにつぶれた文字を検出できない。さらに、これらいず
れの方法も3×3あるいは4×4といったブロックサイ
ズに制約されるため、高精度の分離は不可能である。
【0009】従来例4.次に、図25は例えば、特開昭
58−3374号公報に示された従来の画像領域分離方
式を示すブロック図であり、図において109,110
は画像メモリ、111はブロックメモリ、112は2値
化回路、113は画質判定回路、114は組織的ディザ
のしきい値メモリ、115は一定しきい値のメモリ、1
16はしきい値メモリの切り替え回路、117,118
はスイッチである。
【0010】次に動作について説明する。まず、スイッ
チ117,118が図の位置にあったとき、原稿から読
み取られた画像情報は、スイッチ117のa側を経て画
像メモリ109に記憶される。1ブロックを4×4の1
6画素で構成した場合に4走査線に相当する画情報が記
憶されたところでスイッチ117はa側からb側に、ス
イッチ118はb側からa側に切り替わり、画情報を画
像メモリ110に書き込みしながら、同時に画像メモリ
109の内容を順次処理してゆく。画像メモリ109の
内容については、まず1ブロック相当の面情報がブロッ
ク・メモリ111に転送される。次にブロック・メモリ
111の内容から、画質判定回路113によりブロック
内の各画素のうち濃度レベルが最大のものと最少のもの
とを識別し、その差をあらかじめ定められたしきい値m
と比較して、写真領域であるか、文字領域であるかを判
定する。
【0011】切り替え回路116は、画質判定回路の判
定結果に基づき2値化のしきい値として、写真領域であ
れば組織的ディザのしきい値メモリ114、あるいは文
字領域であれば一定しきい値のメモリ115のいずれか
を選択する。2値化回路112は、このようにして選択
されたしきい値メモリ114あるいは115のいずれか
のしきい値データと、ブロック・メモリ111内の各画
素の濃度レベルとを比較して、比較結果を2値信号とし
て出力する。
【0012】画像メモリ109の内容がすべて処理さ
れ、画像メモリ110に次の4走査線相当の画像情報が
記憶されると、スイッチ117はb側からa側にスイッ
チ118はa側からb側に切り替わり、画像メモリ11
0の内容が処理されるというように順次画像情報を2値
化処理してゆく。
【0013】
【発明が解決しようとする課題】従来の画像領域分離方
式は以上のように構成されているので、写真画像に含ま
れる物体の輪郭などの濃度レベルの変化が急峻な領域が
文字領域に誤判定され、かすれ文字など2値画像であり
ながら濃度レベルの変化が緩やかな領域が写真領域に誤
判定される。そのため、画像全体として領域の分離精度
が低いという問題点があった。また、画像を複数画素か
らなるブロックに分割して処理を行っているため、写真
画像あるいは文字画像の境界領域での領域判定の精度が
低いという問題点があった。
【0014】この発明は上記のような問題点を解決する
ためになされたもので、写真画像領域に含まれる濃度レ
ベルの変化が急峻な領域を写真領域に、かすれ文字を文
字領域に正しく判定し、分離できるとともに、文字領域
及び写真領域の境界を正確に分離できる画像領域分離装
置及びその方法を得ることを目的にしている。
【0015】
【課題を解決するための手段】第1の発明に係る画像領
域分離装置は、写真及び文字等の異なる複数種類の非背
景領域とこの非背景領域が存在しない背景領域とからな
る画像情報から写真や文字等の異なる複数種類の非背景
領域を分離する為に考えられたものであり、以下の要素
を有するものである。 (a)背景色画素から構成される背景領域と非背景色画
素から構成され、写真や文字等の異なる複数種類の非背
景領域等を有する画像情報を走査することによりこれを
入力する入力手段、(b)上記入力手段により各走査毎
に入力した画像情報の中から、非背景色画素を検出する
非背景色画素分離手段、(c)上記非背景色画素分離手
段により分離された走査方向に一つ以上連続する非背景
色画素を一つのランとしその長さを検出するラン検出手
段、(d)上記非背景色画素分離手段により分離された
非背景色画素が非背景領域のエッジを構成するエッジ画
素であるかを判定するエッジ画素判定手段、(e)上記
ラン検出手段により、検出されたランの中でエッジ画素
判定手段によりエッジ画素として判定された非背景色画
素の割合に基づき、ラン検出手段により検出されたラン
が写真や文字等の異なる種類の非背景領域のうちのいず
れの種類の非背景領域に属するランであるかを示すラン
の属性を判定する領域判定手段。
【0016】第2の発明に係る画像領域分離装置は、第
1の発明に係る画像領域分離装置にさらに領域判定手段
により判定された隣接する複数のランの属性を互いに参
照してランの属性を補正する領域属性補正手段を備えた
ものである。
【0017】第3の発明に係る画像領域分離方法は、以
下の工程を有するものである。 (a)写真や文字等の複数種類の非背景領域とそれ以外
の背景領域から構成された画像情報をライン毎に走査し
て入力する入力工程、(b)上記入力工程により入力し
た画像情報の各ラインの中から非背景領域を検出する非
背景領域検出工程、(c)上記非背景領域検出工程によ
り検出した非背景領域の中から、非背景領域のエッジと
なる部分を検出するエッジ検出工程、上記非背景領域検
出工程とエッジ検出工程により、検出された非背景領域
とそのエッジとなる部分の割合に基づいて非背景領域検
出工程により検出された非背景領域の種類を判定する領
域判定工程。
【0018】
【作用】第1の発明における画像領域分離装置は、領域
判定手段においてラン検出手段が検出したランの属性を
判定する。ここでランの属性とは、そのランが写真領域
や文字領域等の複数種類の非背景領域のうちのいずれの
背景領域に属するランであるかを示す情報であり、領域
判定手段はこの属性をエッジ画素判定手段により判定さ
れたエッジ画素が、そのランの中にどのぐらい含まれて
いるかという割合に基づいて文字領域か写真領域かを判
定する。ラン検出手段で検出されたランの中のエッジ画
素の割合が多い場合には、文字領域として判定し、ラン
検出手段により検出したランの中のエッジ画素として判
定された割合が小さい場合には写真領域として判定す
る。一般に文字は白と黒が鮮明に分かれており、これに
対して写真は白と黒がおだやかに変化していく場合が多
い。従って、ラン検出手段により一つのランに属する連
続した非背景色画素の中でエッジ画素として判定された
非背景色画素の割合が多い場合には、文字であると判定
することが可能になる。反対に写真領域の場合は文字領
域とは異なり、非背景色画素が連続し、かつ、なだらか
な変化を呈するためにエッジ画素であると判定される部
分が少ないため、ランの中でエッジ画素として判定され
た非背景色画素の割合が小さい場合には、写真領域であ
ると判定することが可能になる。このように、領域判定
手段は、非背景色画素から成る主走査方向のランを、各
ランにおけるエッジ画素含有率が高いと該ランを文字領
域に判定し、エッジ画素含有率が低いと写真領域に判定
する。
【0019】第2の発明に係る画像領域分離装置は、第
1の発明に於ける画像領域分離装置に対して更に、領域
属性補正手段を備えており、この領域属性補正手段は、
領域判定手段により、判定された隣接する複数のランの
属性を参照してランの属性を補正するものであり、前述
した領域判定手段のみでは、そのランの属性が正しく判
定されない場合を考慮して、そのランに隣接するランの
属性を参照することにより、そのランの属性を補正する
ことにより、ランの属性を正しく判定しようとするもの
である。たとえば、前述したように非背景色画素から成
る主走査方向のランを、各ランにおけるエッジ画素含有
率が高いと該ランを文字領域に判定し、エッジ画素含有
率が低いと写真領域に判定するが、領域属性補正手段は
注目するランに対して、副走査方向に隣接するランが文
字領域であるか写真領域であるかを参照して注目するラ
ンの属性を補正する。
【0020】第3の発明に係る画像領域分離方法は、入
力工程により背景領域と複数種類の非背景領域から構成
された画像情報をライン毎に入力したのちに、非背景領
域検出工程が各ラインの中から非背景領域を検出する。
更にエッジ検出工程は非背景領域検出工程により検出さ
れた非背景領域の中から非背景領域のエッジとなる部分
を検出する。そして、領域判定工程は非背景領域のエッ
ジとなる部分の割合に基づいて非背景領域の種類が写真
領域であるか文字領域であるかの判定を行う。領域判定
工程が行う領域の種類の判定方法は、第1の発明で述べ
た領域判定手段における領域の種類の判定方法と同様の
原理を用いているものであり、ここではその説明を省略
する。
【0021】
【実施例】実施例1.まず、この実施例に係わる画像領
域分離装置の概要について述べる。この実施例は画像デ
ータを入力し、注目画素を含むN×Nのウィンドウにつ
いてウィンドウ内の平均信号レベル値Dav,最大信号
レベル差Ddifを求め、Davを所定のしきい値T1
と比較することにより非背景色画素を抽出し、該非背景
色画素についてそれまでの主走査方向の非背景色画素列
のランレングスCrunが0である時Dav<T1/2
またはDdif>T2(T2は所定のしきい値)、Cr
unが0でない時はDdif>T2を満足する場合、注
目画素を画像中のエッジを構成する画素であると判定す
る。また、主走査により同一ランに含まれるエッジを構
成する画素数CedgがランレングスCrunに対して
所定の割合以上である場合、このランを画像中の文字領
域、それ以下である場合写真領域に判定する。(ただ
し、ここでの”<,>”は画像信号が輝度値で表されて
いる場合に成り立つ。)
【0022】以下、この発明の一実施例を図について説
明する。図1において、1は注目画素を中心としたウィ
ンドウ内の平均信号レベルを算出する平均信号レベル算
出回路、2は該ウィンドウ内の最大信号レベル差を算出
する最大信号レベル差算出回路、3は平均信号レベル算
出回路1で算出したウィンドウ内の平均信号レベルをも
とに注目画素が非背景色画素かどうかを判定する非背景
色画素分離回路、4は注目画素が画像中のエッジ部分を
構成する画素かどうかを判定するエッジ画素判定回路、
5は非背景色画素分離回路3で非背景色画素と判定され
た画素について主走査方向の連続数を係数するランカウ
ンタ、6はエッジ画素判定回路4でエッジを構成する画
素と判定された画素が同一ランの中で何画素あるかを計
数するエッジ画素カウンタ、7は非背景色画素からなる
ランについてランカウンタ5、エッジカウンタ6の計数
値をもとに該ランが文字領域であるか写真領域であるか
を判定する領域判定回路、8は入力される4ライン分の
画像信号を保持するラインバッファでありライン単位の
リングバッファを構成する。
【0023】次に図2はこの実施例による画像領域分離
装置で扱う画素ウィンドウの構成を示す図である。図2
において、画素ウィンドウは4×4画素からなり、11
は画素ウィンドウ内の注目画素である。
【0024】次に、この発明による画像領域分離装置の
動作を、参照画素ウィンドウサイズを図2に示すような
4×4画素の大きさにし、画像信号が輝度値で入力され
る場合について、図1に沿って説明する。
【0025】画像領域分離装置に文字、写真混在の多階
調からなる文書画像データが入力されると4ライン分の
データがラインバッファ8に保存される。ラインバッフ
ァ8からは、注目画素を中心とした4×4画素の輝度デ
ータが平均信号レベル算出回路1及び最大信号レベル差
算出回路2に入力される。平均信号レベル算出回路1で
は以下の(式1)の演算を行い平均輝度レベルDavを
算出し、演算結果を非背景色画素分離回路3及びエッジ
画素判定回路4に送出する。
【0026】
【数1】
【0027】ここで、Dijは画素輝度を示す値であ
り、画素輝度は図3に示すように、ここでは0〜255
の値をとるものとする。即ち、画像情報が白と黒で構成
されている場合には、輝度が0の場合を黒とし、輝度が
255の場合には白とし、その間が灰色を示すものとす
る。なお、ここで輝度とは従来例で述べた濃度とは反対
の概念であり、輝度が0の場合には、濃度が255であ
り、輝度が255の場合には、濃度を0というものとす
る。
【0028】また、最大信号レベル算出回路2ではウィ
ンドウ内の画素の最大輝度値Dmax、最小輝度値Dm
inを用いて以下の(式2)の演算を行い、ウィンドウ
内の最大輝度差Ddifを算出し、演算結果をエッジ画
素判定回路4に送出する。 Ddif=Dmax−Dmin (式2) 例えば、この(式2)を図2を用いて説明すると、画素
ウィンドウの輝度が各画素についてD11〜D44まで
の16種類存在している場合、D32が最大輝度値Dm
axを示し、D44が最少輝度値Dminを示す場合、
DdifはD32−D44で計算されることになる。
【0029】次に非背景色画素分離回路3では、平均信
号レベル算出回路1から得られた該ウィンドウの平均濃
度値Davを所定のしきい値T1と比較することによ
り、(式3)を満たすとき注目する画素を非背景色画素
に判定する。 Dav<T1 (式3) 例えば、この(式3)を図3を用いて説明すると、T1
を輝度が230の場合に設定した場合に、輝度230か
ら255の間、即ちBの範囲は背景色画素と判定され、
輝度0から輝度230の間、即ち範囲Fの間は非背景色
画素として判定されることになる。
【0030】注目画素が非背景画素であると判定された
場合、エッジ画素判定回路4では平均濃度値Dav及び
最大輝度差値Ddifを用いて注目画素が画像のエッジ
を構成する画素であるかどうかを判定する。
【0031】次にランカウンタ5の動作について説明す
る。図4において、Xは画像情報の中の背景領域であ
り、Yは非背景領域である。ここでは、説明を簡単にす
るために、非背景領域Yを矩形領域とし、その主走査方
向におけるランレングスをLとする。又、Rは非背景領
域Yによって構成されるそれぞれのランを示している。
又、P1は画素ウィンドウの注目画素が非背景領域Yの
エッジにある場合を示し、P2は画素ウィンドウの注目
画素が非背景領域Yの領域内にある場合を示している。
ランカウンタ5は画素ウィンドウがP1の位置にくるま
では値が0を示しており、画素ウィンドウがP1の位置
に来た場合に非背景領域Yがスタートしていることによ
り、そのランカウンタをカウントアップし始める。その
後画素ウィンドウの注目画素がP1からP2に移動し、
更に、非背景領域Yを通過するまでランカウンタがカウ
ントアップされることにより、ランの中に含まれる非背
景色画素の数がランカウンタによりカウントされること
になる。
【0032】ランカウンタ5が0であることは、これま
での走査部分は非背景色画素ではなく、ランカウンタ5
が1になるということは、注目画素が孤立点もしくはラ
ンの先頭の点であることを意味する。エッジ画素判定回
路4はランカウンタ5を参照して、ランカウンタ5の値
が0の時(式4)と(式5)を、ランカウンタ5の値が
0でない時(式5)を実行する。 Dav<T1/2 (式4) Ddif>T2 (式5)
【0033】図5は(式4)と(式5)の意味を説明す
るための図である。図5(a)は非背景色画素から構成
された写真領域の例を示す図であり、図5(b)は、文
字領域の例を示した図である。まず、(式5)の意味に
ついて図5(b)の文字領域の例を用いて説明する。図
5(b)の文字領域の場合のように、白と黒の画素がた
びたび変化するような場合には、画素ウィンドウの最大
輝度差Ddifは大きな値をとることになる。従って文
字領域がスタートする場合、及び文字領域が終了する場
合には、(式5)を用いてそのエッジを検出することが
可能である。しかしながら、(式5)のみを用いてエッ
ジを検出しようとする場合、図5(a)に示すように、
白と黒の画素がおだやかに変化する写真領域の場合に
は、最大輝度差Ddifがいずれの画素ウィンドウの場
合でも、T2というしきい値を越えない場合が有り得
る。たとえば、図5(a)において、S1の位置から実
際のランレングスがスタートしているにも係わらず、
(式5)のみをエッジの判定に用いている場合には、最
悪の場合、S1からS2におけるすべての位置におい
て、画素ウィンドウの最大輝度差DdifがT2を越え
ずに、エッジと判定されない場合が存在する。このよう
な、不都合を改善するために(式4)を用いている。す
なわち(式4)は画素ウィンドウの平均輝度レベルDa
vがしきい値T1/2の値よりも小さい場合に、すなわ
ち画素ウィンドウの平均輝度がある輝度よりも小さくな
ってより黒に近づいてきた場合に、その画素をエッジと
して判定するものである。例えば、図5(a)において
は、仮にS3において、画素ウィンドウがしきい値T1
/2よりも小さな平均輝度レベルDavとして算出され
た場合に、この位置をエッジとして判定することが可能
である。このようにして、ウィンドウの平均濃度値Da
vがT1/2より大きい場合も注目画素をエッジに該当
させる。注目画素がエッジを構成する画素であると判定
した場合は、ランカウンタ5及びエッジカウンタ6のカ
ウンタ値を1増加させる。すなわち以下の計算を行う。 ランレングス値Crun=Crun+1 エッジ計数値Cedg=Cedg+1 また、注目画素がエッジを構成する画素でないと判定さ
れた場合は、ランカウンタ5のみを1増加させる。
【0034】以上の動作を、主走査方向へ注目画素を1
画素づつ順次ずらしながら非背景色画素分離回路3で注
目画素が背景画素であると判定されるまで行う。ランカ
ウンタ5が0でない時、即ち非背景色画素のランが連続
している時、次の注目画素が非背景色画素分離回路3で
背景画素と判定された場合、それまでのランカウンタ5
のランレングス値Crunとエッジカウンタ6のエッジ
計数値Cedgを用いて領域判定回路7で(式6)の演
算を行いラン中のエッジ画素含有率を求め、所定のしき
い値T3について(式6)が成り立つとき該ランを文字
画像領域に属すると判定する。また(式6)が成り立た
ないとき該ランを写真画像領域に属すると判定する。 Cedg*10/Crun>T3 (式6)
【0035】上記(式6)の意味を図5を用いて説明す
る。図5に示すように、写真領域の場合には、E1のみ
がエッジとして判定されたものとする。S1からS2の
ランレングスが10であり、エッジが1個であると判定
された場合は、(式6)は1×10/10となり、T3
を5とした場合には、(式6)が成り立たないために、
このランは写真領域であると判定する。又、図5(b)
に示すように、E1〜E8の8個の非背景色画素がエッ
ジであると判定された場合には、(式6)は8×10/
10となり、T3が同じく5であるとした場合には、
(式6)が成り立ち、このランを文字画像領域に属する
と判定することになる。このようにして得られた、ラン
が文字領域か写真領域かという属性に基づいて原画像を
分離し、画像の2値化や先鋭化など文字画像、写真画像
それぞれに適した画像処理を領域別に施す。
【0036】以上のように、この実施例は、画像中の注
目画素を中心にしたN×N画素のウィンドウについて、
ウィンドウ内の画像信号の最大レベル値と最小レベル値
の差を求める最大信号レベル差検出手段と、該ウィンド
ウ内の画像信号の平均レベル値を求める平均信号レベル
検出手段を備えると共に、前記平均信号レベル値を用い
て非背景色画素を分離する非背景色画素判定手段と、前
記平均信号レベル値と最大信号レベル差値を用いて注目
画素が画像中のエッジを構成する画素であるか判定する
エッジ判定手段と、連続する非背景色画素のランレング
スを計測するランレングス計測手段と、前記エッジ判定
手段でエッジを構成すると判定された画素を同一ラン中
で計数するエッジ画素数手段と、前記ランレングス計測
手段及びエッジ画素数計数手段の計測結果に基づいて注
目する非背景色画素からなるランを文字領域であるか写
真領域であるかを判定するラン属性判定手段を備えたこ
とを特徴とする。
【0037】この実施例によれば、画像領域分離装置を
入力される画像データにおいて、注目画素を含むN×N
画素のウィンドウを用いて処理するようにしたので、注
目画素1画素だけを対象に領域属性判定を行う場合に比
べて周囲画素を参照することにより精度の高い文字領域
と写真領域の分離が行えるだけでなく、文書内の画像ノ
イズ点を文字または写真領域候補として誤抽出すること
がなくなる。また、注目画素を含むN×N画素のブロッ
ク単位で処理する場合に比べて、画像領域での分離精度
が向上する。
【0038】また、ウィンドウ内の平均信号レベル値D
av、最大信号レベル差値Ddifについてそれまでの
主走査方向の非背景色画素列のランレングスCrunが
0である時Dav<T1/2またはDdif>T2(T
2は所定のしきい値)、Crunが0でない時はDdi
f>T2を満足する場合、注目画素を画像中のエッジを
構成する画素であると判定することにより、画像中のエ
ッジ近傍部分の画素を良好な精度で抽出することができ
る。
【0039】また、主走査により同一ランに含まれるエ
ッジを構成する画素数CedgがランレングスCrun
に対して所定の割合T3以上である場合、このランを画
像中の文字領域、それ以下である場合写真領域に判定す
ることにより、主走査方向の画素間の連結情報を参照し
ながら領域判定を行えるので、注目画素だけあるいは正
方形ブロックなどの小領域単位で領域判定を行う場合に
比べて、領域判定の精度が向上する。
【0040】実施例2.前記実施例では、注目画素を含
むウィンドウを4×4画素の正方形のものを示したが、
3×3や8×8など任意のサイズでよく、形状も正方形
以外でもよい。
【0041】実施例3.また前記実施例では、ウィンド
ウ内の画像の特徴として平均信号レベルを算出する際、
ウィンドウ内の画像信号レベルを単純に相加平均をとる
ものを示したが、注目画素と参照画素との位置に応じた
重み付けを施して参照するようにしてもよい。
【0042】実施例4.また前記実施例では、非背景色
画素分離回路3で画素分離のために使用したしきい値T
1として所定の値を用いるものを示したが、文書画像の
上方数ライン分のデータあるいは画像全体を一度走査す
ることで得られる特徴などから背景画素と非背景画素を
分離するしきい値を動的に決定するようにしてもよい。
例えば新聞や色がついた紙面から文字や写真等を入力す
る場合は、新聞の紙の色やあらかじめ着色された色等に
より、背景色画素が輝度255すなわち、白を示さない
ものがある。この場合には、文書画像の最初の数ライン
をあらかじめ分析する。すなわち文書画像の最初の数ラ
インには、非背景色画素が存在していることは、一般的
に少ないため、最初の数ラインのデータは背景色画素か
ら構成されているものと考えることができる。あるいは
画像全体を一度走査することにより、全体の背景色画素
の輝度を知ることが可能になる。このように、背景色画
素の平均輝度をあらかじめ知ることにより、例えば、そ
の輝度が255ではなく235程度であるということが
分かった場合には、しきい値T1が今まで通り230で
ある場合には背景色と見なされる範囲が輝度230と2
35の間という非常に狭い範囲になってしまい、実際に
は背景色であるにもかかわらず、多少のかすれやゴミ等
により、それが非背景色画素であると判定されてしまう
ことが多くなる。このような場合には、しきい値T1の
値を230から例えば200に変化させることにより、
前述したような、背景色画素と非背景色画素の分離誤り
を防ぐことが可能になる。
【0043】実施例5.また前記実施例では、画像信号
を輝度値で表したものを用いたが、濃度値など他の画素
データ表現方法を用いるようにしてもよい。
【0044】実施例6.また前記実施例では、エッジ画
素判定回路4でのエッジ画素判定のためにウィンドウ内
の最大信号レベル差値を用いるものを示したが、ラプラ
シアンなどの他のエッジ検出手段を用いてもよい。
【0045】実施例7.次に、上記実施例1の改良例に
ついて説明する。まず、この実施例に係わる画像領域分
離装置の概要について説明する。この実施例は、画像デ
ータを入力し、注目画素を含むN×Nのウィンドウにつ
いてウィンドウ内の平均信号レベル値Dav、最大信号
レベル差Ddifを求め、Davを所定のしきい値T1
と比較することにより、非背景色画素を抽出し、該非背
景色画素についてそれまでの主走査方向の非背景色画素
列のランレングスCrunが0である時、Dav<T1
/2またはDdif>T2(T2は所定のしきい値)、
Crunが0でない時はDdif>T2を満足する場
合、注目画素を画像中のエッジを構成する画素であると
判定する。また、主走査により同一ランに含まれるエッ
ジを構成する画素数CedgがランレングスCrunに
対して所定の割合以上である場合、このランを画像中の
文字領域、それ以下である場合写真領域に判定する。ま
た、副走査方向に隣接する前後行の非背景色画素からな
るランが文字領域であるか写真領域であるかを参照し注
目する非背景色画素から成るランに関する判定結果を補
正する。(ただし、ここでの”<,>”は画像信号が輝
度値で表されている場合に成り立つ。)
【0046】以下、この発明の一実施例を図について説
明する。図6において、1から8は、実施例1において
説明したものと同様のものであり、ここではその説明を
省略する。また、9は領域判定回路7で注目するランが
文字領域であるか写真領域であるか判定した結果につい
て、注目する画素を含むライン及び隣接するラインの計
3ライン分のデータを格納する領域属性バッファ、10
は領域属性バッファ9に保存されている注目する主走査
方向の行に含まれる全てのランの領域属性に関する情報
を、隣接する行に含まれる注目するランに隣接するラン
の領域属性に関する情報を参照して補正する領域属性補
正回路である。
【0047】図7に領域属性バッファの構成を示す。こ
こで領域属性バッファはinfo_bufで示してい
る。領域属性バッファは、注目行及びその前行と次行の
3ライン分のデータを常時格納している。各ライン毎に
主走査方向の画素数の1/3程度のサイズnのラン番号
バッファがある。領域分割部で注目行に対して主走査方
向のスキャンを行いランを検出すると、ラン番号0,
1,…,のバッファ領域に順次そのランの開始点のアド
レスと属性を書き込む。また、ランの検出を終了すると
そのランの終了点のアドレスを書き込む。開始アドレス
及び終了アドレスは主走査方向の画素番号が記録され
る。また、属性は文字領域または写真領域に対応する番
号を表す数値が格納される。さらに、注目行のスキャン
が終了した場合は、属性補正部での処理のためにデータ
終了を示す数値が次のラン番号の開始アドレス領域に書
き込まれる。
【0048】次にこの実施例による画像領域分離装置の
動作について説明するが、図6に示す1〜8の各部につ
いては、実施例1に示したものと同様の動作を行うた
め、ここではその説明を省略し、特に異なる部分につい
て以下に説明する。実施例1で述べたように、領域判定
回路7はランが文字画像領域に属するか、写真画像領域
に属するかを判定し、その属性に関する情報を出力する
ことになるが、このようにして得られた、ランが文字領
域に属するか写真領域に属するかという属性に関する情
報及びそのランの主走査方向のアドレス値を注目するラ
ンを含むラインとそのラインに隣接するラインに関し
て、領域属性バッファ9に保存する。領域属性補正回路
10では領域属性バッファ9に保存されている注目ライ
ンに含まれる全てのランの領域属性に関する情報を、そ
のランに隣接する前ラインのラン及び後ラインのランの
領域属性に関する情報を参照して、図8に示される規則
に従って補正する。
【0049】以下、この隣接領域の属性情報を使用した
補正について説明する。領域分割部の処理の結果、主走
査方向の注目行とその前後の行を合わせた3ライン分の
属性情報が属性バッファに蓄えられた時点で、注目行に
対する属性補正を行う。属性補正は、注目行に含まれる
ランを注目行の1つ前の行と1つ後の行に隣接して含ま
れるランの属性を参照することによって行う。図7に属
性補正の規則を示す。ここで、属性補正を行おうとする
注目行のランを注目ラン、1つ前の行のランで注目ラン
に隣接するランを前行ラン、1つ後の行のランで注目ラ
ンに隣接するランを次行ランと呼ぶ。
【0050】ある注目ランに対して前行ランと次行ラン
のいずれもが存在しない場合、つまり注目ランが孤立し
た領域の時、属性補正は行わない。また前行ランの属性
が写真領域で注目ランが文字領域である時、注目ランを
写真領域に補正する。これは、文書画像内で写真領域と
文字領域が隣接していると考えにくいためで、特に写真
領域の境界部分が領域分割で文字領域に誤判定されるこ
とに対する補正の意味を持つ。従って、既に属性補正済
みの前行ランの属性を優先し注目行を写真領域に補正す
る。また、次行ランが写真領域の場合も注目ランの属性
を写真に補正する。これも領域分割部で文字領域に誤判
定される写真領域の境界の属性を補正するためである。
【0051】前行ランと注目ランの属性が共に写真領域
の場合、次行ランは写真領域である可能性が高く属性補
正の必要がある。しかし、処理全体の流れとして次行を
注目行にした時に前記補正処理によって補正されるた
め、ここでは補正を行わない。さらに、属性が*で表さ
れている箇所は文字領域であっても写真領域であって
も、他の組合せを用いた補正または次のスキャンライン
に対する補正で属性補正が行われる。従って、ある行に
注目した属性補正の段階では、これらは文字領域、写真
領域のいずれでも構わない。
【0052】以上のようにして補正された注目するラン
の領域属性に関する情報を参照して、原画像に対して文
字領域と写真領域の領域分離を行い、分離された各画像
データ領域毎に2値化するなどの画像処理を施す。
【0053】以上のように、この実施例は副走査方向に
隣接するランが文字領域を構成するランであるか写真領
域を構成するランであるかを参照して、注目するランが
文字領域であるか写真領域であるかを示すランの属性を
補正するラン属性補正手段を備えたことを特徴とする。
【0054】この実施例によれば、領域判定を行った注
目するランについて副走査方向に隣接するランの領域属
性に関する情報を参照してその領域属性を補正すること
により、副走査方向の領域間の連結情報を参照しながら
領域判定を行えるので、領域分離の精度が向上する。
【0055】実施例8.前記実施例では、領域属性補正
回路10で注目するランの領域属性を補正するときに、
領域属性バッファ9に保存された注目ラインの前後3ラ
イン分の領域属性に関する情報を用いたが、注目ライン
の前2ライン後1ラインの計4ラインを参照してもよ
く、参照方法はこの限りでない。
【0056】実施例9. また前記実施例では、非背景色画素列から成る全てのラ
ンについて領域属性補正を行うものを示したが、領域判
定回路7における領域判定にしきい値T3による文字
領域、写真領域の分離の代わりに、複数のしきい値を設
けてエッジ画素含有率から明らかに文字領域であるラン
と文字領域か写真領域か断定できないラン、明らかに写
真領域であるランに分類するなどして、文字領域か写真
領域か断定できないランのみを領域属性補正回路10に
て領域属性の決定を行うようにしてもよい。
【0057】実施例10.次に、実施例1と7のシミュ
レーションの具体例について説明する。まず、シミュレ
ーション環境について説明する。図9において、50は
イメージスキャナ、51,52,53はコンピュータ、
54はカラープリンタである。このシミュレーションを
実行するために、先ず、プログラムの作成、及び実行の
ためにワークステーション52を使用する。又、画像デ
ータの取り込みは、カラーイメージスキャナ50を用い
る。このイメージスキャナは、読取線密度は最高320
dpi、色分解精度はRGB各色256階調である。ま
た処理結果のハードコピーのためにカラープリンタ54
を使用する。このプリンタは記録線密度は150dp
i、色分解精度はYMC各色256階調である。また、
プログラムの作成にはC言語を用い、汎用のウィンドウ
システムのライブラリを使用してCRTへの表示も行え
るようにした。
【0058】図10から図12にシミュレーションに使
用した原画像の記録例を掲載する。画像はいずれも各画
素8ビット/色でスキャナで読み取ったものを使用して
いる。図10は、電子写真学会テストチャートの198
8年版No.5及びその説明書から構成した文書画像
で、画像サイズは592×700画素である。図11か
ら図12は、SCIDの画像サンプルに文章を組み合わ
せて作成した文章画像であり、図11は661×904
画素、図12は682×925画素のサイズである。
【0059】次に、シミュレーション結果について説明
する。まず、しきい値の最適化について説明する。図1
0〜図12の3種類の画像について、しきい値T2とし
きい値T3に対する画像領域の平均検出率を求めた結果
を図13と図14に示す。図13は写真領域の検出率で
あり、図14は文字領域の検出率である。図13から、
写真の検出率はT2とT3に依存して変化するが、検出
率が最大になるように各T3に対する最適のT2を選択
した場合、最大検出率は同程度の値である。この理由
は、エッジ含有率のしきい値T3の増加に対して、エッ
ジ画素判定しきい値T2を小さくすると、結果的にある
非背景ランに含まれるエッジ画素が増加するためであ
る。従って、判定結果に及ぼされるT3の増加の影響
を、T2を最適化することで吸収できる。また、図14
から、各T3に対してT2が大きくなるほど文字の検出
率が低下し、また、T3自体が増加するにつれて文字の
検出率が低下することがわかる。これは、T2,T3の
増加につれてエッジ画素であると判定する基準が厳しく
なり、文字の中でも非背景画素が比較的密集している領
域が写真領域に誤判定されるためである。これらの結果
から、文字領域と写真領域の検出率が共に高い最適なし
きい値の組は、T2が40、T3が5の場合である。ま
た、この時の領域検出率は、写真領域が99.3%、文
字領域が100%である。
【0060】次に、画像分割結果について説明する。図
10〜図12の各原画像に対して本方式を用いて領域分
割を行った結果を図15から図17に示す。ここで、各
しきい値はT1を230、T2を40、T3を5にし
た。図15から図20において図15、図17、図19
は、原画像から写真領域だけを抽出した結果である。ま
た図16、図18、図20は原画像から文字領域だけを
抽出した結果である。領域分割結果から文字領域及び写
真領域と背景の分離は概ね良好に行えることがわかる。
しかし、写真領域の上端の主走査方向数ライン分の領域
が文字領域に誤判定されている。これはウィンドウを使
った特徴抽出処理の段階で、写真領域の端点については
図21に示すような画素配列になるためDdif値が大
きくなり、注目画素がエッジを含む画素に判定される。
この注目画素を含む主走査方向の非背景ランでは、ラン
を構成する全ての画素がエッジ画素に判定されCedg
値が増加し、(式6)を満たすために文字領域であると
判定される。これに対して、副走査方向の処理に伴う属
性補正では1ライン分の補正が行われるに留まってお
り、写真領域の上端の文字領域への誤判定を完全に補正
することができていない。例えば画像全体を2値化する
場合は、写真の端点を文字領域と同じく尖鋭化すること
になるので、この誤判定は問題になることはない。ま
た、図16ではタイトル文字のアンダーラインが同じ原
因で文字領域に判定されている。この場合も尖の性質を
考えると判定結果に問題はない。これに対し、例えば領
域分割の結果を圧縮、符号化して利用する場合、小領域
に多くの視覚的な情報を含んでいる文字領域は圧縮率よ
りも伸張後の画質を重視し、写真領域は圧縮率を重視す
る符号化法を用いることが一般的である。この場合、図
表などの罫線を含む画像を領域分割すると本方式では罫
線は文字領域に判定される。視覚的な情報量が少ない罫
線は、伸張後の画質よりも圧縮率を重視した方法で符号
化すべきである。従って、罫線を圧縮率よりも伸張後の
画質を重視すべき文字領域に判定するのは好ましくない
ので、本手法を画像の圧縮、符号化の前処理として使用
する場合は改善の余地がある。
【0061】次に、アルゴリズムの高速化について説明
する。前述したしきい値の最適化の結果、T3が5の時
良好な領域分割結果が得られることが確認された。T3
は、参照したウィンドウ内にエッジを含む画素が含まれ
る割合に対するしきい値である。従って、T3が5の場
合、(式6)は(式7)で置き換えることができる。 (Crun>>1)−Cedg≧0 ならば 写真領域のラン (式7) (Crun>>1)−Cedg<0 ならば 文字領域のラン ここで、”>>1”は右方向への1ビットシフトを表
す。(式6)を(式7)で置き換えることにより、画像
中の各ラン毎に行われていた乗算と除算をビットシフト
と減算に置き換えることができるので、アルゴリズムの
高速化を図ることができる。(式6)を(式7)で置き
換えたアルゴリズムを図10〜図12に示した原画像ま
でに適用してシミュレーションを行ったところ、処理速
度が平均10%向上した。また、これにより本方式の回
路化を行う場合にも回路の簡単化が可能になる。
【0062】また、(式4)も(式8)で置き換えるこ
とができる。 Dav<(T1>>1) (式8) ここで”>>1”は右方向への1ビットシフトを表す。
(式4)を(式8)で置き換えることにより除算(T1
/2)をビットシフトに置き換えることができるのでア
ルゴリズムの高速化を図ることができるとともに、しき
い値T1を(式3)と共通化して用いることができるの
でしきい値をあらかじめ記憶する記憶領域が少なくてす
む。
【0063】実施例11.上記実施例においては、非背
景領域が文字領域と写真領域を含む場合を示したが、文
字領域は2値画像領域の一例であり、記号、図形、表等
その他の2値画像領域の場合でもよい。また、写真領域
は中間調画像領域の一例であり、絵、イラスト、テレビ
画像等その他の中間調画像領域の場合でもよい。また、
2値画像領域と中間調画像領域が完全に分離して存在し
ている場合ばかりでなく、同一領域に混在している場合
でもよい。
【0064】実施例12.上記実施例においては白黒の
場合を例にして説明したが、カラーの場合でもよい。例
えば、カラーの場合は、シアン、マゼンタ、イエロー
(あるいは青、赤、黄)の三原色に対して、それぞれ上
記実施例で述べた動作を行うとともに、これらの三種類
の結果について総合判断を行うようにすればよい。
【0065】
【発明の効果】以上のように、第1から第3の発明によ
れば、文字等の2値画像と写真等の中間調画像を従来に
比べて、より良好な精度で抽出することが出来るという
効果がある。このように2値画像と中間調画像との領域
を精度よく分離することにより、この画像領域分離装置
及びその方法をファクシミリ装置やデジタル複写機等に
用いることにより、原稿画像に忠実な出力画像を得る装
置を得ることが可能となる。
【図面の簡単な説明】
【図1】この発明の一実施例による画像領域分離装置の
構成を示すブロック回路図である。
【図2】この発明の一実施例による画像領域分離装置で
扱う画素ウィンドウの構成を示す図である。
【図3】この発明の一実施例による画素の判定領域を示
す図である。
【図4】この発明の一実施例による動作を説明するため
の図である。
【図5】この発明の一実施例による写真領域と文字領域
の輝度を示す図である。
【図6】この発明の一実施例による画像領域分離装置の
構成を示すブロック回路図である。
【図7】この発明の一実施例による領域属性バッファの
一例を示す図である。
【図8】この発明の一実施例による画像領域分離装置の
領域属性補正回路内で注目するランに対して領域属性を
補正する場合の規則の例を示す図である。
【図9】この発明の具体例を示すシミュレーション環境
を説明するための図である。
【図10】この発明の一実施例によるシミュレーション
に使用した原画像を示す図である。
【図11】この発明の一実施例によるシミュレーション
に使用した原画像を示す図である。
【図12】この発明の一実施例によるシミュレーション
に使用した原画像を示す図である。
【図13】この発明の一実施例によるエッジ判定しきい
値T2と写真領域の検出率の関係を示す図である。
【図14】この発明の一実施例によるエッジ判定しきい
値T2と文字領域の検出率の関係を示す図である。
【図15】この発明の一実施例により図10に示した原
画像から写真領域を抽出した結果を示す図である。
【図16】この発明の一実施例により図10に示す原画
像から文字領域を抽出した結果を示す図である。
【図17】この発明の一実施例により図11に示した原
画像から写真領域を抽出した結果を示す図である。
【図18】この発明の一実施例により図11に示す原画
像から文字領域を抽出した結果を示す図である。
【図19】この発明の一実施例により図12に示した原
画像から写真領域を抽出した結果を示す図である。
【図20】この発明の一実施例により図12に示す原画
像から文字領域を抽出した結果を示す図である。
【図21】この発明の一実施例により誤って判定された
部分のメカニズムを示す図である。
【図22】従来のランレングスを用いた領域分割法のブ
ロック図である。
【図23】従来の濃度変化を用いた領域分割のブロック
図である。
【図24】従来の文書画像に対するその他の領域分割方
法を示す図である。
【図25】従来の画像領域分離方式を示すブロック図で
ある。
【符号の説明】
1 平均信号レベル算出回路 2 最大信号レベル差算出回路 3 非背景色画素分離回路 4 エッジ画素判定回路 5 ランカウンタ 6 エッジカウンタ 7 領域判定回路 8 ラインバッファ 9 領域属性バッファ 10 領域属性補正回路 11 注目画素
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H04N 1/40 - 1/409 H04N 1/46 H04N 1/60 G06T 7/00

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 以下の要素を有する画像領域分離装置 (a)背景色画素から構成される背景領域と非背景色画
    素から構成され文字画像と写真画像との2つの種類をも
    非背景領域とを有する画像情報を入力する入力手段、 (b)上記入力手段により入力した画像情報の中から非
    背景色画素を検出して分離する非背景色画素分離手段、 (c)上記非背景色画素分離手段により分離された所定
    の方向にひとつ以上連続する非背景色画素をランとしそ
    の長さを検出するラン検出手段、 (d)上記非背景色画素分離手段により分離された非背
    景色画素が非背景領域のエッジを構成するエッジ画素で
    あるかを判定するエッジ画素判定手段、 (e)上記ラン検出手段により検出されたランの中の上
    記エッジ画素判定手段でエッジ画素として判定された非
    背景色画素の割合に基づき、そのランが文字画像と写真
    画像との2つの種類の非背景領域のうちのいずれの種類
    の非背景領域に属するランであるかを示すランの属性を
    判定する領域判定手段。
  2. 【請求項2】 上記画像領域分離装置はさらに、領域判
    定手段により判定された隣接する複数のランの属性を参
    照して、ランの属性を補正する領域属性補正手段を備え
    たことを特徴とする請求項1に記載の画像領域分離装
    置。
  3. 【請求項3】 以下の工程を有する画像領域分離方法 (a)背景領域と文字画像と写真画像との2つの種類を
    もつ非背景領域とから構成された画像情報をライン毎に
    入力する入力工程、 (b)上記入力工程により入力した画像情報の各ライン
    の中から非背景領域を検出する非背景領域検出工程、 (c)上記非背景領域検出工程により検出された非背景
    領域の中から所定の方向にひとつ以上連続する非背景色
    画素をランとしその長さを検出するラン検出工程、 (d) 上記非背景領域検出工程により各ラインの中から
    検出した非背景領域の中から非背景領域のエッジとなる
    非背景色画素をエッジ画素として検出するエッジ検出工
    程、 (e)上記ラン検出工程により検出されたランの中の上
    記エッジ検出工程でエッジ画素として判定された非背景
    色画素の割合に基づき、そのランが文字画像と写真画像
    との2つの種類のうちのいずれの種類かを判定する領域
    判定工程。
JP04221931A 1992-07-29 1992-07-29 画像領域分離装置及び画像領域分離方法 Expired - Fee Related JP3073837B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04221931A JP3073837B2 (ja) 1992-07-29 1992-07-29 画像領域分離装置及び画像領域分離方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04221931A JP3073837B2 (ja) 1992-07-29 1992-07-29 画像領域分離装置及び画像領域分離方法

Publications (2)

Publication Number Publication Date
JPH0654180A JPH0654180A (ja) 1994-02-25
JP3073837B2 true JP3073837B2 (ja) 2000-08-07

Family

ID=16774407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04221931A Expired - Fee Related JP3073837B2 (ja) 1992-07-29 1992-07-29 画像領域分離装置及び画像領域分離方法

Country Status (1)

Country Link
JP (1) JP3073837B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3558893B2 (ja) 1998-10-08 2004-08-25 シャープ株式会社 画像処理装置および画像処理方法
US6650775B1 (en) * 1999-08-23 2003-11-18 Xerox Corporation Method and apparatus for implementing a streaming two-dimensional digital image segmentation
US6744919B2 (en) * 2001-07-24 2004-06-01 Hewlett Packard Development Company, L.P. Classification of blocks for compression based on number of distinct colors
US7426291B2 (en) 2002-07-29 2008-09-16 Seiko Epson Corporation Apparatus and method for binarizing images of negotiable instruments using a binarization method chosen based on an image of a partial area
JP4241074B2 (ja) * 2003-02-12 2009-03-18 富士ゼロックス株式会社 画像探索装置
JP5507794B2 (ja) * 2007-01-30 2014-05-28 京セラ株式会社 携帯電子機器
JP6922690B2 (ja) * 2017-11-22 2021-08-18 富士通株式会社 文字領域抽出プログラム、文字領域抽出装置及び文字領域抽出方法

Also Published As

Publication number Publication date
JPH0654180A (ja) 1994-02-25

Similar Documents

Publication Publication Date Title
US6424742B2 (en) Image processing apparatus for discriminating image field of original document plural times and method therefor
US6389163B1 (en) Method and apparatus for automatic image segmentation using template matching filters
US20040017579A1 (en) Method and apparatus for enhancement of digital image quality
US20060274332A1 (en) Image processing system, a method thereof, and a recording medium thereof
JPH0722330B2 (ja) 画像処理装置の画像領域識別方式
US6775031B1 (en) Apparatus and method for processing images, image reading and image forming apparatuses equipped with the apparatus, and storage medium carrying programmed-data for processing images
US20060152765A1 (en) Image processing apparatus, image forming apparatus, image reading process apparatus, image processing method, image processing program, and computer-readable storage medium
JP3073837B2 (ja) 画像領域分離装置及び画像領域分離方法
US6744532B1 (en) Method for enhancing printing quality
US6661921B2 (en) Image process apparatus, image process method and storage medium
JPH0818785A (ja) 画像出力装置
JPH10108012A (ja) 像域分離装置
JP4787776B2 (ja) 画像処理装置およびこれを備えた画像形成装置、並びに画像処理方法
JPH0335374A (ja) 文書における文字領域と写真領域とを区別する方法及びその装置
JPS6359272A (ja) 画像処理装置
JPH0662230A (ja) 画像形成装置
JPH10173930A (ja) 画像出力装置
JPH02199588A (ja) 像域識別装置
JP2507948B2 (ja) 画像領域識別装置
JP2853141B2 (ja) 画像領域識別装置
JP2900343B2 (ja) 画像処理装置
JP3070174B2 (ja) 画像形成装置
JP3596962B2 (ja) 画像処理装置
JPH09238256A (ja) 画像処理方法及び画像処理装置
KR100214337B1 (ko) 혼재문서의 이치화방법

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000509

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040520

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080602

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090602

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100602

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees