JP4770863B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP4770863B2 JP4770863B2 JP2008100593A JP2008100593A JP4770863B2 JP 4770863 B2 JP4770863 B2 JP 4770863B2 JP 2008100593 A JP2008100593 A JP 2008100593A JP 2008100593 A JP2008100593 A JP 2008100593A JP 4770863 B2 JP4770863 B2 JP 4770863B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- logical operation
- binarized
- binarization
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
Description
具体的には、画像から黒の文字や線画を抜き出して2値データを作成する。また、画像から赤の文字や線画を抜き出して2値データを作成する。さらに、画像から、前記黒や赤の文字や線画を除去した多値画像データを作成する。黒の文字や線画を抜き出して作成した2値データは、2値データ用の圧縮方式で圧縮する。また、この画像の色は黒であるという情報を別途付与する。同様に、赤の文字や線画を抜き出して作成した2値データは、2値データ用の圧縮方式で圧縮する。また、この画像の色は赤であるという情報を別途付与する。さらに、画像から前記の文字部や線画部を除去した後のバックグラウンド画像は、JPEG等の多値画像用の圧縮方式で符号化する。
本発明は、画像に対する処理による色変化の影響があったとしても、その画像が単色であるか否かの判定の誤りを削減させるようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
請求項1の発明は、対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、前記2値化生成手段によって2値化された第1の画像と第2の画像の違いを検出するための論理演算を行う論理演算手段と、前記論理演算手段によって論理演算された結果の画像の連結画素数を算出する画素数算出手段と、前記画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段を具備し、前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であることを特徴とする画像処理装置である。
図15の例に示されるように、赤色で描画された文字(「ABC」、赤色文字1501)と、黒色で描画された文字(「DEF」、黒色文字1502)と、非文字線画部(家が描かれたの画像部分、家画像1503)からなる画像1500が存在する場合、赤色文字の「ABC」のみを抽出した2値画像1505と、黒色文字の「DEF」のみを抽出した2値画像1506と、残りの部分である多値画像1507とに分割し、それぞれの画像を独立に符号化する。また、「ABC」を抽出した2値画像1505の色が赤であり、「DEF」を抽出した2値画像1506の色が黒であるという情報を別途付与する。
なお、1つの画素領域として、1文字の画像となる場合が多い。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。例えば、円や線のような図形であってもよい。以下、「文字」又は「文字部画像」という場合は、特に断りがない限り「画素塊」の意で用いる。
2値化処理モジュール1610は、文字部切出モジュール1620と接続されており、受け付けた画像を2値化処理して2値化画像を生成し、その2値化画像を文字部切出モジュール1620へ渡す。
文字部切出モジュール1620は、2値化処理モジュール1610、分散値算出モジュール1630と接続されており、2値化処理モジュール1610から2値化画像を受け取り、その画像内から文字部画像を切り出し、その文字部画像を分散値算出モジュール1630へ渡す。
閾値処理モジュール1640は、分散値算出モジュール1630と接続されており、分散値算出モジュール1630から受け取った分散値が所定閾値以上であれば、その文字は複数色であると判定する。
このことについて、以下、順番に説明する。
複数色で構成される文字において、複数色だと判定されない場合は、図17の例に示すように色変わりが生じてしまう。つまり、図17(a)の例に示すオリジナル文字部画像1701が黒と赤(図では斜め格子柄)の2色で塗り分けられている場合、そのオリジナル文字部画像1701をスキャナで読み取り、そのRGBコンポーネント毎の色の分散値は低いので複数色とは判定されず、単色と判定されてしまう。したがって、オリジナル文字部画像1701の再現画像1702(図17(b))の色は、黒と赤の中間色である茶色となってしまう。
以上のように、特に多層構造の符号化方式では、文字部に対するMTF劣化、JPEG圧縮等による局所的な色変化の影響を受けないように、単色か否かの判定を行う必要がある。
以下に示す各種の実施の形態の概要は、次の通りである。
(1)類似する色として連結されている画素数が閾値以下である場合は、その画素がスキャンや圧縮等に起因する局所的な色変化によるものであるとして複数色ではないと判定し、閾値以上となる類似する色の連結画素数が2色以上ある場合は複数色であると判定する。
(2)また、類似する色として連結されている画素数を算出するために、限定色化処理を行うか、又はカラー画像の各コンポーネントの2値化画像間で画素毎の論理演算を行う。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。所定という用語は、予め定められたの意の他に、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じての意を含めて用いる。
限定色化処理モジュール120は、文字部切出モジュール110、連結画素数算出モジュール130と接続されており、文字部切出モジュール110から渡された文字部画像を限定色化し、その限定色化された画像を連結画素数算出モジュール130へ渡す。なお、限定色化のアルゴリズムは特に限定されず一般的な限定色化処理であってもよい。
連結画素数算出モジュール130は、限定色化処理モジュール120、閾値処理モジュール150と接続されている。限定色化処理モジュール120によって限定色化された文字部画像内の色毎の連結画素数を算出し、限定色毎の連結画素数を閾値処理モジュール150へ渡す。ここでは例えば、後段の処理から、限定された色とその色で連結される画素数の情報として、連結している画素数が多い上位の色(例えば2色)の連結数を渡してもよい。
閾値処理モジュール150は、連結画素数算出モジュール130、閾値設定モジュール140と接続されている。連結画素数算出モジュール130によって算出された連結画素数を閾値設定モジュール140から渡された正規化閾値と比較して、文字部画像が単色であるか否かを判定し、その判定結果を出力する。例えば、連結画素数算出モジュール130から連結画素数の多い上位の色(例えば2色)の連結画素数を受け取った場合、それぞれの連結画素数を正規化閾値と比較し、1色の連結画素数が正規化閾値を超えた場合は単色の文字と判定し、2色の連結画素数とも正規化閾値を超えた場合は複数色の文字と判定してもよい。
スキャン文字部画像201、301は、文字部切出モジュール110によって切り出された文字部画像であり、スキャン文字部画像201は、図19(a)の例に示したオリジナル文字部画像1701(2色からなるカラー画像)をスキャナで読み取った画像(つまりスキャン文字部画像1902)から切り出したものであり、スキャン文字部画像301は、図19(c)の例に示したオリジナル文字部画像1801(単色のカラー画像)をスキャナで読み取った画像(つまりスキャン文字部画像1912)から切り出したものである。
限定色化画像202、302は、それぞれスキャン文字部画像201、301に対して、限定色化処理モジュール120によって限定色化された文字部画像である。
連結領域203、204は、限定色化画像202に対して、連結画素数算出モジュール130によって算出された連結画素数が多い上位の2つの領域である。同様に、連結領域303、304は、限定色化画像302に対して、連結画素数算出モジュール130によって算出された連結画素数が多い上位の2つの領域である。
また、文字部切出モジュール110は、スキャン文字部画像201の画素数を計数し、閾値設定モジュール140は、その画素数に基づいて閾値を設定し、閾値処理モジュール150は、設定された閾値と連結領域203、204のそれぞれの画素数とを比較して、単色か否かを判定する。同様に、文字部切出モジュール110は、スキャン文字部画像301の画素数を計数し、閾値設定モジュール140は、その画素数に基づいて閾値を設定し、閾値処理モジュール150は、設定された閾値と連結領域303、304のそれぞれの画素数とを比較して、単色か否かを判定する。この場合、スキャン文字部画像201とスキャン文字部画像301の画素数はほぼ同じであるので閾値もほぼ同じになり、連結領域203、204(つまり2色)の画素数が閾値を超えているので、スキャン文字部画像201は複数色の文字部画像であると判定する。連結領域303の画素数が閾値を超えていないで、連結領域304の画素数が閾値を超えているので、スキャン文字部画像301は単色の文字部画像であると判定する。
第2の実施の形態は、第1の実施の形態における限定色化処理を簡易的に行うため、まずカラーコンポーネント毎で文字の中央部分(幹部分)の色が1となるような2値化を行う。次に、コンポーネント間で画素単位に論理演算処理(例えばXOR処理)することで、コンポーネント間で文字の幹領域で違う色の画素が1となりやすくなる。最後に論理演算処理画像の最大連結画素数、つまり異なる色画素の塊が閾値以上のときは複数色文字と判定する。
2値化処理モジュール421、422は、文字部切出モジュール410、論理演算モジュール425と接続されており、文字部切出モジュール410から受け取ったコンポーネント画像に対して2値化処理を行って2値化画像を生成する。そして、それぞれが生成した2値化画像を論理演算モジュール425へ渡す。例えば、2値化処理の閾値を文字領域の平均値とし、背景部の平均値と比較して文字部の幹の領域が1となるようにしてもよい。
連結画素数算出モジュール430は、論理演算モジュール425、閾値処理モジュール450と接続されており、連結画素数算出モジュール130と同様に、論理演算モジュール425によって論理演算された結果の画像(論理演算画像)の連結画素数を算出する。そして、連結画素数が最も多いものの画素数を閾値処理モジュール450に渡す。前述の例では、「1」となる画素の連結する数をカウントして、その最大値を出力するものである。
閾値処理モジュール450は、連結画素数算出モジュール430、閾値設定モジュール440と接続されており、連結画素数算出モジュール430によって算出された連結画素数に応じて、文字部切出モジュール410によって切り出された文字部画像が単色であるか否かを判定する。例えば、最大連結画素数と正規化閾値とを比較し、正規化閾値を超えた場合は複数色文字と判定し、正規化閾値を超えない場合は単色文字と判定してもよい。
スキャン文字部画像201、301は、文字部切出モジュール410によって切り出された文字部画像である。
Y画像502、602は、それぞれスキャン文字部画像201、301から、文字部切出モジュール410によってYCrCb空間のY軸に応じたコンポーネント画像である。同様に、Cr画像512、612は、Cr軸に応じたコンポーネント画像である。
2値化画像503、513、603、613は、それぞれY画像502、Cr画像512、Y画像602、Cr画像612に対して、2値化処理モジュール421、422によって2値化処理された2値化画像である。
図5(d)の例に示すXOR処理画像504a、504bは、論理演算モジュール425による2値化画像503と2値化画像513とのXOR処理画像である。同様に、図6(d)の例に示すXOR処理画像604a〜604cは、論理演算モジュール425による2値化画像603と2値化画像613とのXOR処理画像である。
また、文字部切出モジュール410は、スキャン文字部画像201の画素数を計数し、閾値設定モジュール440は、その画素数に基づいて閾値を設定し、閾値処理モジュール450は、設定された閾値とXOR処理画像504a、504bのうちの最大の連結画素数とを比較して、単色か否かを判定する。同様に、文字部切出モジュール410は、スキャン文字部画像301の画素数を計数し、閾値設定モジュール440は、その画素数に基づいて閾値を設定し、閾値処理モジュール450は、設定された閾値とXOR処理画像604a〜604cのうちの最大の連結画素数とを比較して、単色か否かを判定する。この場合、スキャン文字部画像201とスキャン文字部画像301の画素数はほぼ同じであるので閾値もほぼ同じになり、XOR処理画像504aの画素数が閾値を超えているので、スキャン文字部画像201は複数色の文字部画像であると判定する。XOR処理画像604a〜604cのうちの最大の連結画素数が閾値を超えていないで、スキャン文字部画像301は単色の文字部画像であると判定する。
平均値算出モジュール722は、文字部切出モジュール710、2値化処理モジュール723と接続されており、文字部切出モジュール710から受け取った文字部画像及び文字形状情報を用いて、各コンポーネント毎に文字領域の画像の画素平均値を算出し、その平均値を2値化処理モジュール723へ渡す。また、背景領域の平均値を算出するようにしてもよい。
比較方法決定モジュール741は、分散値算出モジュール721、複数色判定モジュール750と接続されており、各コンポーネント画像の分散値によってどのコンポーネント間の比較方法を行うかを決定し、決定した比較方法を比較情報として複数色判定モジュール750へ渡す。また後述する複数色判定モジュール750において、前述のC1−C2間論理演算モジュール724、C1−C3間論理演算モジュール725、C2−C3間論理演算モジュール726を経て、連結画素数算出モジュール731、732、733によって算出される画素数が最大のものを判定に用いる場合には、比較方法決定モジュール741は必要ない。
複数色判定モジュール750は、連結画素数算出モジュール731、連結画素数算出モジュール732、連結画素数算出モジュール733、比較方法決定モジュール741、閾値設定モジュール742と接続されており、比較方法決定モジュール741から受け取った比較情報によって比較する最大連結画素数を選択し、その値が正規化された閾値を超えていればその文字部画像は複数色とし、閾値を超えていなければ単色の文字部画像と判定し、その判定結果を出力する。
連結画素数算出モジュール831は、第1演算モジュール824、複数色判定モジュール850と接続されており、連結画素数算出モジュール832は、第2演算モジュール825、複数色判定モジュール850と接続されており、連結画素数算出モジュール833は、第3演算モジュール826、複数色判定モジュール850と接続されている。これらは、それぞれ第1演算モジュール824等によって論理演算された処理画像内の連結画素数を算出し、その画素数を複数色判定モジュール850へ渡す。詳細については、図9、10、11を用いて後述する。
比較方法決定モジュール841は、分散値算出モジュール821、複数色判定モジュール850と接続されており、分散値算出モジュール821によって算出された各コンポーネントの分散値によって比較方法を決定し、決定した比較方法を比較情報として複数色判定モジュール850へ渡す。
より詳細に説明する。まず連結画素数を比較情報によって選択する。3つの比較条件のうち2つに当てはまる場合もあるので、優先順位を付けて選択する。例えば、最初にYが低分散値であれば、第3演算モジュール826の演算処理結果を用いて、それに当てはまらない場合は、Cb及びCrの分散値が閾値以上であれば、第2演算モジュール825の演算処理結果を用い、以上の2つの条件に当てはまらない場合は、第1演算モジュール824の演算処理結果を用いることとする。次に、その演算結果の値が閾値を超えていればその文字部画像は複数色と判定し、閾値を超えていなければ単色文字と判定し、その判定結果を出力する。
Cb、Crの分散値が低い場合は、一般的に文字部画像において、色の違う画素が少ないか、色差が小さいかのどちらかになる。この画像を文字領域の平均値によって2値化すると、ダイナミックレンジの小さい雑音をそのまま2値化するため、2値化画像の形状には多くの雑音が反映されたものとなる。
このため、この影響を少なくするため、YとCb及びYとCrの演算処理を行う場合は、Yコンポーネント2値化画像をn回(nは0以上の整数)膨張させ、さらに分散が小さいコンポーネント画像(Cb、Cr)が1となる場合だけXOR処理を行うこととする。つまり膨張処理をしたYの2値化画像からCb、Crの2値化画像がはみ出た画素だけ出力する。
膨張処理モジュール910は、Cb−Y間XOR処理モジュール921、Cr−Y間XOR処理モジュール922と接続されており、Yコンポーネント2値化画像を受け取り、n回膨張させる。その膨張させたYコンポーネント2値化画像をCb−Y間XOR処理モジュール921、Cr−Y間XOR処理モジュール922に渡す。
Cr−Y間XOR処理モジュール922は、膨張処理モジュール910、連結画素数算出モジュール831と接続されており、膨張処理モジュール910から膨張されたYコンポーネント2値化画像、2値化処理モジュール823からCrコンポーネント2値化画像を受け取り、その両者間の論理演算を行って、その論理演算結果である処理画像を連結画素数算出モジュール831へ渡す。論理演算として、例えば、Crコンポーネント2値化画像が1となる場合だけXOR処理を行う。
連結画素数算出モジュール831は、Cb−Y間XOR処理モジュール921、Cr−Y間XOR処理モジュール922と接続されている。前述の処理後に、連結画素数算出モジュール831が各連結画素の画素数をカウントし、Yコンポーネント2値化画像とCbコンポーネント2値化画像、Yコンポーネント2値化画像とCrコンポーネント2値化画像の両者の論理演算の結果のうち最大連結画素数を出力する。
Cb、Crの分散値が高い場合は、一般的に文字部画像において、色の違う画素が多いか、色差が大きいかのどちらかになる。このため、Cb、Crが低分散値である時と違って、平均値による2値化画像の形状には、安定的に色の違いが現われる。
このため、YとCb及びYとCrのXOR処理を行う場合は、Y、Cb、Crのコンポーネント2値化画像を雑音除去の目的からm回(mは0以上の整数)膨張させ、一般的なXOR処理を行うこととする。つまり膨張処理をしたYコンポーネント2値化画像とCb、Crのコンポーネント2値化画像の異なる画素だけを出力する。
膨張処理モジュール1011は、Cb−Y間XOR処理モジュール1021、Cr−Y間XOR処理モジュール1022と接続されており、膨張処理モジュール1012は、Cb−Y間XOR処理モジュール1021と接続されており、膨張処理モジュール1013は、Cr−Y間XOR処理モジュール1022と接続されている。それぞれは、2値化処理モジュール823からYコンポーネント2値化画像、Cbコンポーネント2値化画像、Crコンポーネント2値化画像を受け取り、m回膨張させる。その膨張させたYコンポーネント2値化画像をCb−Y間XOR処理モジュール1021、Cr−Y間XOR処理モジュール1022へ渡し、膨張させたCbコンポーネント2値化画像をCb−Y間XOR処理モジュール1021へ渡し、膨張させたCrコンポーネント2値化画像をCr−Y間XOR処理モジュール1022へ渡す。なお、膨張処理モジュール1011、1012、1013は、それぞれ異なる回数だけ膨張するようにしてもよい。
Cr−Y間XOR処理モジュール1022は、膨張処理モジュール1011、膨張処理モジュール1013、連結画素数算出モジュール832と接続されており、膨張処理モジュール1011から膨張されたYコンポーネント2値化画像、膨張処理モジュール1013から膨張されたCrコンポーネント2値化画像を受け取り、その両者間の論理演算を行って、その論理演算結果である処理画像を連結画素数算出モジュール832へ渡す。論理演算として、例えば、XOR処理を行う。
連結画素数算出モジュール832は、Cb−Y間XOR処理モジュール1021、Cr−Y間XOR処理モジュール1022と接続されている。前述の処理後に、連結画素数算出モジュール832が各連結画素の画素数をカウントし、Yコンポーネント2値化画像とCbコンポーネント2値化画像、Yコンポーネント2値化画像とCrコンポーネント2値化画像の両者の論理演算の結果のうち最大連結画素数を出力する。
Yの分散値が閾値より低くCbとCrの分散値が閾値より大きい場合は、輝度変化は少ないが、色差がある程度違う画素が存在する。このため、CbとCrの2値化画像のみの比較を行う。
したがって、雑音除去の目的からCb及びCrの2値化画像をk回(kは0以上の整数)膨張させ、一般的なXOR処理を行う。つまり膨張処理をしたCbとCrの2値化画像の異なる画素だけ出力する。
膨張処理モジュール1111は、Cb−Cr間XOR処理モジュール1120と接続されており、膨張処理モジュール1112は、Cb−Cr間XOR処理モジュール1120と接続されている。それぞれは、2値化処理モジュール823からCbコンポーネント2値化画像、Crコンポーネント2値化画像を受け取り、k回膨張させる。その膨張させたCbコンポーネント2値化画像、Crコンポーネント2値化画像をCb−Cr間XOR処理モジュール1120へ渡す。なお、膨張処理モジュール1111、1112は、それぞれ異なる回数だけ膨張するようにしてもよい。
連結画素数算出モジュール833は、Cb−Cr間XOR処理モジュール1120と接続されている。前述の処理後に、連結画素数算出モジュール833が各連結画素の画素数をカウントし、最大連結画素数を出力する。
オリジナルの文字部画像の例として、図12に示す例は複数色からなる文字部画像、図13に示す例は単色の文字部画像を取り上げる。スキャナで読み取って細線化した画像の色情報をみると、両者の分散値が近い場合に、図16に示した構成例では判定が難しかった。
コンポーネント画像1202、1212、1222は、2値化処理モジュール823が2値化処理の対象とするY、Cr、Cbのコンポーネント画像である。これらに対して、2値化処理モジュール823によってコンポーネント画像毎に平均値を使って2値化処理された画像が、コンポーネント2値化画像1203、1213、1223である。次に、Cr−Y間XOR処理モジュール922又はCr−Y間XOR処理モジュール1022によって論理演算処理された画像は、論理演算処理画像1204a〜1204bであり、Cb−Y間XOR処理モジュール921又はCb−Y間XOR処理モジュール1021によって論理演算処理された画像は、論理演算処理画像1214a〜1214eであり、Cb−Cr間XOR処理モジュール1120によって論理演算処理された画像は、論理演算処理画像1224a〜1224dである。
そして、比較方法決定モジュール841によって、コンポーネント画像の分散値からCb、Crが高い分散値であると判定される。これによって、連結画素数算出モジュール832の算出結果が採用される。このことは、Cb−Y間XOR処理モジュール1021とCr−Y間XOR処理モジュール1022の処理結果(Y−Cbの2値化画像間(つまり、コンポーネント2値化画像1203とコンポーネント2値化画像1223)及びY−Crの2値化画像間(つまり、コンポーネント2値化画像1203とコンポーネント2値化画像1213)のXOR処理の処理結果)に対して、両者のXOR処理画像で「1」の画素が色が変わった画素に相当する。さらに連結画素数算出モジュール832によって両者の最大連結画素成分の画素数を算出する。
これが文字部画像の中で色が違っている箇所の中で最大面積になるため、最大連結画素数が閾値(文字で許容できる色変化の割合)を超えていれば複数色の文字とし、超えていなければ単色とする。図12に示す例では、最大画素数となる論理演算処理画像1204aが閾値を超えているので、スキャン文字部画像201は複数色からなる文字と判定される。
なお、図12の論理演算処理画像1224a〜1224dに示すように、比較対象と判定されないCb−Cr2値化画像間(つまり、コンポーネント2値化画像1213とコンポーネント2値化画像1223)の比較を行うと、単色という判定になってしまう。
コンポーネント画像1302、1312、1322は、2値化処理モジュール823が2値化処理の対象とするY、Cr、Cbのコンポーネント画像である。これらに対して、2値化処理モジュール823によってコンポーネント画像毎に平均値を使って2値化処理された画像が、コンポーネント2値化画像1303、1313、1323である。次に、Cr−Y間XOR処理モジュール922又はCr−Y間XOR処理モジュール1022によって論理演算処理された画像は、XOR処理画像1304a〜1304cであり、Cb−Y間XOR処理モジュール921又はCb−Y間XOR処理モジュール1021によって論理演算処理された画像は、XOR処理画像1314a〜1314fであり、Cb−Cr間XOR処理モジュール1120によって論理演算処理された画像は、XOR処理画像1324a〜1324eである。
そして、比較方法決定モジュール841によって、コンポーネント画像の分散値からCb、Crが高い分散値であると判定される。これによって、連結画素数算出モジュール832の算出結果が採用される。このことは、Cb−Y間XOR処理モジュール1021とCr−Y間XOR処理モジュール1022の処理結果(Y−Cbの2値化画像間(つまり、コンポーネント2値化画像1303とコンポーネント2値化画像1323)及びY−Crの2値化画像間(つまり、コンポーネント2値化画像1303とコンポーネント2値化画像1313)のXOR処理の処理結果)に対して、両者のXOR処理画像で「1」の画素が色が変わった画素に相当する。さらに連結画素数算出モジュール832によって両者の最大連結画素成分の画素数を算出する。
これが文字部画像の中で色が違っている箇所の中で最大面積になるため、最大連結画素数が閾値(文字で許容できる色変化の割合)を超えていれば複数色の文字とし、超えていなければ単色とする。図13に示す例では、最大画素数となるXOR処理画像1314bが閾値を超えていないので、スキャン文字部画像301は単色の文字と判定される。
なお、図13のXOR処理画像1324a〜1324eに示すように、比較対象と判定されないCb−Cr2値化画像間(つまり、コンポーネント2値化画像1313とコンポーネント2値化画像1323)の比較を行っても、単色という判定になる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…限定色化処理モジュール
130、430、731、732、733、831、832、833…連結画素数算出モジュール
140、440、742、842…閾値設定モジュール
150、450…閾値処理モジュール
421、422、723、823…2値化処理モジュール
425…論理演算モジュール
721、821…分散値算出モジュール
722、822…平均値算出モジュール
724…C1−C2間論理演算モジュール
725…C1−C3間論理演算モジュール
726…C2−C3間論理演算モジュール
741、841…比較方法決定モジュール
750、850…複数色判定モジュール
824…第1演算モジュール
825…第2演算モジュール
826…第3演算モジュール
910、1011、1012、1013、1111、1112…膨張処理モジュール
921、1021…Cb−Y間XOR処理モジュール
922、1022…Cr−Y間XOR処理モジュール
1120…Cb−Cr間XOR処理モジュール
1610…2値化処理モジュール
1620…文字部切出モジュール
1630…分散値算出モジュール
1640…閾値処理モジュール
Claims (7)
- 対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、
前記2値化生成手段によって2値化された第1の画像と第2の画像の違いを検出するための論理演算を行う論理演算手段と、
前記論理演算手段によって論理演算された結果の画像の連結画素数を算出する画素数算出手段と、
前記画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
を具備し、
前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、
前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像である
ことを特徴とする画像処理装置。 - 対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、
前記2値化生成手段によって生成された第1の画像と第2の画像の違いを検出するための論理演算を行う第1の論理演算手段と、
前記2値化生成手段によって生成された第1の画像と第3の画像の違いを検出するための論理演算を行う第2の論理演算手段と、
前記2値化生成手段によって生成された第2の画像と第3の画像の違いを検出するための論理演算を行う第3の論理演算手段と、
前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、
前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、
前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、
前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
を具備し、
前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、
前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であり、
前記第3の画像は、前記第1の画像の副画像及び前記第2の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像である
ことを特徴とする画像処理装置。 - 対象とする画像の色空間における色軸に応じた3つの副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るようにそれぞれ2値化画像を生成する2値化生成手段と、
前記2値化生成手段によって生成された3つの2値化画像のうち第1の2値化画像を膨張した第1の膨張画像と3つの2値化画像のうち第2の2値化画像の違いを検出するための論理演算を行い、
該第1の膨張画像と該2値化生成手段によって生成された3つの2値化画像のうち第3の2値化画像の違いを検出するための論理演算を行う第1の論理演算手段と、
前記第1の膨張画像と前記第2の2値化画像を膨張した第2の膨張画像の違いを検出するための論理演算を行い、
該第1の膨張画像と前記第3の2値化画像を膨張した第3の膨張画像の違いを検出するための論理演算を行う第2の論理演算手段と、
前記第2の膨張画像と前記第3の膨張画像の違いを検出するための論理演算を行う第3の論理演算手段と、
前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、
前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、
前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、
前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
を具備することを特徴とする画像処理装置。 - 前記2値化生成手段は、前記第1の2値化画像を、3つの軸によって表色される色空間における第1の軸の副画像を2値化して生成し、前記第2の2値化画像を、第2の軸の副画像を2値化して生成し、前記第3の2値化画像を、第3の軸の副画像を2値化して生成し、
さらに、
前記2値化生成手段によって生成された第1の2値化画像を膨張させて、前記第1の膨張画像を生成する第1の膨張画像生成手段と、
前記2値化生成手段によって生成された第2の2値化画像を膨張させて、前記第2の膨張画像を生成する第2の膨張画像生成手段と、
前記2値化生成手段によって生成された第3の2値化画像を膨張させて、前記第3の膨張画像を生成する第3の膨張画像生成手段と、
を具備し、
前記第1の論理演算手段は、前記第1の膨張画像生成手段によって生成された第1の膨張画像と前記2値化生成手段によって生成された第2の2値化画像の違いを検出するための論理演算を行い、前記第1の膨張画像と前記2値化生成手段によって生成された第3の2値化画像の違いを検出するための論理演算を行い、
前記第1の画素数算出手段は、前記第1の論理演算手段によって第1の膨張画像と第2の2値化画像を論理演算した結果の画像の連結画素数、及び前記第1の論理演算手段によって第1の膨張画像と第3の2値化画像を論理演算した結果の画像の連結画素数を算出し、
前記第2の論理演算手段は、前記第1の膨張画像と前記第2の膨張画像生成手段によって生成された第2の膨張画像の違いを検出するための論理演算を行い、前記第1の膨張画像と前記第3の膨張画像生成手段によって生成された第3の膨張画像の違いを検出するための論理演算を行い、
前記第2の画素数算出手段は、前記第1の膨張画像と前記第2の膨張画像を論理演算した結果の画像の連結画素数、及び前記第1の膨張画像と前記第3の膨張画像を論理演算した結果の画像の連結画素数を算出し、
前記第3の論理演算手段は、前記第2の膨張画像と前記第3の膨張画像の違いを検出するための論理演算を行う
ことを特徴とする請求項3に記載の画像処理装置。 - コンピュータを、
対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、
前記2値化生成手段によって2値化された第1の画像と第2の画像の違いを検出するための論理演算を行う論理演算手段と、
前記論理演算手段によって論理演算された結果の画像の連結画素数を算出する画素数算出手段と、
前記画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
として機能させ、
前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、
前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像である
ことを特徴とする画像処理プログラム。 - コンピュータを、
対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、
前記2値化生成手段によって生成された第1の画像と第2の画像の違いを検出するための論理演算を行う第1の論理演算手段と、
前記2値化生成手段によって生成された第1の画像と第3の画像の違いを検出するための論理演算を行う第2の論理演算手段と、
前記2値化生成手段によって生成された第2の画像と第3の画像の違いを検出するための論理演算を行う第3の論理演算手段と、
前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、
前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、
前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、
前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
として機能させ、
前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、
前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であり、
前記第3の画像は、前記第1の画像の副画像及び前記第2の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像である
ことを特徴とする画像処理プログラム。 - コンピュータを、
対象とする画像の色空間における色軸に応じた3つの副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るようにそれぞれ2値化画像を生成する2値化生成手段と、
前記2値化生成手段によって生成された3つの2値化画像のうち第1の2値化画像を膨張した第1の膨張画像と3つの2値化画像のうち第2の2値化画像の違いを検出するための論理演算を行い、
該第1の膨張画像と該2値化生成手段によって生成された3つの2値化画像のうち第3の2値化画像の違いを検出するための論理演算を行う第1の論理演算手段と、
前記第1の膨張画像と前記第2の2値化画像を膨張した第2の膨張画像の違いを検出するための論理演算を行い、
該第1の膨張画像と前記第3の2値化画像を膨張した第3の膨張画像の違いを検出するための論理演算を行う第2の論理演算手段と、
前記第2の膨張画像と前記第3の膨張画像の違いを検出するための論理演算を行う第3の論理演算手段と、
前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、
前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、
前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、
前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
として機能させることを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008100593A JP4770863B2 (ja) | 2008-04-08 | 2008-04-08 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008100593A JP4770863B2 (ja) | 2008-04-08 | 2008-04-08 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009253751A JP2009253751A (ja) | 2009-10-29 |
JP4770863B2 true JP4770863B2 (ja) | 2011-09-14 |
Family
ID=41313967
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008100593A Expired - Fee Related JP4770863B2 (ja) | 2008-04-08 | 2008-04-08 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4770863B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3061812B2 (ja) * | 1989-06-12 | 2000-07-10 | 日本電気株式会社 | パターン認識方法および装置 |
CN100346339C (zh) * | 2002-11-20 | 2007-10-31 | 富士通株式会社 | 图像检索方法及图像检索装置 |
JP2005244649A (ja) * | 2004-02-26 | 2005-09-08 | Fuji Xerox Co Ltd | 画像処理装置 |
JP4396331B2 (ja) * | 2004-03-10 | 2010-01-13 | 富士ゼロックス株式会社 | 画像処理装置 |
-
2008
- 2008-04-08 JP JP2008100593A patent/JP4770863B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009253751A (ja) | 2009-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5206503B2 (ja) | 画像処理装置及び画像処理プログラム | |
US7936929B2 (en) | Image processing method and apparatus for removing noise from a document image | |
JP4766030B2 (ja) | 画像処理装置及び画像処理プログラム | |
US8059896B2 (en) | Character recognition processing system and computer readable medium storing program for character recognition processing | |
JP5337563B2 (ja) | 帳票認識方法および装置 | |
CN105407251A (zh) | 图像处理装置及图像处理方法 | |
JP5304529B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4770863B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR101646042B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 가독 기억 매체 | |
JP5407582B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4894664B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP5200993B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2010152457A (ja) | 画像処理装置及び画像処理プログラム | |
JP4840388B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4872780B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP3763954B2 (ja) | 文字認識用の学習データ作成方法および記録媒体 | |
JP4650958B2 (ja) | 画像処理装置、方法およびプログラム | |
JP5206468B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2003032480A (ja) | 画像処理装置及び画像処理方法 | |
JP5457853B2 (ja) | 画像符号化装置、画像符号化方法、プログラム及び記憶媒体 | |
JP6481301B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2012142872A (ja) | 画像処理装置及び画像処理プログラム | |
JP5636674B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2007034972A (ja) | 罫線検出装置、罫線検出方法およびプログラム | |
JP2017169047A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090825 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110506 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110606 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140701 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |