JP2013175887A - 画像処理装置、画像処理方法およびコンピュータープログラム - Google Patents

画像処理装置、画像処理方法およびコンピュータープログラム Download PDF

Info

Publication number
JP2013175887A
JP2013175887A JP2012038510A JP2012038510A JP2013175887A JP 2013175887 A JP2013175887 A JP 2013175887A JP 2012038510 A JP2012038510 A JP 2012038510A JP 2012038510 A JP2012038510 A JP 2012038510A JP 2013175887 A JP2013175887 A JP 2013175887A
Authority
JP
Japan
Prior art keywords
attribute
character
pixel
character attribute
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012038510A
Other languages
English (en)
Other versions
JP5825142B2 (ja
Inventor
Takahiro Tsutsumi
隆弘 堤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2012038510A priority Critical patent/JP5825142B2/ja
Publication of JP2013175887A publication Critical patent/JP2013175887A/ja
Application granted granted Critical
Publication of JP5825142B2 publication Critical patent/JP5825142B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】文字領域および非文字領域をそれぞれ検出する2種の領域判別処理を行なうことなく、個々の文字内での文字属性と非文字属性との混在のない領域判別情報を生成する。
【解決手段】画素ごとに文字属性と非文字属性とのいずれかが定められた画像に対して画像処理を行う画像処理装置は、画像における前記文字属性をもつ画素で構成される文字属性領域に対して、当該文字属性領域に外接する矩形を定め、矩形の周囲の複数の画素のそれぞれについて、画素色と文字属性領域の色との色差が設定値よりも小さい同色画素であるか否か、を判定する。判定された画素の個数に対する同色画素であると判定された画素の個数の比率が閾値以上である場合に、画像処理装置において文字属性領域内の画素の属性が文字属性から非文字属性に置換される。
【選択図】図1

Description

本発明は、入力画像の属性情報を生成する画像処理装置、画像処理方法およびコンピュータープログラムに関する。
複写機やプリンターによる画像の印刷では、画像内の文字に対して、エッジ強調や色の鮮やかさの強調といった文字品質を高めるための画像処理が加えられる。文字を有する画像は、下地に文字のみが記載された画像(いわゆるテキスト画像)に限らない。文字が並ぶテキスト部分と図や写真が配置された非文字部分とを有する画像があり、さらに微小ドットで構成される写真の中に文字列が存在するというように、文字要素であるドットとそうではないドットとが隣接する画像もある。このように文字と有色の非文字部分とが混在する画像の画質を最適化するには、画像内の文字を精度よく判別する必要がある。
画像の領域判別に関して、特許文献1において、8×8画素のブロックといった領域ごとに圧縮されたカラー画像の各領域を、2段階の判定によって文字画像領域と非文字画像領域とに分類することが提案されている。その第1段階の判定では、画像データの交流成分に基づいて、各領域が文字画像領域、非文字画像領域、および文字画像の可能性がある文字画像候補領域のいずれかに分類される。そして、第2段階の判定において、文字画像候補領域が、当該領域の色と近傍の文字画像領域の色とに基づいて、文字画像領域または非文字画像領域に分類される。
また、特許文献2では、複数の文字を内包する矩形領域とそれ以外の矩形領域とに区分する大まかな領域判別の手法が開示されている。同文献の手法は、一つの文字を内包する矩形領域どうしが隣接する場合にそれら領域を合併するという要領で文字領域を拡大していく。そして、文字領域と図や写真を内包する矩形の非文字領域とが重複した場合に、重複が部分的かどうか、非文字領域の大きさ、および文字領域の行数を示す状態情報に基づいて、文字領域の真偽を判定する。
特開平9−93427号公報 特開平8−115380号公報
画像処理用のプロセッサーによる高速の領域判別は、画像の各画素に対して画素配列順に文字属性または非文字属性を定める。このようなミクロ視点の判別を行う場合、例えば極端に大きい文字や極端に太い文字において、一つの文字であるにもかかわらず、その一部分のみが文字領域と判別され、残りの部分が文字領域ではないと判別されてしまうことがある。ここでいう文字領域とは、個々の文字を構成する画素の集合であり、文字を内包する矩形領域(下地部分を含む)ではない。文字領域以外の領域は全て非文字領域である。
誤った領域判別結果に基づいて属性別に画質を最適化すると、真の文字のうちの正しく判別されて文字属性をもつ画素で構成される文字属性領域とそうではなく非文字属性をもつ画素で構成される非文字属性領域とに互いに異なる画像処理が施されることになる。そのため、画像処理の違いが画質のむらとして目立つという問題が起こる。特に、画像データを高圧縮PDF(Portable Document Format)形式のファイルに変換する場合のように文字・図形・写真のうちの文字のみを2値化する場合では、一つの文字の中で2値化される部分とされない部分とが混在することになり、文字品質の低下が顕著に現われる。
誤判別を低減する方法として、文字を検出するアルゴリズムによる領域判別処理および図形や写真といった文字以外の画像要素を検出するアルゴリズムによる領域判別処理の両方を行ない、両者の判別結果の矛盾する領域について所定の再判別処理を行なうことが考えられる。再判別の結果に従って、文字属性領域を非文字属性領域に、または逆に非文字属性領域を文字属性領域に置換すればよい。
しかし、文字および文字以外の画像要素をそれぞれ判別する2種の領域判別の実施は、処理時間の増加および処理に必要なリソースの増加を招く。
本発明は、このような事情に鑑み、文字および文字以外の画像要素をそれぞれ検出する2種の領域判別処理を行なうことなく、個々の文字内での文字属性と非文字属性との混在のない領域判別情報を生成することを目的としている。
上記目的を達成する装置は、画素ごとに文字属性と非文字属性とのいずれかが定められた画像に対して画像処理を行う画像処理装置であって、前記画像における前記文字属性をもつ画素で構成される文字属性領域に対して、当該文字属性領域に外接する矩形を定める設定部と、前記画像における前記矩形の周囲の複数の画素のそれぞれについて、画素色と前記文字属性領域の色との色差が設定値よりも小さい同色画素であるか否か、を判定する判定部と、前記判定部による判定の対象である前記複数の画素の個数に対する前記同色画素であると判定された画素の個数の比率が閾値以上である場合に、前記文字属性領域内の画素の属性を前記文字属性から前記非文字属性に置換する置換部と、を備える。
本発明によれば、文字および文字以外の画像要素をそれぞれ検出する2種の領域判別処理を行なうことなく、個々の文字内での文字属性と非文字属性との混在のない領域判別情報を生成することができる。
本発明の第1実施形態に係る属性修正処理を模式的に示す図である。 属性修正処理の対象となる文字を有した画像の一例を示す図である。 文字内での文字属性と非文字属性との混在が生じる領域判別方法の例を示す図である。 文字属性と非文字属性とが混在する図形の例を示す図である。 属性修正処理の対象となる文字の近傍に他の文字が存在する場合を示す図である。 属性修正処理において注目する画素列の位置設定の変形例を示す図である。 第1実施形態に係る画像処理装置の構成を示す図である。 第1実施形態に係る属性修正処理のフローチャートである。 第2実施形態に係る属性修正処理を模式的に示す図である。 第2実施形態に係る画像処理装置の構成を示す図である。 第2実施形態に係る属性修正処理のフローチャートである。 画像処理装置を備える画像形成装置の構成の一例を示す図である。
画像の各画素の属性を定める処理をハードウェアによって行なう画像処理装置は、例えばASIC(Application Specific Integrated Circuit)からなる画像処理用のプロセッサーを備える。プロセッサーは、画像入力手段から入力される画像データをパイプライン形式で処理するリアルタイム動作によって高速の処理を実現する。画像入力手段は、イメージスキャナー、デジタルカメラ、パーソナルコンピューター、または画像データを出力する他の機器のいずれでもよい。また、スキャナーやカメラといった画像入力機器に画像処理装置を組み入れることもでき、その場合における画像入力手段は画像入力機器の一部である。
〔第1実施形態〕
図1の上部中央に描かれた画像40は、図2に例示されるドキュメント4を電子化した画像の要部である。ドキュメント4には大きな文字5が記載されており、この文字5およびその近傍に対応する画像データが図1において画像40として描かれている。例示の文字5はアルファベットの“C”であり、その文字サイズは一般的なテキストの文字サイズと比べて極端に大きい。図2では文字5が黒く描かれているが、文字5の色は周囲と視覚的に区別可能な色であればよい。画像40の画素色はRGBの各色成分の階調で表わされる。画像40は、文字5に対応する文字領域50を有している。
画像40に対して文字を検出するアルゴリズムによる領域判別が行なわれる。図1において、領域判別によって定められた画像40の各画素の属性(文字属性または非文字属性)を示す属性画像(属性プレーン)42は、文字領域50の一部分に対応する文字属性領域51を有する。文字属性領域51の各画素の属性は文字属性である。属性画像42における文字属性領域51以外の部分は、属性が非文字属性と定められた画素から構成される非文字属性領域である。属性画像42における非文字属性領域には、文字領域50のうちの文字属性領域51に対応する部分以外の部分に対応する領域52を含んでいる。つまり、属性画像42では、領域判別の部分的な誤りがある。文字領域50が正しく判別されない状況の生じる領域判別方法の例が図3に模式的に示されている。
図3において、(A)、(B)、(C)のように画像の先頭ライン側(図の上側)から画素配列順に各画素の属性が定められていく。(A)の段階で文字属性領域51aが定められ、(B)の段階で文字属性領域51bが定められ、(C)の段階で文字属性領域51が定められている。図3の例示における判別方法は、エッジに該当するかどうかを判別し、続いてエッジ間距離と閾値とを比較する方法である。注目した画素がエッジに該当し、かつエッジに該当しない画素を挟む他の最も近いエッジに該当する画素との距離(エッジ間距離)が閾値以下である場合に、注目した画素、他の最も近いエッジに該当する画素、およびこれらに挟まれる画素の属性を文字属性に定める。つまり、例示の判別方法は、エッジ間距離が閾値を超えるような太い線は文字の要素ではないとみなす。図3の例では、アルファベットの“C”の上下方向の中ほどまで判別が進んだとき、エッジ間距離が閾値を超える。「エッジ間距離が閾値以下という文字としての条件から一旦外れると、既に判別された文字属性領域とエッジを介さずに隣接する有色領域を非文字属性領域とする」というアルゴリズムに従い、アルファベットの“C”の下部の属性は非文字属性とされる。パイプライン処理による領域判別では、既に定めた属性は変更されない。このため、アルファベットの“C”の上部は文字属性領域51のまま残存することになる。
ここで、文字と判別する条件から一旦外れたとしても、文字属性を次に注目する画素に受け継がせて(伝播させて)、文字属性領域51を拡張させていく方法もある。しかし、次に注目した画素が真に文字の要素か否かを判定することはできない。そのため、例えば図4に例示される巨大な三角形60が画像内に存在した場合、文字属性を伝播させることによって、巨大な三角形の全体を文字属性領域としてしまう誤判別を引き起こすおそれがある。このことから領域判別では文字属性を伝播させない。
エッジ間距離の閾値は、各種ドキュメントでの使用が想定される文字の最大サイズによって決まる。例えば、50ポイントのボールド書体の文字を基準に閾値を設定することができる。その場合、9〜12ポイントといった一般的なサイズまたはそれより小さいサイズの文字では、領域判別において文字全体が文字属性領域と判別される。50ポイントを超える極端に大きい文字(実際には文字ではない何らかの図形であるかもしれない)が入力画像内に存在した場合に、当該文字の一部が文字属性領域として判別されない状況が起こり得る。
図1に戻って、属性画像42におけるアルファベットの“C”のように、一つの文字が文字属性の部分と非文字属性の部分とに分かれるのは好ましくない。それは、属性画像42が示す文字属性領域を鮮明にしたり2値化したりする画像処理を画像40に加えたときに、処理後の画像が不自然に見えるからである。特に、高圧縮PDFへの変換やファクシミリ伝送などのために2値化を行うと、2値化されて単色情報のみをもつ文字属性領域と各画素が固有のRGB階調を有したままの非文字属性領域との画質の差異が目立ってしまう。
画像が不自然に見える問題に対して、[1]文字属性領域を非文字属性領域に置換して属性を統一するか、[2]非文字属性領域を文字属性領域に置換して属性を統一するかの2通りの解決策[1]、[2]が考えられる。第1実施形態では解決策[1]が適用される。すなわち、属性画像42に対して必要に応じて文字属性領域を非文字属性領域に置換する属性修正処理が行なわれる。この処理を受けた後の属性画像42aが、後段の画像処理のための領域判別情報となる。図示のとおり、処理後の属性画像42aでは、処理前の属性画像42における文字属性領域51が非文字属性領域51aに置換されている。
ところで、文字属性領域51を非文字属性領域51aに置換するのに先立って、真に置換すべきかどうか、すなわち、文字属性領域51が文字領域50の全体に対応するか一部分に対応するかを判定する必要がある。一部分に対応する場合が置換すべき場合である。属性修正処理では、文字属性領域51の領域色と文字属性領域51の周囲の複数の画素の色(画素色)とに基づいて、置換の要否が判定される。詳しくは以下のとおりである。
文字属性領域51が文字領域50の一部分に対応するのであれば、本来は文字属性領域51が領域52と連続している。言い換えれば、文字属性領域51と領域52とが連続しているかどうかを調べれば、文字属性領域51が文字領域50の一部分であるかどうかが分かる。隣接する二つの領域の色が同一であれば、これら領域は連続していると言える。しかし、属性画像42において、非文字属性領域である領域52と他の非文字属性領域とが区別されていないので、文字属性領域51の輪郭は分かるが、領域52の輪郭は分からない。つまり、領域52を構成する画素の色を調べて領域52の色(領域色)を特定することができない。したがって、属性修正処理では、領域52の領域範囲を特定せずに、輪郭の分かる文字属性領域51に着目して連続性を検出する。
連続性を検出するために文字属性領域51の周囲の画素の色を調べる必要があるが、文字属性領域51の輪郭のトレースには相応の処理時間を要する。注目する画素が文字属性領域51のエッジから離れているかどうかを検出するフィルタリングを行なわなければならないからである。
そこで、文字属性領域51に対して、これに外接する仮想の矩形71が設定される。矩形71の設定には既知の技術を使用すればよい。例えば、ある画素を開始地点として、その周囲の画素のうちの同じ属性をもつ画素にラベル付けをし、最終的に連続した同じ属性の画素が無くなった時点でラベル付けされている画素の最も外周の座標から、外接する矩形71を求めることができる。解像度を落として処理することにより、連続性検出を高速化することができる。
矩形71に内包される文字属性領域51の領域色は、文字属性領域51の全画素の色の平均値である。矩形71の設定に際してラベル付けされた画素のRGBの各成分の画素値を画像40から抽出し、RGBの成分別に加算する。同時に画素数をカウントしておき、成分別の加算結果のそれぞれを画素数で除す。これにより、領域色を示すRGBの各成分の平均値を求めることができる。
文字属性領域51の領域色の算定に続いて、文字属性領域51の周囲の色をサンプリングするために、矩形71を囲む1画素幅の環状の画素列81が注目される。そして、画素列81を構成する複数の画素のそれぞれについて、画素色と文字属性領域51の領域色との色差が設定値よりも小さい画素(これを同色画素と呼称する)であるか否かが判定される。色差は、色空間における2つの色の座標間の距離である。例えば、本例のようにRGBの成分で色を表す場合、領域色の座標を(R1,G1,B1)とし、画素色を(R2,G2,B2)として、色差(色空間上の2点間距離)は次式で表される。
色差=〔(R1−R2)2+(G1−G2)2+(B1−B2)21/2
画素列81における文字属性領域51の領域色と同一またはそれに近い色をもつ同色画素の割合の大小によって、文字属性領域51とその周囲との連続性を判定することができる。図1の模式的な例では、画素列81は画素8a,8b,8c,8d,8e,8f,8g,8h,8iを含んでおり、これらのうちの画素8c,8d,8e,8f,8g,8hが同色画素である。ただし、実際の画素数は画像の解像度に依存する。例示の画素列81の画素の総数は「70」で、文字領域に対応する可能性のある同色画素の個数は「6」であるので、同色画素か否かの判定で注目した画素の個数“Q”に対する同色画素の個数“q”の比率“R”(R=q/Q)を百分率で表すと約8.57%である。比率Rは矩形71の周囲長に対する文字部分の長さの割合に相当する。予め適切な閾値“Rth”を決めておき、比率Rが閾値Rth以上であれば文字属性領域51がその周囲と連続しているとみなすことができる。一般的なテキスト画像では、文字属性領域51の周囲に文字属性領域51とほぼ同じ色をもつ文字以外の画素が存在する場合はほとんど無いと考えられるので、閾値Rthを低めに設定しても支障はない。例えば、閾値Rthを5%程度にしてもよい。
基本的には比率Rの算出に際して画素列81の各画素の属性を考慮する必要はないが、非文字属性の画素のみに注目することによって領域判別の信頼性をより高めることができる。上述したように文字属性領域51の周囲に文字以外の同色画素が存在する場合はほとんど無い。しかし、図5のように、文字属性領域51の近傍に、文字属性領域51の対応する文字とは別の文字に対応する文字属性領域55の存在する可能性がある。例えば、ロゴタイプでは通常の文字配列とは異なる文字の配置が見受けられる。文字属性領域51とは別の文字属性領域55の画素8p,8q,8r,8s,8t,8uの個数を同色画素の個数qに含めると、比率Rが適正でなくなる。このため、画素列81の画素数Qおよび同色画素の個数qのカウントにおいて画素8p,8q,8r,8s,8t,8uがカウント対象から除外される。図5の模式的な例示において、画素列81のうちのカウント対象外の画素8p,8q,8r,8s,8t,8uの個数は「6」である。したがって、非文字属性の画素に限定した注目画素の個数Qは、画素列81の全画素数の「70」からカウント対象外の画素数の「6」を差し引いた「64」となる。そして、比率Rは約9.38%となる。閾値Rthを5%とすると、非文字属性の画素のみに注目した場合も、「文字属性領域55はその周囲と連続している」と判定される。
このように比率Rが閾値Rthと等しいかまたは閾値Rthを超える場合に、文字属性領域51を非文字属性領域51aに変更する属性置換が必要と判定され、判定に従って属性置換が行なわれる。すなわち、図1の例において、属性画像42が属性画像42aに修正される。比率Rが閾値Rth未満である場合には、文字属性領域51に対する属性置換は行なわれない。
比率Rの算定に際して注目する画素列81については、位置設定の変形例がある。図1および図5の例のように文字属性領域51に外接する矩形71に接する画素列81には、本来は文字ではない箇所に文字属性領域51の色成分(文字属性の階調)がある程度取り込まれている可能性がある。例えば、画像40を生成するイメージスキャナーのMTF特性に起因する画像のボケや、解像度変換による画像のボケによって、文字のエッジの階調がエッジ近傍の背景画素の階調とのスムージングを受けたのと同様の状態になる場合がある。文字属性の階調を取り込んだ画素をサンプリングしてしまうと、実際に文字属性領域51と同じ色をもつ画素が文字属性領域51の周囲に存在していたかどうかの判定の確度が低下する。そこで、文字属性領域51に外接する矩形71からN画素(Nは1以上の整数)離れた画素に注目する変形例が考えられる。図6の例示では、矩形71に沿いかつ矩形71から1画素離れて文字属性領域51を囲む環状の画素列82が、文字属性領域51の周囲の色のサンプリングのために注目される。図示において画素列82は6個の同色画素8j,8k,8m,8n,8v,8wを有している。
図7は第1実施形態に係る画像処理装置100の構成を示している。画像処理装置100は、入力される画像を文字属性領域と非文字属性領域とに区分する領域判別ブロック110と、上述の属性修正処理を受け持つ属性修正ブロック120とを備える。領域判別ブロック110は、入力される画像40に対して文字領域を検出する領域判別を行い、画素値が属性を示す属性画像(属性プレーン)42を生成する。属性修正ブロック120は、領域色取得部122、矩形設定部123、置換要否判定部125、および属性置換部126を有し、属性画像42を必要に応じて修正した属性画像42aを生成する。
属性修正ブロック120において、領域色取得部122は、属性置換の対象領域である文字属性領域51の領域色を、画像40の色情報に基づく上述の平均値の計算によって取得し、領域色を示すデータDC51を置換要否判定部125に与える。矩形設定部123は、文字属性領域51に外接する仮想の矩形71を設定し、矩形71の位置を示すデータD71を置換要否判定部125に与える。
置換要否判定部125は、矩形71を囲む環状の画素列81(または画素列82)における非文字属性の画素を注目画素として選び、注目画素がデータDC51の示す領域色と同一または近い画素色をもつ同色画素であるか否かを判定する。そして、置換要否判定部125は、注目画素の個数に対する同色画素の個数の比率Rを算出し、比率Rと閾値Rthとを比較する。比率Rが閾値Rth以上である場合に、置換要否判定部125は文字属性領域51の属性の置換が必要であると判定する。
属性置換部126は、置換要否判定部125による判定の結果を受けて、文字属性領域51の属性を文字属性から非文字属性に置換する。属性画像42に対する属性を置換する部分修正によって得られた修正後の属性画像42aが、画像40の領域判別情報として図示しない後段の画像処理ブロックに送られる。
図8は属性修正ブロック120によって行なわれる属性修正処理の流れを示している。
矩形設定部123による矩形71の設定(#11)と、領域色取得部122による文字属性領域51の領域色の算出(#12)とに続いて、画素色判別ループの処理が行なわれる。画素色判別ループでは、矩形71を囲む画素列81(または画素列82)を構成する全画素が1画素ずつ順に処理の対象とされる。画素色判別ループの最初のステップ#13において、置換要否判定部125が画素の属性を判別する。注目した画素の属性が文字属性であれば(#13でYES)、置換要否判定部125は当該画素を以降の処理の対象から除外する。これによって、比率Rの算出に関わるべき非文字属性の注目画素が選定されたことになる。矩形71を囲む非文字属性の画素である注目画素の画素色が置換要否判定部125によって画像40から取得され(#14)、注目画素の色と文字属性領域51の領域色との色差が算出される(#15)。色差が閾値以下であれば(#16でYES)、注目画素は同色画素である。この場合、置換要否判定部125は同色画素の個数Qのカウントを一つインクリメントし(#17)、かつ注目画素の個数Qのカウントを一つインクリメントする(#18)。色差が閾値を超える場合は(#16でNO)、置換要否判定部125は注目画素の個数Qのカウントを一つインクリメントする(#18)。こうして画素色判別ループにおいて、矩形71を囲む注目画素の個数Qと注目画素のうちの同色画素の個数qとを数え終えると、置換要否判定部125は個数Qに対する個数qの比率Rを算出して閾値Rthと比較する(#19)。比率Rと閾値Rthとの大小関係によって置換要否の判定結果が決まる。比率Rが閾値Rth以上であれば(#19でYES)、属性置換部126が属性画像42における文字属性領域51の属性を文字属性から非文字属性に置換する(#20)。比率Rが閾値Rth未満であれば(#19でNO)、文字属性領域51の属性は置換されない。
〔第2実施形態〕
上述のように属性画像42において一つの文字が文字属性の部分と非文字属性の部分とに分かれると、文字属性領域に対する画像処理を加えた画像が不自然に見える問題が生じる。この問題に対して、第2実施形態では、非文字属性領域を文字属性領域に置換して属性を統一するという上述の解決策[2]が適用される。
図9は第2実施形態に係る属性修正処理を模式的に示している。図9の上部中央に描かれた画像40は、上述の第1実施形態と同様に、図2に例示されるドキュメント4を電子化した画像の要部であり、属性修正処理に関わる文字領域50を有する。画像40に対して、第1実施形態と同様に文字を検出するアルゴリズムによる領域判別が行なわれ、それによって定められた各画素の属性を示す属性画像42が生成される。
属性画像42は、文字領域50の一部分に対応する文字属性領域51を有する。文字属性領域51の各画素の属性は文字属性である。属性画像42における文字属性領域51以外の部分は非文字属性領域であり、属性が非文字属性と定められた画素のみから構成される。属性画像42における非文字属性領域には、文字領域50のうちの文字属性領域51に対応する部分以外の部分に対応する領域52を含んでいる。この領域52が、第2実施形態における属性置換の対象である。以下では領域52を“対象領域52”という。
対象領域52は属性画像42ではその領域範囲(領域を構成する画素)が顕在化されていない。つまり、属性画像42において対象領域52を特定することができない。そこで、対象領域52を特定するための画像処理が行なわれる。簡便な処理は、濃度が閾値よりも大きい画素または濃度が閾値よりも小さい画素を抽出する2値化である。
2値化は、画像40から文字属性領域51を除く部分を抽出した画像41に対して行なわれる。文字属性領域51を除くとは、2値化の閾値よりも濃度が大きい画素を抽出する場合には文字属性領域51の濃度を閾値より小さい濃度とみなし、閾値よりも濃度が小さい画素を抽出する場合には文字属性領域51の濃度を閾値より大きい濃度とみなすことを意味する。2値化される画像41は、対象領域52(厳密にはこれに対応する部分)とそれ以外の非文字属性領域41A(厳密にはこれに対応する部分)とを有する。一般に、ドキュメントにおける文字とその周囲との間には視覚的に区別可能な濃度差(色差を含む)があるので、2値化によって対象領域52を顕在化させることができる。図9の例示の2値化では、濃度が閾値よりも大きい画素が抽出される。ただし、周囲よりも淡い文字の存在が想定する場合には、濃度が閾値よりも小さい画素を抽出する2値化を行なえばよい。
2値化によって対象領域52の特定が可能になった後、基本的には第1実施形態と同様の手順によって、対象領域52とその周囲との連続性が検出される。
まず、2値化画像44において顕在化した対象領域52の周囲の色をサンプリングするため、外接する仮想の矩形72が設定され、矩形72を囲む1画素幅の環状の画素列91がサンプリング箇所として選定される。このとき、文字属性領域51との連続性の有無を検出することができればよいので、画素列91のうちの属性が文字属性である画素のみをサンプリングすべき注目画素に選定するのがよい。
次に、連続性の有無の判定に用いる比率Rを算出するため、対象領域52の領域色が求められ、画素列91における複数の注目画素のそれぞれについて、画素色と対象領域52の領域色との色差が設定値よりも小さい画素(同色画素)であるか否かが判定される。
全ての注目画素についての判定が終わると、画素列91における注目画素の個数Qに対する同色画素の個数qの比率Rが算出される。そして、比率Rと閾値“Rth2”とが比較される。比較の結果、比率Rが閾値Rth2以上であれば対象領域52が文字属性領域51と連続しているとみなされる。
図9の模式的な例では、画素列91は画素9a,9b,9c,9d,9e,9f,9g,9s,9wを含む82個の画素で構成されており、82個の画素のうちの6個の画素9b,9c,9d,9e,9f,9gが注目画素でありかつ同色画素である。ただし、実際の画素数は画像の解像度に依存する。第2実施形態では注目画素が文字属性の画素に限られているので、第1実施形態の閾値Rthと比べて大きい閾値Rth2を定めるのがよい。
対象領域52と文字属性領域51とが連続するということは、対象領域52が文字の一部分に対応するということである。つまり、画像40内の文字領域50が文字属性の部分と非文字属性の部分とに区分されている。したがって、比率Rが閾値Rth2以上であれば、文字内の属性を統一する属性置換を行う必要である。上述のとおり、第2実施形態では、非文字属性領域が文字属性領域に置換される。図示された処理後の属性画像42bでは、処理前の属性画像42における非文字属性をもつ対象領域52が文字属性領域52aに置換されている。
図10は第2実施形態に係る画像処理装置100bの構成を示している。図10において図7の画像処理装置100の要素と同一の要素には同一の符号が付されている。
画像処理装置100bは、属性修正処理を受け持つ属性修正ブロック130を備える。属性修正ブロック130は、領域判別ブロック110によって生成された属性画像42を必要に応じて修正した属性画像42bを生成する。
図9および図10を参照する。属性修正ブロック130において、対象領域特定部131は、属性画像42の示す文字属性領域51を除く部分を画像40から抽出して2値化する。これによって属性画像42における対象領域52が顕在化される。領域色取得部132は、2値化画像44によって特定される対象領域52の領域色を、画像40の色情報に基づく平均値計算によって取得し、領域色を示すデータDC52を置換要否判定部135に与える。矩形設定部133は、対象領域52に外接する仮想の矩形72を設定し、矩形72の位置を示すデータD72を置換要否判定部135に与える。
置換要否判定部135は、矩形72を囲む画素列91における文字属性の画素を注目画素として選び、注目画素がデータDC52の示す領域色と同一または近い画素色をもつ同色画素であるか否かを判定する。そして、置換要否判定部135は、注目画素の個数Qに対する同色画素の個数qの比率Rを算出し、比率Rと閾値Rth2とを比較する。比率Rが閾値Rth2以上である場合に、置換要否判定部135は対象領域52の属性の置換が必要であると判定する。
属性置換部136は、置換要否判定部135による判定の結果を受けて、対象領域52の属性を非文字属性から文字属性に置換する。属性画像42に対する属性を置換する部分修正によって得られた修正後の属性画像42bが、画像40の領域判別情報として図示しない後段の画像処理ブロックに送られる。
図11は属性修正ブロック130によって行なわれる属性修正処理の流れを示している。
対象領域特定部131による画像41の2値化(#10)と、矩形設定部133による矩形72の設定(#11b)と、領域色取得部132による対象領域52の領域色の算出(#12b)とに続いて、画素色判別ループの処理が行なわれる。画素色判別ループでは、矩形72を囲む画素列91を構成する全ての画素が1画素ずつ順に処理の対象とされる。画素色判別ループの最初のステップ#13において、置換要否判定部135が画素の属性を判別する。注目した画素の属性が文字属性でなければ、すなわち非文字属性であれば(#13でNO)、置換要否判定部135は当該画素を以降の処理の対象から除外する。これによって、比率Rの算出に関わるべき文字属性をもつ注目画素が選定されたことになる。
続いて、置換要否判定部135は注目画素の画素色を画像40から抽出し(#14)、注目画素の画素色と対象領域52の領域色との色差を算出する(#15b)。色差が閾値以下であれば(#16でYES)、注目画素は同色画素である。この場合、置換要否判定部135は同色画素の個数qのカウントを一つインクリメントし(#17)、かつ注目画素の個数Qのカウントを一つインクリメントする(#18)。色差が閾値を超える場合は(#16でNO)、置換要否判定部135は注目画素の個数Qのカウントを一つインクリメントする(#18)。こうして画素色判別ループにおいて、矩形72を囲む注目画素の個数Qと注目画素のうちの同色画素の個数qとを数え終えると、置換要否判定部135は個数Qに対する個数qの比率Rを算出して閾値Rth2と比較する(#19)。比率Rが閾値Rth2以上であれば(#19でYES)、置換要否判定部135は矩形72に内包される画素の総数を特定する矩形サイズとサイズ閾値とを比較する(#19B)。矩形サイズとサイズ閾値との比較は、例えば図4に示した三角形60のような巨大な非文字属性部分を文字属性領域に置換してしまうのを防ぐための処理である。この処理のためのファームウェアを置換要否判定部135は用いる。矩形サイズとサイズ閾値との大小関係によって置換要否の判定結果が決まる。矩形サイズがサイズ閾値以下であれば(#19BでYES)、属性置換部136が属性画像42における対象領域52の属性を非文字属性から文字属性に置換する(#20b)。比率Rが閾値Rth2未満である場合(#19でNO)、および矩形サイズがサイズ閾値を超える場合(#19BでNO)、対象領域52の属性は置換されない。
図12は画像処理回路16を備える画像形成装置10の構成の一例を示している。上述の第1実施形態の画像処理装置100および第2実施形態の画像処理装置100bは、画像処理回路16または画像処理回路16の一部として画像形成装置10に組入れることができる。
図12において、画像形成装置10は、コピーおよびファクシミリ通信を含む多数の機能を有するMFP(Multi-functional Peripheral)である。画像形成装置10は操作パネル14によるユーザーの指示および通信インタフェース15を介して通信する外部機器からの要求に応じる。例えば、コピー動作において、ADF(Auto Document Feeder)12が原稿シートをイメージスキャナー13の読取り位置へ搬送し、イメージスキャナー13が原稿シートから画像を読み取る。イメージスキャナー13によってデータ化された画像に対して画像処理回路16が画質を最適化する画像処理を加え、処理後の画像をプリンターエンジン17が例えば電子写真法によって用紙に印刷する。
画像処理回路16は、ASIC技術によって作製された画像処理用のプロセッサーを備える。このプロセッサーは、入力された画像を文字属性領域と非文字属性領域とに区分する領域判別ブロック110の機能、および領域判別の結果を必要に応じて修正する属性修正ブロック120(または130)の機能を実現する。
画像形成装置10の動作はコントローラー11によって制御される。コントローラー11は、制御用プログラムおよびアプリケーションプログラムを実行するコンピューターとしてのCPU(Central Processing Unit)を有している。プログラムはROM(Read-Only Memory)に記憶されており、プログラムの実行に際してRAM(Random Access Memory)がワークエリアとして用いられる。
以上の第1実施形態および第2実施形態によれば、属性置換の要否判定の対象である領域(文字属性領域51、対象領域52)に外接する矩形71,72を設定するので、当該領域の周囲の色のサンプリングを簡便に行うことができる。領域の輪郭に沿ってサンプリングするのと違って、輪郭に沿うための複雑なフィルターが不要であり、矩形71,72の座標計算だけでサンプリングすべき画素を決定することができる。
第1実施形態によれば、属性画像42によって領域範囲が既に特定されている文字属性領域51を属性置換の対象領域とするので、対象領域を特定するための顕在化処理が不要となる分の処理時間の短縮およびリソースの負担軽減を図ることができる。
第2実施形態によれば、矩形72のサイズが閾値以下である場合に限って非文字属性を文字属性に置換する(文字化する)ので、巨大な図形の一部が文字属性領域である誤判別された画像に対し、非文字属性領域であると正しく判別されていた残りの図形部分まで文字化してしまう、という副作用を防ぐことができる。
第1実施形態および第2実施形態において、装置の構成および処理の実行順序を本発明の趣旨に沿う範囲内で適宜変更することができる。例えば、上述の第2実施形態では、比率Rの算出に関わる注目画素を文字属性の画素に限定したが、そのような限定をせず、画素列91の画素を全て注目画素としてもよい。ただし、その場合、非文字属性領域41Aにも対象領域52の領域色に似た色をもつ画素の存在する可能性を否定できないので、連続性の検出の信頼性を高めるために、同色画素を文字属性の画素に限定するのがよい。また、第2実施形態において、矩形72のサイズとサイズ閾値との比較を、比率Rを算出する以前、または比率Rと閾値Rth2を比較する以前に行ってもよい。対象領域52を特定するための処理として、例えば文字色が限定されている場合には限定色に対応した設定範囲内の画素値をもつ画素を抽出してもよい。
画像処理装置100,100bの機能をソフトウェアによって、またはソフトウェアとハードウェアとの組合せによって実現してもよい。例えば、画像形成装置10において実現する場合、画像処理用のプログラムを実行するコンピューターとして、コントローラー11のCPUを用いることができる。そのプログラムをコントローラー11のROMに記憶させてもよいし、画像形成装置10に組み付けられるハードディスクドライブのようなストレージに記憶させてもよい。
100,100b 画像処理装置
51 文字属性領域
52 対象領域(非文字属性領域)
41A 非文字属性領域
40 画像
71,72 矩形
123,133 矩形設定部(設定部)
8a,8b,8c,8d,8e,8f,8g,8h,8i 画素
9b,9c,9d,9e,9f,9g 画素
125,135 置換要否判定部(判定部)
126,136 属性置換部(置換部)
81,82,91 画素列

Claims (12)

  1. 画素ごとに文字属性と非文字属性とのいずれかが定められた画像に対して画像処理を行う画像処理装置であって、
    前記画像における前記文字属性をもつ画素で構成される文字属性領域に対して、当該文字属性領域に外接する矩形を設定する設定部と、
    前記画像における前記矩形の周囲の複数の画素のそれぞれについて、画素色と前記文字属性領域の色との色差が設定値よりも小さい同色画素であるか否か、を判定する判定部と、
    前記判定部による判定の対象である前記複数の画素の個数に対する前記同色画素であると判定された画素の個数の比率が閾値以上である場合に、前記文字属性領域内の画素の属性を前記文字属性から前記非文字属性に置換する置換部と、を備える
    ことを特徴とする画像処理装置。
  2. 前記判定部による判定の対象である前記複数の画素は、前記画像における前記矩形を囲む1画素幅の環状の画素列に含まれる
    請求項1記載の画像処理装置。
  3. 前記環状の画素列は、その全周にわたって前記矩形から少なくとも1画素離れている
    請求項2記載の画像処理装置。
  4. 前記判定部による判定の対象である前記複数の画素は、前記非文字属性をもつ画素である
    請求項1ないし3のいずれかに記載の画像処理装置。
  5. 画素ごとに文字属性と非文字属性とのいずれかが定められた画像に対して画像処理を行う画像処理装置であって、
    前記画像における前記非文字属性をもつ画素で構成される非文字属性領域のうちの設定範囲内の画素値をもつ部分である対象領域に対して、当該対象領域に外接する矩形を設定する設定部と、
    前記画像における前記矩形に接しかつ囲む環状の画素列に含まれる複数の画素のそれぞれについて、画素色と前記対象領域の色との色差が設定値よりも小さい同色画素であるか否か、を判定する判定部と、
    前記判定部による判定の対象である前記複数の画素の個数に対する前記同色画素であると判定された画素の個数の比率が閾値以上である場合に、前記対象領域内の画素の属性を前記非文字属性から前記文字属性に置換する置換部と、を備える
    ことを特徴とする画像処理装置。
  6. 前記対象領域は、前記画像における前記非文字属性領域のうちの濃度が2値化閾値よりも大きいかまたは小さい部分である
    請求項5記載の画像処理装置。
  7. 前記判定部による判定の対象である前記複数の画素は、前記文字属性をもつ画素である
    請求項5または6記載の画像処理装置。
  8. 前記置換部は、前記矩形のサイズが設定サイズよりも小さく、かつ前記比率が前記閾値以上である場合に、前記対象領域内の画素の属性を前記非文字属性から前記文字属性に置換する
    請求項5ないし7のいずれかに記載の画像処理装置。
  9. 画素ごとに文字属性と非文字属性とのいずれかが定められた画像のための画像処理方法であって、
    前記画像における前記文字属性をもつ画素で構成される文字属性領域に対して、当該文字属性領域に外接する矩形を定め、
    前記画像における前記矩形の周囲の複数の画素のそれぞれについて、画素色と前記文字属性領域の色との色差が設定値よりも小さい同色画素であるか否か、を判定し、
    判定の対象である前記複数の画素の個数に対する前記同色画素であると判定された画素の個数の比率が閾値以上である場合に、前記文字属性領域内の画素の属性を前記文字属性から前記非文字属性に置換する
    ことを特徴とする画像処理方法。
  10. 画素ごとに文字属性と非文字属性とのいずれかが定められた画像のための画像処理方法であって、
    前記画像における前記非文字属性をもつ画素で構成される非文字属性領域のうちの設定範囲内の画素値をもつ部分である対象領域に対して、当該対象領域に外接する矩形を定め、
    前記画像における前記矩形に接しかつ囲む環状の画素列に含まれる複数の画素のそれぞれについて、画素色と前記対象領域の色との色差が設定値よりも小さい同色画素であるか否か、を判定し、
    前記判定部による判定の対象である前記複数の画素の個数に対する前記同色画素であると判定された画素の個数の比率が閾値以上である場合に、前記対象領域内の画素の属性を前記非文字属性から前記文字属性に置換する
    ことを特徴とする画像処理方法。
  11. 画素ごとに文字属性と非文字属性とのいずれかが定められた画像に対して画像処理を行う画像処理装置において実行されるコンピュータープログラムであって、
    前記画像処理装置が有するコンピューターに、
    前記画像における前記文字属性をもつ画素で構成される文字属性領域に対して、当該文字属性領域に外接する矩形を設定する設定処理と、
    前記画像における前記矩形の周囲の複数の画素のそれぞれについて、画素色と前記文字属性領域の色との色差が設定値よりも小さい同色画素であるか否か、を判定する判定処理と、
    前記判定処理による判定の対象である前記複数の画素の個数に対する前記同色画素であると判定された画素の個数の比率が閾値以上である場合に、前記文字属性領域内の画素の属性を前記文字属性から前記非文字属性に置換する置換処理と、を実行させる
    ことを特徴とするコンピュータープログラム。
  12. 画素ごとに文字属性と非文字属性とのいずれかが定められた画像に対して画像処理を行う画像処理装置において実行されるコンピュータープログラムであって、
    前記画像処理装置が有するコンピューターに、
    前記画像における前記非文字属性をもつ画素で構成される非文字属性領域のうちの設定範囲内の画素値をもつ部分である対象領域に対して、当該対象領域に外接する矩形を定める設定処理と、
    前記画像における前記矩形に接しかつ囲む環状の画素列に含まれる複数の画素のそれぞれについて、画素色と前記対象領域の色との色差が設定値よりも小さい同色画素であるか否か、を判定する判定処理と、
    前記判定部による判定の対象である前記複数の画素の個数に対する前記同色画素であると判定された画素の個数の比率が閾値以上である場合に、前記対象領域内の画素の属性を前記非文字属性から前記文字属性に置換する置換処理と、を実行させる
    ことを特徴とするコンピュータープログラム。
JP2012038510A 2012-02-24 2012-02-24 画像処理装置、画像処理方法およびコンピュータープログラム Active JP5825142B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012038510A JP5825142B2 (ja) 2012-02-24 2012-02-24 画像処理装置、画像処理方法およびコンピュータープログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012038510A JP5825142B2 (ja) 2012-02-24 2012-02-24 画像処理装置、画像処理方法およびコンピュータープログラム

Publications (2)

Publication Number Publication Date
JP2013175887A true JP2013175887A (ja) 2013-09-05
JP5825142B2 JP5825142B2 (ja) 2015-12-02

Family

ID=49268435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012038510A Active JP5825142B2 (ja) 2012-02-24 2012-02-24 画像処理装置、画像処理方法およびコンピュータープログラム

Country Status (1)

Country Link
JP (1) JP5825142B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022065299A1 (ja) * 2020-09-24 2022-03-31 京セラドキュメントソリューションズ株式会社 画像形成装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288589A (ja) * 2001-03-26 2002-10-04 Ricoh Co Ltd 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008092447A (ja) * 2006-10-04 2008-04-17 Fuji Xerox Co Ltd 画像処理装置、画像出力装置、および画像処理方法
JP2009272889A (ja) * 2008-05-07 2009-11-19 Canon Inc 画像処理装置及び画像処理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288589A (ja) * 2001-03-26 2002-10-04 Ricoh Co Ltd 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008092447A (ja) * 2006-10-04 2008-04-17 Fuji Xerox Co Ltd 画像処理装置、画像出力装置、および画像処理方法
JP2009272889A (ja) * 2008-05-07 2009-11-19 Canon Inc 画像処理装置及び画像処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022065299A1 (ja) * 2020-09-24 2022-03-31 京セラドキュメントソリューションズ株式会社 画像形成装置

Also Published As

Publication number Publication date
JP5825142B2 (ja) 2015-12-02

Similar Documents

Publication Publication Date Title
US9179035B2 (en) Method of editing static digital combined images comprising images of multiple objects
KR102015926B1 (ko) 화상처리장치, 화상처리장치의 제어 방법 및 기억 매체
US10359727B2 (en) Image processing apparatus, image processing method, and storage medium, that determine a type of edge pixel
JP5042917B2 (ja) 画像処理装置およびプログラム
JP2016058879A (ja) 画像処理装置及び画像処理方法
JP2020010163A (ja) 画像処理装置、画像処理方法、コンピュータプログラム及び記録媒体
US11706371B2 (en) Apparatus and method for performing enhancement processing on color information
JP5187331B2 (ja) 画像処理装置、画像処理方法、およびコンピュータプログラム
JP5407627B2 (ja) 画像処理装置、画像処理方法、プログラム
JP2018088204A (ja) 画像処理装置及びプログラム
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
JP4502001B2 (ja) 画像処理装置および画像処理方法
US20110286672A1 (en) Translucent image detection apparatus, translucent image edge detection apparatus, translucent image detection method, and translucent image edge detection method
JP6693310B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP5825142B2 (ja) 画像処理装置、画像処理方法およびコンピュータープログラム
JP5975945B2 (ja) 画像処理装置
US8260057B2 (en) Image processing apparatus that obtains a ruled line from a multi-value image
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
US20120194883A1 (en) Character detection apparatus, character detection method, and computer-readable storage medium
US20150071543A1 (en) Image processing apparatus, image processing method, and medium
US9098768B2 (en) Character detection apparatus, character detection method, and computer-readable storage medium
US11405525B2 (en) Image processing apparatus, control method, and product capable of improving compression efficiency by converting close color to background color in a low light reading mode
JP5803643B2 (ja) 画像処理装置、画像処理方法およびコンピュータープログラム
US10587775B2 (en) Image processing apparatus, image processing method, and storage medium for edge enhancement based on plural conditions
JP2012231261A (ja) 画像処理装置およびその制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150630

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150827

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150928

R150 Certificate of patent or registration of utility model

Ref document number: 5825142

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150