JP2009033493A - 画像処理装置、画像処理方法、プログラムおよび記録媒体 - Google Patents

画像処理装置、画像処理方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2009033493A
JP2009033493A JP2007195475A JP2007195475A JP2009033493A JP 2009033493 A JP2009033493 A JP 2009033493A JP 2007195475 A JP2007195475 A JP 2007195475A JP 2007195475 A JP2007195475 A JP 2007195475A JP 2009033493 A JP2009033493 A JP 2009033493A
Authority
JP
Japan
Prior art keywords
edge
character
pixel
background
character edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007195475A
Other languages
English (en)
Inventor
Noriko Miyagi
徳子 宮城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2007195475A priority Critical patent/JP2009033493A/ja
Publication of JP2009033493A publication Critical patent/JP2009033493A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】高濃度網点背景上に存在する文字エッジを識別する第1の文字エッジ識別手段と、低濃度網点背景上に存在する文字エッジを識別する第2の文字エッジ識別手段を持ち、異なる特徴を用いて文字エッジ識別を行うことにより、各々で最適かつ高精度な網点上文字エッジ識別を実現する
【解決手段】第1の文字エッジ識別手段2001は、cmy信号の各信号から高濃度網点上文字エッジを識別する。第2の文字エッジ識別手段2002は、cmy信号の各信号から低濃度網点上文字エッジを識別する。OR2003で論理和演算を行い、高濃度網点上文字エッジまたは低濃度網点上文字エッジを、文字エッジと識別する。
【選択図】図2

Description

本発明は、スキャナで読み取った画像あるいはネットワークを介して取得した画像に対して、文字領域の識別を行い、識別結果に応じて異なる画像処理を実行する画像処理装置、画像処理方法、プログラムおよび記録媒体に関する。
スキャナ読取画像から、白背景上文字領域と絵柄領域(この場合は白背景上文字領域以外の領域)を識別し、識別結果に応じてフィルタ、墨処理、擬似階調処理等の画像処理を切り換える装置がある。このような画像処理の切り換えは、文字を鮮鋭に再現し、絵柄はざらつきを抑えて再現するために行うものであり、本来であれば網点背景上の文字も白背景上文字と同様に鮮鋭に再現したいが、網点上文字は網点絵柄中のエッジとの識別が困難であるため、絵柄部への影響を考慮して絵柄領域として処理している。
例えば、特許文献1、2では、白背景上文字と網点上文字を区別することなく、文字領域と絵柄領域を識別している。どちらも画像を2値化し、2値信号の連続性により文字を識別する技術であるが、網点絵柄エッジが比較的急峻である場合は特に、網点上文字エッジを網点絵柄エッジと切り分けて識別できない。
図50(a)は閾値th1で2値化処理した2値画像、図50(b)はth1よりも高濃度側の閾値th2で2値化処理した2値画像である。網点上文字エッジであっても、例えば解像度600dpiのスキャナで読み取った画像の場合、網点率が30%以下くらいの低濃度の網点背景であれば、閾値を適切に設定することにより図50(b)のように文字部を黒画素、網点背景を白画素として2値化することができる。スキャナの特性上、解像度やMTFの影響で、網点のピーク濃度よりも線画の尾根濃度の方がスキャナ読取値が高濃度になる傾向があり(図3の右図)、閾値を適切に設定できれば図50(b)のような2値化結果が得られる。
図50(b)において、網点絵柄中エッジと網点上文字エッジの識別が課題になるが、両者の違いは網点絵柄中エッジの方がエッジ部に局所的な凹凸があるのに対して、網点上文字エッジは局所的に見ても本来の文字形状に沿った滑らかなエッジで構成されており、局所的な凹凸が非常に少ない、という点にある。横線あるいは縦線はスキャナ読取時のノイズにより比較的凹凸が出やすいが、それでも1ドット程度の凹凸である。エッジ部の局所的な凹凸は、文字エッジ識別の有効な特徴になる。
一方、網点率が30%を越えるような高濃度の網点背景の場合は、スキャナ読取値で網点のピーク濃度と線画の尾根濃度の差が殆どなくなってしまい(図3の右図)、どのように閾値を設定したとしても図50(b)のような2値画像を得ることができない。網点と線画の濃度値の僅かな差を利用して閾値を設定したとしても、ノイズの影響もあり、文字エッジが滑らかなエッジにはならないため、エッジ部の局所的な凹凸で文字エッジ識別を行うことは不可能である。
そこで、高濃度背景の場合は、図50(a)のように網点ドットを黒画素として残すような量子化を行い、エッジ部の局所的な凹凸とは別の特徴を用いて文字エッジの識別を行う方が良い。また、高濃度網点背景に限定すれば、極端な場合、文字エッジを抽出することに重きを置いて絵柄エッジでの誤りを多少許容するような特徴を用いたとしても、画像全体としては識別精度が大幅に悪化することはまず無いとも言える。
上記した特許文献1、2の場合、白背景上文字と網点上文字を区別していないので、当然、網点上文字に関しても背景濃度に応じて異なる特徴を用いて文字エッジ識別を行ってはいない。そのため、低濃度背景上文字と高濃度背景上文字の両方に対して最適な識別結果が得られるとは言い難い。また、絵柄エッジで、局所的な凹凸があったとしても文字エッジと判定してしまう。特許文献1、2が発明された当時、スキャナの解像度が今より格段に低く、網点形状が厳密に読み取られなかったためにエッジ部の局所的な形状で識別することが難しかったという事情もある。
特開平2−292957号公報 特開平1−227573号公報 特開2002−199210号公報
ところが、近年のスキャナの高解像度化に伴い、網点上文字を意識的に抽出する技術が提案されている。例えば、特許文献3では、網点上の文字を抽出しているが、網点上文字エッジと網点絵柄中エッジとを切り分けて識別していない。
本発明の目的は、高濃度網点背景上に存在する文字エッジを識別する第1の文字エッジ識別手段と、低濃度網点背景上に存在する文字エッジを識別する第2の文字エッジ識別手段を持ち、異なる特徴を用いて文字エッジ識別を行うことにより、各々で最適かつ高精度な網点上文字エッジ識別を実現する画像処理装置、画像処理方法、プログラムおよび記録媒体を提供することにある。
本発明は、画像中の網点上文字エッジを含む文字エッジを識別する装置において、高濃度網点背景上に存在する文字エッジを識別する第1の文字エッジ識別手段と、低濃度網点背景上に存在する文字エッジを識別する第2の文字エッジ識別手段を有することを最も主要な特徴とする。
請求項1、9:高濃度網点背景上に存在する文字エッジを識別する第1の文字エッジ識別手段/工程と、低濃度網点背景上に存在する文字エッジを識別する第2の文字エッジ識別手段/工程を有するため、各々に対して最適な特徴を用いて文字エッジ識別を行うことができ、特に網点上文字エッジを高精度に識別することができる。
請求項2:第1の文字エッジ識別手段は、第1の量子化手段を有し、第2の文字エッジ識別手段は、第2の量子化手段を有し、第1の量子化手段は低濃度網点背景を消去する量子化を行い、第2の量子化手段は高濃度網点背景を消去しない量子化を行い、夫々、量子化後の画像データから異なる特徴に基づいて文字エッジを識別するため、各々の識別で使用する特徴に適した量子化を前処理として行うことができ、各々に対して最適な特徴を用いて文字エッジ識別を行うことにより、特に網点上文字エッジを高精度に識別することができる。
請求項3〜6:連結黒画素や(背景濃度や平坦さに基づき判定した)高濃度背景や白孤立点に基づいて、高濃度網点背景上に存在する文字エッジを識別するため、対象とする濃度域の網点背景上に存在する文字を絵柄エッジと切り分けて高精度に識別することができる。
請求項7:第2の文字エッジ識別手段は、エッジ部の滑らかさを判定する滑らかさ判定手段を有し、エッジ部の滑らかさに基づき、文字エッジを識別するため、特に低濃度網点上文字に関しては、高精度に絵柄エッジと切り分けて識別することができる。
請求項8:高濃度網点背景上に存在する文字エッジを識別する第1の文字エッジ識別手段、低濃度網点背景上に存在する文字エッジを識別する第2の文字エッジ識別手段、白背景上に存在する文字エッジを識別する第3の文字エッジ領域識別手段を有するため、各々に対して最適な特徴を用いて文字エッジ識別を行うことができ、網点上文字エッジおよび白地上文字エッジを高精度に識別することができる。
以下、発明の実施の形態について図面により詳細に説明する。
実施例1:
図1は、本発明の実施例1の構成を示す。スキャナ10は、原稿を読み取ることによりRGB信号からなる画像データを取得し、スキャナγ補正手段11はスキャナのγ特性を補正し、反射率リニアの信号から濃度リニアの信号へ変換する。スキャナ色補正手段12は、スキャナ特性に依存したRGB信号をスキャナに依存しないデバイス非依存のR’G’B’信号に変換する。
画像属性判定手段20は、RGB信号から文字エッジ領域を抽出する。文字エッジ領域には、白背景上文字も網点上文字も含まれる。エッジ量抽出手段30は、R’G’B’信号から画像中のエッジらしさを表す信号であるエッジ量を抽出する。フィルタ処理手段13は、画像属性判定手段20およびエッジ量抽出手段30の結果に基づき、網点部の起伏を抑えてモアレを抑制する平滑化処理、および、文字部の鮮鋭性を高めるエッジ強調処理を行う。プリンタ色補正手段14は、デバイス非依存のR’G’B’信号からプリンタ特性に依存したC’M’Y’信号への変換を行う。
エッジ量抽出手段40は、C’M’Y’信号から画像中のエッジらしさを表す信号であるエッジ量を抽出する。UCR/墨生成手段15は、画像属性判定手段20およびエッジ量抽出手段40の結果に基づき、C’M’Y’データに応じてK信号を発生させ(墨生成)、C’M’Y’からKに応じた量を減ずる(下色除去(UCR))。CMYKはプリンタの色材色に対応している。UCR/墨生成後の信号に対して、プリンタγ補正手段16、擬似階調処理手段17による処理を施し、プリンタ18で記録媒体上に画像を出力する。プリンタγ補正手段16は、プリンタの濃度特性に合わせて濃度変換テーブルを用いた変換処理を行う。擬似階調処理手段17では、ディザや誤差拡散等の擬似中間調処理を行う。
図2は、画像属性判定手段20の構成を示す。RGB→CMY変換手段201は、原稿のプロセスカラーに対応したcmy信号に変換し、第1の文字エッジ識別手段2001において高濃度網点上文字エッジを識別し、第2の文字エッジ識別手段2002において低濃度網点上文字エッジを識別し、OR2003において論理和演算を行い、高濃度網点上文字エッジまたは低濃度網点上文字エッジである場合に、画像属性判定手段20の判定結果として文字エッジを出力する。
RGB→CMY変換手段201は、次式(1)によりR’G’B’信号から原稿のプロセスカラーに対応したcmy信号への変換を行う。
c=a0+a1×R+a2×G+a3×B
m=b0+b1×R+b2×G+b3×B
y=c0+c1×R+c2×G+c3×B (式1)
a0〜a3、b0〜b3、c0〜c3は、プロセスカラーのカラーパッチをスキャナで読み込み、RGB読取値とカラーパッチの色の関係に基づき予め設定されたパラメータである。
図4は、第1の文字エッジ識別手段2001の構成を示す。cmy信号各々に対して3値化(501、511、521)を行い、連結黒画素エッジ抽出の前処理として連結黒画素エッジ抽出(502、512、522)、白孤立点密度判定の前処理として白孤立点抽出(503、513、523)、高濃度背景抽出の前処理として背景濃度算出(504、514、524)と平坦さ判定(507、517、527)を行った後、連結黒画素エッジ抽出(505、515、525)/白孤立点密度判定(506、516、526)/高濃度背景抽出(508、518、528)、文字絵柄識別(509、519、529)を行い、OR530において各cmy信号から識別された文字エッジの論理和演算を行う。cmyいずれかの信号で文字エッジと識別されれば、第1の文字エッジ識別手段2001の結果は文字エッジになる。
図5は、3値化手段501、511、521の構成を示す。閾値Th1とTh2(Th1<Th2、図3参照)を予め設定しておき、注目画素の値がTh1未満であれば白画素、Th1以上かつTh2未満であれば中間画素、Th2以上であれば黒画素と判定する。Th1およびTh2の設定方法について説明する。網点率30%以上の網点を高濃度網点として抽出する場合、Th1は、30%網点上文字が黒画素または中間画素として抽出され、かつ、30%網点背景の網点ドットが網点のピーク部だけでなくほぼドット内に位置する全画素に関して黒画素または中間画素として抽出されるような閾値に設定しておく。Th2は、30%網点上文字が黒画素として抽出され、かつ、文字背景には存在しないが絵柄中には存在する網点率90%付近の網点が全て黒画素にならず、網点と網点の隙間に位置する画素が中間画素または白画素として抽出されるような閾値に設定しておく。Th1とTh2の2つの閾値を設定して3値化する理由は、Th1は主に後述の背景濃度算出および高濃度網点背景抽出の精度を確保するため、Th2は主に後述の白孤立点抽出および白孤立点密度判定の精度を確保するためであり、両立が困難であるためである。
図6(a)は、連結黒画素抽出手段502、512、522の構成を示す。連結黒画素パターンマッチング602では、注目画素を中心とした5×5画素を参照し、図6(b)〜(g)に図示した●を黒画素または中間画素とみなし、このパターン(b)〜(g)にマッチすれば注目画素を「連結黒画素1」として抽出する。
連結黒画素パターンマッチング603では、注目画素を中心とした5×5画素を参照し、図6(b)〜(g)に図示した●を黒画素とみなし、このパターン(b)〜(g)にマッチすれば注目画素を「連結黒画素2」として抽出する。図6(b)〜(g)において、●がない画素はDon’t Careである(黒画素でも中間画素でも白画素でも構わない)。信号生成手段604では、2ビット信号を生成し、連結黒画素1である場合は上位ビットを“1”、連結黒画素2である場合には下位ビットを“1”にする。連結黒画素1でも連結黒画素2でもない場合は、上位ビットも下位ビットも0で、“00”になる。後段で連結黒画素1の抽出結果と連結黒画素2の抽出結果を参照する場合には、各々該当するビットの信号値を参照すればよい。
図7(a)は、連結黒画素エッジ抽出手段505、515、525の構成を示す。非連結黒画素膨張手段605では、注目画素を中心とした3×3画素を参照し、1つでも連結黒画素2でない画素が存在すれば、“1”を出力する。全て連結黒画素2の場合は“0”を出力する。非連結黒画素に隣接した連結黒画素判定手段606では、注目画素が連結黒画素2であり、かつ、非連結黒画素膨張手段605の出力値が“1”の場合に、注目画素を連結黒画素エッジとして抽出する。つまり、注目画素が連結黒画素2であり、隣接する周辺画素に連結黒画素2でない画素が存在するか否かを判定しており、例えば図7(b)のような場合に連結黒画素エッジとして抽出される。図7(b)は、●が連結黒画素2、○が連結黒画素2でない画素を表している。
図8(a)は、白孤立点抽出手段503、513、523の構成を示す。白孤立点パターンマッチング607では、注目画素を中心とした5×5画素を参照し、図8(b)〜(o)に図示した●を連結黒画素1、○を連結黒画素1でない画素とみなし、このパターン(b)〜(o)にマッチすれば注目画素を「白孤立点1」として抽出する。
白孤立点パターンマッチング608では、注目画素を中心とした5×5画素を参照し、図8(b)〜(o)に図示した●を連結黒画素2、○を連結黒画素2でない画素とみなし、このパターンにマッチすれば注目画素を「白孤立点2」として抽出する。図8(b)〜(o)において、●や○がない画素はDon’t Careである(黒画素でも中間画素でも白画素でも構わない)。OR609では、論理和演算を行い、注目画素が白孤立点1または白孤立点2の場合に、白孤立点として抽出する。
図9は、白孤立点密度判定手段506、516、526の構成を示す。白孤立点計数手段610において、注目画素を中心とした15×15画素を参照し、白孤立点の数をカウントする。閾値判定手段611では、白孤立点の数が予め設定した閾値(ここでは8とする)よりも多ければ、注目画素が白孤立点領域の画素であると判定する。
図10(a)は、背景濃度算出手段504、514、524の構成を示す。注目画素を中心とした15×15画素を参照し、連結黒画素計数手段620において、連結黒画素1の画素数をカウントする。これとは別に、15×15画素を図10(b)に示した4領域に分け、連結黒画素計数手段−A612では領域Aにおける連結黒画素1の画素数をカウントする。連結黒画素計数手段−B614では領域Bにおける連結黒画素1の画素数をカウントする。連結黒画素計数手段−C616では領域Cにおける連結黒画素1の画素数をカウントする。連結黒画素計数手段−D618では領域Dにおける連結黒画素1の画素数をカウントする。
非連結黒画素の画像濃度平均算出手段−A613では、領域Aにおいて連結黒画素1でない画素の3値化前の信号(cまたはmまたはy信号)の合計値を算出し、それを連結黒画素1でない画素の数((7×7)−連結黒画素計数手段−A612の結果)で除算する。
非連結黒画素の画像濃度平均算出手段−B615では、領域Bにおいて連結黒画素1でない画素の3値化前の信号(cまたはmまたはy信号)の合計値を算出し、それを連結黒画素1でない画素の数((7×7)−連結黒画素計数手段−B614の結果)で除算する。
非連結黒画素の画像濃度平均算出手段−C617では、領域Cにおいて連結黒画素1でない画素の3値化前の信号(cまたはmまたはy信号)の合計値を算出し、それを連結黒画素1でない画素の数((7×7)−連結黒画素計数手段−C616の結果)で除算する。
非連結黒画素の画像濃度平均算出手段−D619では、領域Dにおいて連結黒画素1でない画素の3値化前の信号(cまたはmまたはy信号)の合計値を算出し、それを連結黒画素1でない画素の数((7×7)−連結黒画素計数手段−D618の結果)で除算する。
背景濃度の決定手段621では、連結黒画素計数手段620の結果が予め設定した所定画素数以上である場合、べた画像あるいは太文字の文字なかであるとして、濃度のとりうる最大値を背景濃度として出力する。cmy信号が各8ビット信号の場合は最大値は255である。所定画素数は、全画素数15×15の半数付近に設定しておく。
連結黒画素計数手段620の結果が前記所定画素数未満である場合、連結黒画素計数手段−A612と連結黒画素計数手段−B614と連結黒画素計数手段−C616と連結黒画素計数手段−D618の結果から、連結黒画素が最も少ない領域を探し、その領域の非連結黒画素の画像濃度平均を背景濃度とする。例えば、連結黒画素計数手段−A612の出力値が最も小さい場合、非連結黒画素の画像濃度平均算出−A613の出力値を背景濃度として出力する。連結黒画素1でない画素を背景画像中の画素とみなし、いずれかの領域における非連結黒画素の画像濃度平均を背景濃度としている。
図11は、平坦さ判定手段507、517、527の構成を示す。注目画素を中心とした9×9画素の背景濃度を参照し、最大値算出手段622において参照領域内の最大値を選択し、最小値算出手段623において参照領域内の最小値を選択する。差分演算手段624は最大値と最小値の差分、(最大値−最小値)の値を求め、閾値判定手段625において予め設定した閾値(ここでは30とする)と比較して、差分が閾値よりも小さい場合、注目画素を平坦背景として抽出する。網点率が一様な網点背景を平坦背景として抽出するのが目的である。
図12は、高濃度背景抽出手段508、518、528の構成を示す。平坦領域抽出手段629では、注目画素を中心とした9×9画素の平坦さ判定結果を参照し、参照領域内の全画素が平坦背景である場合に、注目画素を平坦領域の画素であると判定する。遅延ライン調整手段626は、平坦さ判定手段の結果と背景濃度算出手段の結果の画素が存在するラインの位置を合わせるため、4ライン分の背景濃度算出を一旦蓄積する。
平坦さ判定手段507、517、527は9×9画素を参照しているため、入力に対して4ライン遅れて結果が出力される。その分の遅延ライン調整が背景濃度算出の結果に対して必要になる。最小値算出手段627では、注目画素を中心とした9×9画素の遅延後の背景濃度を参照して、参照領域内における最小値を選択し、閾値判定手段628において予め設定した閾値(ここでは140とする)を用いて、閾値以上であれば高濃度背景候補として抽出する。閾値は、網点率30%以上を高濃度背景候補として抽出したい場合、網点率30%以上の領域が抽出されるように30%網点原稿のcmy値を参照して設定しておけばよい。AND630において、論理積演算を行い、注目画素が平坦領域かつ高濃度背景候補である場合に、注目画素を高濃度背景として抽出する。
図13は、文字絵柄識別手段509、519、529の構成を示す。高濃度背景抽出結果、連続黒画素エッジ抽出結果、白孤立点密度判定結果から、文字エッジを識別する。ここで識別されるのは、高濃度網点背景上文字エッジである。膨張手段631では、注目画素を中心とした5×5画素の連続黒画素エッジ抽出結果を参照し、参照領域内に1つでも連続黒画素エッジが存在すれば、注目画素を連続黒画素エッジとして信号“1”を出力する。
膨張手段632では、注目画素を中心とした13×13画素の白孤立点密度判定結果を参照し、参照領域内に1つでも白孤立点領域の画素が存在すれば、注目画素を白孤立点領域として信号“1”を出力する。信号反転手段633では、白孤立点領域に対して“1”、非白孤立点領域に対して“0”の信号が割り当てられていたものを反転し、非白孤立点領域に対して信号“1”が割り当てられるように変更する。
膨張後の連続黒画素エッジ、膨張および反転後の白孤立点領域に対して、遅延ライン調整手段634と遅延ライン調整手段635において高濃度背景抽出結果との遅延ライン調整のため、各々14ライン分と2ライン分を一旦蓄積し、AND636において3つの信号の論理積演算を行う。高濃度背景抽出結果も、高濃度背景に対して信号“1”を予め割り当てておき、3つの信号が全て“1”の場合に、注目画素を文字エッジとして識別する。高濃度背景、かつ、連続黒画素エッジ、かつ、非白孤立点領域の画素を抽出していることになる。
図14は、第2の文字エッジ識別手段2002の構成を示す。cmy信号各々に対して2値化(202、212、222)、エッジの滑らかさ判定(203、213、223)、連続エッジ検出(204、214、224)/ペアエッジ検出(205、215、225)/交点エッジ検出(206、216、226)、文字絵柄識別(207、217、227)を行い、OR208において各cmy信号から識別された文字エッジの論理和演算を行う。cmyいずれかの信号で文字エッジと識別されれば、第2の文字エッジ識別手段2002の結果は文字エッジになる。
図15(a)は、2値化手段202、212、222の構成を示す。ピーク画素検出は、注目画素が濃度変化の山を示す極点であるかどうかを、周囲の画素との濃度関係から判定するものである。M×M画素からなるブロック内において、中心画素の濃度レベルが他のすべての濃度レベルよりも高いときに、式2あるいは式3のようにして極点かどうかを判定する。式2によりピーク画素を検出しているのがピーク画素検出手段(3×3)231、式3によりピーク画素を検出しているのがピーク画素検出手段(5×5)232である。
M=3(図15(b))の場合、
(2m0−m1−m8)≧ΔmTH かつ、
(2m0−m2−m7)≧ΔmTH かつ、
(2m0−m3−m6)≧ΔmTH かつ、
(2m0−m4−m5)≧ΔmTH (式2)
M=5(図15(c))の場合、
(2m0−m1−m24)≧ΔmTH かつ、
(2m0−m7−m18)≧ΔmTH かつ、
(2m0−m3−m22)≧ΔmTH かつ、
(2m0−m8−m17)≧ΔmTH かつ、
(2m0−m5−m20)≧ΔmTH かつ、
(2m0−m9−m16)≧ΔmTH かつ、
(2m0−m11−m14)≧ΔmTH かつ、
(2m0−m12−m13)≧ΔmTH (式3)
つまり、中心画素を挟んで対称の位置にある2つの画素レベルの平均値と中心画素の濃度差が、閾値ΔmTHよりも大きいときに、中心画素をピークとして検出する。OR回路233において2つのピーク画素検出手段231と232のうちどちらか一方でもピーク画素として検出されればピーク画素と判定する。閾値設定手段234では、注目画素を中心として9×9画素内にあるピーク画素および画素値(cまたはmまたはyの値)からピーク画素の中から最も画素値が大きいもの(濃度が高いもの)を検出し、閾値=ピーク画素最大値+αとする。αは閾値に余裕を持たせるためのパラメータであり、cmy信号が各8bitの場合はα=10〜30程度の値に設定しておく。参照領域内にピーク画素が殆ど無い、例えば4つ未満の場合は、閾値=予め設定した固定値とする。色々な濃度を有する白地原稿の白地部分よりもやや大きい値に設定しておけばよい(ここでは130とする)。白画素/黒画素判定手段235は、設定した閾値以上であれば黒画素、設定した閾値未満であれば白画素と判定する。これにより、網点上文字の平網部分は白画素と判定され、文字部分は(網点上の白抜き文字のようなものは例外として)網点よりも濃度が高いので、黒画素と判定される。
図16(a)は、エッジの滑らかさ判定手段203、213、223の構成を示す。P1パターンマッチング241は図16(b)のP1、P2パターンマッチング242は図16(b)のP2、P3パターンマッチング243は図16(b)のP3、P4パターンマッチング244は図16(b)のP4の3×3サイズの2値画像パターンとのパターンマッチングを行い、一致すれば「1」、不一致ならば「0」を出力する。
次に、各出力値に対して、横方向または縦方向の画素数カウントを行い、注目画素から見た4方向の領域に対して縦エッジまたは横エッジの抽出を行う。ここで抽出されるのは、左上縦エッジ/左下縦エッジ/右上縦エッジ/右下縦エッジ/左上横エッジ/右上横エッジ/左下横エッジ/右下横エッジの8つの2値信号である。
図17(a)−2のように、注目画素を中心として参照領域を4等分し、左上領域に縦線の左側エッジ(立上りエッジ)があるとき左上縦エッジ、左下領域に縦線の左側エッジ(立上りエッジ)があるとき左下縦エッジとして抽出する。
図17(a)−1、(a)−3のように、45°〜135°の傾きがある場合も、左上縦エッジおよび左下縦エッジの抽出対象とする。
縦線の右側エッジも同様に、図17(b)−2のように、右上領域に縦線の右側エッジ(立下りエッジ)があるとき右上縦エッジ、右下領域に縦線の右側エッジ(立下りエッジ)があるとき右下縦エッジとして抽出し、45°〜135°の傾きがある場合も抽出対象とする(図17(b)−1、(b)−3)。
図17(c)−2のように、注目画素を中心として参照領域を4等分し、左上領域に横線の上側エッジ(立上りエッジ)があるとき左上横エッジ、右上領域に横線の上側エッジ(立上りエッジ)があるとき右上横エッジとして抽出する。図17(c)−1、(c)−3のように、−45°〜45°の傾きがある場合も左上横エッジおよび右上横エッジの抽出対象とする。
横線の下側エッジも同様に、図17(d)−2のように、左下領域に横線の下側エッジ(立下りエッジ)があるとき左下横エッジ、右下領域に横線の下側エッジ(立下りエッジ)があるとき右下横エッジとして抽出し、−45°〜45°の傾きがある場合も抽出対象とする(図17(d)−1、(d)−3)。なお、図17(a)〜(d)では、参照領域内に対となるエッジが存在する比較的細い線を例に図示したが、図17(e)−1のように、対となるエッジが参照領域内には存在しない太い線のエッジに関しても同じく、左上縦エッジや左下縦エッジを抽出する。また、ここで抽出するのは直線だけでなく、図17(e)−2のように、滑らかな曲線のエッジも含めて左上縦エッジや左下縦エッジを抽出する。
図18(a)は、横方向画素数カウント手段245および横方向画素数カウント手段246の処理を説明する図である。注目画素を挟んで横方向13画素のパターンマッチング結果が(1)の場合を例に説明する。パターンマッチング結果に対して、画素位置に対応した(2)横方向画素数カウント用の重みを各々乗算する。重みは、注目画素位置でゼロ、離れるに従って絶対値が大きくなるものであり、左方向がマイナス、右方向がプラスである。つまり、(1)×(2)の結果はパターンにマッチした画素が注目画素から数えて左右どちらの方向に何画素離れた画素位置に存在するかを求めたものになっている。パターンにマッチした画素のうち注目画素に最も近い画素の位置((1)×(2)の結果から、絶対値が最小になるものを選択する)を横方向画素数カウントの結果として出力する。ただし、(1)パターンマッチング結果が参照領域内で全てゼロの場合は、画素数カウントの結果は最大値「7」を出力する。
図18(b)は、縦方向画素数カウント手段247および縦方向画素数カウント手段248の処理を説明する図である。注目画素を挟んで縦方向13画素のパターンマッチング結果が(1)の場合を例に説明する。パターンマッチング結果に対して、画素位置に対応した(2)縦方向画素数カウント用の重みを各々乗算する。重みは、注目画素位置でゼロ、離れるに従って絶対値が大きくなるものであり、上方向がマイナス、下方向がプラスである。つまり、(1)×(2)の結果はパターンにマッチした画素が注目画素から数えて上下どちらの方向に何画素離れた画素位置に存在するかを求めたものになっている。パターンにマッチした画素のうち注目画素に最も近い画素の位置((1)×(2)の結果から、絶対値が最小になるものを選択する)を縦方向画素数カウントの結果として出力する。ただし、(1)パターンマッチング結果が参照領域内で全てゼロの場合は、画素数カウントの結果は最大値「7」を出力する。
図19(a)は、左上縦エッジ抽出手段249および右上縦エッジ手段抽出手段251の参照領域と抽出条件を説明する図である。横方向画素数カウントの結果y1〜y7を縦方向に注目画素(y7)を含む上7画素参照し、(1)縦線の抽出条件、(2)斜め線の抽出条件(滑らかな曲線も含む)のいずれかを満たせば、左上縦エッジまたは右上縦エッジとして「1」を出力、どちらも満たさなければ「0」を出力する。(1)縦線の抽出条件および(2)斜め線の抽出条件ともに、第1の条件は、7画素全ての横方向画素数カウントの結果が「7」より小さいこと、つまり、横方向に必ずパターンマッチングでマッチした画素が存在することである。(1)縦線の抽出条件の第2の条件は、横方向画素数カウントの最大値と最小値の差分が1以下であることである。(2)斜め線の抽出条件の第2の条件は、横方向画素数カウントの結果が上から下に向かって降順に並んでいることである。(1)縦線の抽出条件の方は、完全にノイズの無い縦線は勿論のこと、図50(b)の網点上文字画像の例のように、縦線に1ドットが突起状に付いている場合も縦線として抽出する条件になっており、斜め線よりも判定条件をやや緩くしている。
図19(b)は、左下縦エッジ抽出手段250および右下縦エッジ抽出手段252の参照領域と抽出条件を説明する図である。横方向画素数カウントの結果y7〜y13を縦方向に注目画素(y7)を含む下7画素参照する。それ以外は図19(a)の左上縦エッジ抽出手段249および右上縦エッジ抽出手段251と同様である。
図20(a)は、左上横エッジ抽出手段253および左下横エッジ抽出手段255の参照領域と抽出条件を説明する図である。縦方向画素数カウントの結果t1〜t7を横方向に注目画素(y7)を含む左7画素参照し、(1)横線の抽出条件、(2)斜め線の抽出条件(滑らかな曲線も含む)のいずれかを満たせば、左上横エッジまたは左下横エッジとして「1」を出力、どちらも満たさなければ「0」を出力する。(1)横線の抽出条件および(2)斜め線の抽出条件ともに、第1の条件は、7画素全ての縦方向画素数カウントの結果が「7」より小さいこと、つまり、縦方向に必ずパターンマッチングでマッチした画素が存在することである。(1)横線の抽出条件の第2の条件は、縦方向画素数カウントの最大値と最小値の差分が1以下であることである。(2)斜め線の抽出条件の第2の条件は、縦方向画素数カウントの結果が左から右に向かって降順に並んでいることである。(1)横線の抽出条件の方は、完全にノイズの無い横線は勿論のこと、横線に1ドットが突起状に付いている場合も縦線として抽出する条件になっており、斜め線よりも判定条件をやや緩くしている。
図20(b)は、右上横エッジ抽出手段254および右下横エッジ抽出手段256の参照領域と抽出条件を説明する図である。縦方向画素数カウントの結果t7〜t13を横方向に注目画素(t7)を含む右7画素参照する。それ以外は図20(a)の左上横エッジ抽出手段253および左下横エッジ抽出手段255と同様である。
以上、説明した各エッジの抽出条件のうち、第2の条件として説明したものが、エッジの滑らかさを判定する条件に該当し、参照領域内における局所的な凹凸の有無を判定している。
図21は、連続エッジ検出手段204、214、224の構成を示す。図21に示すように、論理積演算(AND)261〜264および論理和演算(OR)265で構成される。例えば図24(a)のように、注目画素が左上縦エッジかつ左下縦エッジの場合、連続エッジとして検出される。滑らかな線が連続する場合に連続エッジが検出され、主に太い文字や線のエッジが検出される。
図22は、ペアエッジ検出手段205、215、225の構成を示す。図22に示すように、論理積演算(AND)271〜274および論理和演算(OR)275で構成される。例えば図24(b)のように、注目画素が左上縦エッジかつ右上縦エッジ、または、左下縦エッジかつ右下縦エッジの場合、ペアエッジとして検出される。主に細い文字や線が検出される。また、図24(c)のように、端点付近のエッジもペアエッジとして検出される。
図23は、交点エッジ検出手段206、216、226の構成を示す。図23に示すように、論理積演算(AND)281〜288および論理和演算(OR)289で構成される。例えば図24(d)のように、注目画素が右上横エッジかつ左下縦エッジの場合、交点エッジとして検出される。主に文字を構成する線同士の交点、太文字の端点、折れ線の角付近が検出される。
図25は、文字絵柄識別手段207、217、227の構成を示す。太文字(太線)エッジおよび細文字(細線)エッジをそれぞれ識別し、OR295で太文字エッジまたは細文字エッジであれば文字エッジとして識別する。ここで識別されるのは、低濃度網点背景上文字エッジおよび白背景上文字エッジである。太文字エッジの抽出は、補正手段291で補正を行い、その結果を膨張手段292で膨張する。太文字エッジでは、連続エッジ/ペアエッジ/交点エッジのうち、連続エッジと交点エッジが抽出されるはずである。補正手段291では、5×5の参照領域内の画素全てにおいて連続エッジまたは交点エッジが検出されていれば「1」を出力し、連続エッジでも交点エッジでもない画素が存在する場合は「0」を出力する。膨張手段292は、9×9画素の補正手段291の結果を参照し、「1」が存在すれば太文字エッジとして抽出する。細文字エッジの抽出は、補正手段293で補正を行い、その結果を膨張手段294で膨張する。細文字エッジでは、連続エッジ/ペアエッジ/交点エッジのうち、ペアエッジと交点エッジが抽出されるはずである。補正手段293では5×5の参照領域内の画素全てにおいてペアエッジまたは交点エッジが検出されていれば「1」を出力し、ペアエッジでも交点エッジでもない画素が存在する場合は「0」を出力する。膨張手段294は、9×9画素の補正手段293の結果を参照し、「1」が存在すれば細文字エッジとして抽出する。
エッジの滑らかさ判定から文字絵柄識別までの処理を、網点上文字エッジの場合、網点絵柄中エッジの場合の2つの具体例で説明する。
(エッジの滑らかさ判定の具体例1)
図26は、網点上文字エッジの2値化後の画像である。図27は、図26の画像に対するP1パターンマッチング241の結果と横方向画素数カウント手段245の結果であり、左上縦エッジ、左下縦エッジともに、横方向画素数カウント結果=7が存在するので、抽出結果は「0」になる。
図28は、図26の画像に対するP2パターンマッチング242の結果と横方向画素数カウント手段246の結果であり、右上縦エッジ、右下縦エッジともに、横方向画素数カウント結果=7が存在するので、抽出結果は「0」になる。
図29は、図26の画像に対するP3パターンマッチング243の結果と縦方向画素数カウント手段247の結果であり、左上横エッジ、右上横エッジともに、縦方向画素数カウント結果が全て7未満、かつ、左から右に向かって降順に並んでいるので、抽出結果は「1」になる。
図30は、図26の画像に対するP4パターンマッチング244の結果と縦方向画素数カウント手段248の結果であり、左下横エッジ、右下横エッジともに、縦方向画素数カウント結果が全て7未満、かつ、左から右に向かって降順に並んでいるので、抽出結果は「1」になる。
以上の各抽出結果から、図26の画像に対するエッジの滑らかさ判定の結果、滑らかなエッジであるとして抽出されるのは、左上横エッジ、右上横エッジ、左下横エッジ、右下横エッジ、ということになる。これは連続エッジおよびペアエッジとして検出され、(補正手段293で排除されなければ)最終的に文字エッジとして識別される。
(エッジの滑らかさ判定の具体例2)
図31は、網点絵柄中エッジの2値化後の画像である。図32は、図31の画像に対するP1パターンマッチング241の結果と横方向画素数カウント手段245の結果である。左上縦エッジは、横方向画素数カウント結果が全て7未満、かつ、上から下に向かって降順に並んでいるので抽出結果は「1」、左下縦エッジは、横方向画素数カウント結果=7が存在するので抽出結果は「0」になる。
図33は、図31の画像に対するP2パターンマッチング242の結果と横方向画素数カウント手段246の結果であり、右上縦エッジは、横方向画素数カウント結果=7が存在するので抽出結果は「0」、右下縦エッジは、横方向画素数カウント結果が全て7未満、かつ、上から下に向かって降順に並んでいるので抽出結果は「1」になる。
図34は、図31の画像に対するP3パターンマッチング243の結果と縦方向画素数カウント手段247の結果であり、左上横エッジは、縦方向画素数カウント結果が全て7未満であるが左から右に向かって降順に並んでいないため抽出結果は「0」、右上横エッジは、縦方向画素数カウント結果が全て7未満、かつ、左から右に向かって降順に並んでいるので抽出結果は「1」になる。
図35は、図31の画像に対するP4パターンマッチング244の結果と縦方向画素数カウント手段248の結果であり、左下横エッジは、縦方向画素数カウント結果が全て7未満、かつ、左から右に向かって降順に並んでいるので抽出結果は「1」、右下横エッジは、縦方向画素数カウント結果が全て7未満であるが左から右に向かって降順に並んでいないため抽出結果は「0」になる。
以上の各抽出結果から、図31の画像に対するエッジの滑らかさ判定の結果、滑らかなエッジであるとして抽出されるのは、左上縦エッジ、右下縦エッジ、右上横エッジ、左下横エッジ、ということになる。これは連続エッジ、ペアエッジ、交点エッジのいずれでもなく、最終結果は文字エッジでないということになる。注目すべきは、左上横エッジと右下横エッジが、参照領域に局所的な凹凸があるため滑らかなエッジでないと判定され、抽出されない点であり、これにより絵柄エッジを文字エッジとして誤って識別してしまうことを防いでいる。
図36は、エッジ量抽出手段30の構成を示す。信号合成手段301は、R’G’B’信号を合成((R’+2G’+B’)/4)して1信号に変換し、エッジ量検出手段302においてエッジ量を検出する。
図37(a)は、エッジ量検出手段302の構成を示す。エッジ量検出フィルタ303〜306(1〜4)では、それぞれ図37(b)〜(e)に示した4種類の7×7フィルタを使用して、マスキング演算を行う。4つの出力のうち絶対値が最大のものを最大値選択手段311で選択し、出力する。
図38は、フィルタ処理手段13の構成を示す。平滑化手段131およびエッジ強調手段132のフィルタ処理を行い、2つのフィルタ処理の結果を合成手段133は、エッジ量および文字エッジに応じた割合で合成する。文字エッジである場合は、エッジ量に応じて、エッジ量最大のときに平滑化結果:エッジ強調結果を1:10、エッジ量最小のときに1:0(平滑化結果のみ有効)、エッジ量が中間の値の場合は中間的な割合で合成する。文字エッジでない場合は常に1:0の割合で合成する。白背景上文字エッジおよび網点上文字エッジを強調して鮮鋭に再現し、絵柄部は滑らかに粒状性良く再現するのに有効である。
図39は、エッジ量抽出手段40の構成を示す。C’M’Y’各色毎にエッジ量検出手段401、402、403は多値のエッジ量を検出する。エッジ量検出手段の構成は、エッジ量抽出手段30のものと同様である(図37(a))。ただし、エッジ量検出フィルタは図39(b)〜(e)の5×5サイズのものを使用する。フィルタ処理後の信号からのエッジ量検出であるため、解像度の違いを考慮して検出フィルタのサイズを変えている。最大値選択手段404は、検出した3色のエッジ量のうち最大のものを選択する。一方、信号合成手段405は、C’M’Y’の3信号を所定の割合で足し合わせて1信号に変換する。例えば(C’×1/4+M’×2/4+Y’×1/4)を合成信号として出力する。ラプラシアンフィルタ演算手段406は、合成信号に対して図39(f)のフィルタを使用してマスキング演算を行い、符号判定手段407は正の値か否かを判定する。正なら1、負なら0を出力する。内側エッジ量抽出手段408は、符号判定手段407の結果が「1」である場合に、最大値選択手段404の出力値をそのまま出力する。符号判定手段407の結果が「0」の場合は、エッジ量をキャンセルして0を出力する。ラプラシアンフィルタ演算手段406の出力値は、文字の内側エッジに相当するエッジの高濃度側では正の値、文字の外側エッジに相当するエッジの低濃度側では負の値を出力するため、これを利用し、ラプラシアンが正の内側エッジでのみエッジ量を有効にし、ラプラシアンが負の外側エッジではエッジ量を無効にしている。N値化手段409においてN値に量子化する。Nは、エッジ量抽出結果の適用先であるUCR/墨生成手段15において、処理を何段階で制御するかに応じて決まるものであるが、ここでは説明を簡単にするため2段階で制御するものとし、0〜63の値で抽出された内側エッジ量を0/1(N=2)に量子化しておく。
UCR/墨生成手段15は、墨生成、UCRともに式で行う方法、LUTで行う方法等があるが、本実施例では墨生成をLUTで行い、UCRを式で行う場合について説明する。図40は、墨生成のLUTである。墨生成では、C’、M’、Y’(0が白、255が黒)の最小値Min(C’、M’、Y’)を算出し、これをLUTへ入力して出力値を得る。UCRは次の式により行う。αはUCR調整パラメータである。
C=C’−α×K
M=C’−α×K
Y=C’−α×K (式4)
文字エッジかつエッジ量抽出手段40の出力値が「1」の場合、墨生成テーブル−1を使用し、Min(C、M’Y’)をそのままKに置き換え、UCR調整パラメータはα=1とする。その他の場合は、墨生成テーブル−2を使用し、ハイライトではKを発生させず中間から徐々にKを発生させる。UCR調整パラメータはα=0.5とする。フィルタ処理のようにエッジ量を多値で求め、中間的な墨生成テーブルをいくつも準備して多段階制御しても良い。このように墨生成およびUCRを切り換えることにより、文字(黒文字)を鮮鋭に色付きなく再現し、絵柄を高階調に再現することができる。
以上、本実施例によれば、高濃度背景上文字エッジに関しては、背景の濃度や平坦さ、連結黒画素の抽出、絵柄中に多く存在する白孤立点の抽出結果に基づき、網点上文字エッジを網点絵柄中エッジと切り分けて識別することができる。低濃度背景上文字エッジに関しては、局所的な凹凸に着目し、滑らかなエッジであるか否かを判定することで、網点上文字エッジを網点絵柄中エッジと切り分けて識別することができる。白背景上文字エッジも低濃度背景上文字エッジを識別する際に、区別無く同時に識別される。 また、高濃度背景上文字エッジ識別用の第1の文字エッジ識別手段において文字エッジとして識別された画素、あるいは、低濃度背景上文字エッジ識別用の第2の文字エッジ識別手段において文字エッジとして識別された画素を、文字エッジとし、フィルタ処理、墨処理に適用することにより、網点上文字エッジと網点絵柄の高画質再生を両立できる。なお、本実施例では文字絵柄識別結果をフィルタ処理と墨処理に適用する例を示したが、色補正や擬似階調処理など、様々な高画質化処理に文字絵柄識別結果を使用する従来技術があり、それらに本発明の識別結果を適用しても勿論有効である。
実施例2:
実施例1では、本発明の文字絵柄識別結果を高画質化処理に適用する例を示した。実施例2では、高画質化ではなく画質加工的な処理であるトナーセーブ処理に適用する例を示す。トナーセーブ処理は、濃度を下げて出力することにより、トナー消費量を抑える処理である。なお、“トナーセーブ”のトナーとは、粉体トナーに限らない。液体トナー(インク)もこれに含まれる。
図41は、本発明の実施例2の構成を示す。操作パネル50では、ユーザーがトナーセーブモードで出力したい場合にトナーセーブモードを選択指定することができる。ユーザーがトナーセーブモードを指定した場合、トナーセーブ処理手段19がトナーセーブ処理を行う。
トナーセーブ処理手段19は、操作パネル50からの信号、および、画像属性判定手段20の結果(文字エッジであるか否か)、および、エッジ量抽出手段40の出力値に応じて、トナーセーブ処理を切り換える。
トナーセーブ処理は、図42のγ変換により行う。トナーセーブγ−1を使用した場合、入力値=出力値になり、濃度がそのまま保存され、実質的にトナーセーブ処理が行われないことになる。トナーセーブγ−2を使用した場合、入力値に対して出力値が50%程度になる処理が施される。操作パネル50でトナーセーブモードが指定されない場合は、常にトナーセーブγ−1を使用する。操作パネル50でトナーセーブモードが指定された場合は、文字エッジであり、かつ、エッジ量抽出の出力値が「1」である場合、トナーセーブγ−1を使用してトナーセーブ処理を行う(実質的に行わない)。その他の場合は、トナーセーブγ−2を使用する。
これにより、トナーセーブモード設定時、白背景上文字エッジおよび網点上文字エッジの濃度を保存することで文字判読性を維持しつつ、絵柄部に対して効果的にトナーを節約し、かつ、網点絵柄中エッジが文字エッジのように濃度保存されてしまう画質上の不具合(文字絵柄識別の精度が悪いと頻繁に発生してしまう不具合)を抑えて絵柄部でも良好なトナーセーブ画像を生成することができる。
以上、実施例2によれば、実施例1の文字絵柄識別をトナーセーブ処理に適用することにより、文字判読性の維持、絵柄画質の不具合の抑制、トナーの節約効果の発揮を同時に達成することができる。このように、本発明の識別技術は高画質化のための画像処理に限定されるものではなく、適用範囲は極めて広い。ここで挙げたトナーセーブもその適用例の一つであり、この他に例えば文字絵柄を識別して圧縮方式を変えることで圧縮効率を高める技術等に適用しても効果的である。
実施例3:
実施例1の画像属性判定20では、高濃度背景上文字エッジ識別用の第1の文字エッジ識別手段と、低濃度背景上文字エッジ識別用の第2の文字エッジ識別手段を持ち、各々適した別の特徴および識別方法を用いて文字エッジを識別していた。
本実施例では、高濃度背景上文字エッジ識別用の第1の文字エッジ識別手段と、低濃度背景上文字エッジ識別用の第2の文字エッジ識別手段に加えて、白背景上文字エッジ識別用の第3の文字エッジ識別手段を備える実施例について説明する。
白背景上文字エッジは、前述のとおり、第2の文字エッジ識別手段においても特に区別無く文字エッジとして識別されるが、やや不十分なケースがある。白背景上文字の場合はコントラストの低いやや薄い文字も多く存在するが、網点上文字を意識した2値化では狙い通りに2値化できないことがあり、薄い文字エッジの識別精度がやや悪くなる恐れがある。また、白背景上文字エッジと絵柄エッジとの識別は、網点があるか否かの情報で絵柄エッジにおける識別の誤りをより効果的に防止することができるため、逆に言えば、白背景上文字エッジを文字エッジでないと判定してしまう識別の誤りを防止することもできる。白背景上文字エッジの識別に最適な特徴は網点上文字エッジの識別に最適な特徴とは異なるため、識別手段を別々に持つことにより、各々に最適で精度の良い識別を行うことが実施例3の目的である。
また、白背景上文字エッジのうち、特に黒文字エッジは、CMYトナーを使わずKトナーのみで画像再生を行うことにより、黒文字の色つきを抑制することが一般的に行われている。その処理のために、他の文字エッジとは別に白背景上黒文字エッジを識別することは大変意味がある。
図43は、実施例3の画像属性判定手段20の構成を示す。本実施例では、実施例1における第1の文字エッジ識別手段2001、第2の文字エッジ識別手段2002に加えて、第3の文字エッジ識別手段2004を有し、文字エッジ属性判定手段2005では、OR2003から出力される網点上文字エッジに対する識別結果である“文字エッジ”と、第3の文字エッジ識別手段2004から出力される白背景上文字エッジに対する識別結果である“黒文字エッジ/色文字エッジ”を参照して、文字エッジまたは黒文字エッジまたは色文字エッジである場合に、最終的に文字エッジであると判定し、判定結果を信号として出力する。また、黒文字エッジである場合に、白背景上文字エッジであることを表す信号も出力し、合わせて2ビットの信号を出力する。
図44は、第3の文字エッジ識別手段2004の構成を示す。第3の文字エッジ識別手段2004は、エッジ判定手段700、白地判定手段701、網点判定手段702、色判定手段703、文字エッジ検出手段704から構成されている。
図45(a)は、エッジ判定手段700の構成を示す。3値化回路705によって、RGB各8ビットからなる入力画像のうちG信号を2つの閾値th1およびth2(th1<th2)で3値化する。0がシャドー側、255がハイライト側で、0≦G≦th1ならば黒画素、th1<G<th2ならば中間画素、th2≦G≦255ならば白画素とする。
黒画素パターンマッチング706では3×3のマトリクス内の黒画素パターンが図45(b)のいずれかとマッチングしたときに注目画素を連結黒画素と判定する。白画素パターンマッチング707も同様に白画素が図45(c)とマッチするかどうかをみて連結白画素を判定する。
計数手段708と709では、注目画素を中心とした3×3画素内で連結黒画素の数と連結白画素を計数し、計数値が一定値(例えば2)以上のとき“1”を出力し、AND710において両方の計数結果が“1”である場合にエッジ部であると判定する。つまり、文字の輪郭部分には連結白画素及び連結黒画素が同時に一定以上の密度で存在するという性質を利用して判定する。
図46(a)は、白地判定手段701の構成を示す。2値化手段711は、G信号に対して白画素であるか黒画素であるかを2値判定する。判定した白画素でパターンマッチング712を行い、孤立で存在する白画素の判定を覆す。具体的には図46(b)の縦横斜め4方向の白画素連続性をみるパターンでパターンマッチングを行い、マッチすれば白画素、マッチしなければ黒画素ということにする。次に、注目画素を含む周囲11×11画素をみて、その中に1つでも白画素があれば注目画素を白画素に覆す膨張処理を膨張処理手段713により行う。更に、注目画素を含む周囲17×17画素をみて、その中に1つでも黒画素があれば注目画素を黒画素に覆す収縮処理を収縮処理手段714により行う。収縮処理後に白画素として残った領域が、最終的に白地判定される領域になる。
図47は、網点判定手段702の構成を示す。網点判定手段702はピーク画素検出による方法を用いて行う。ピーク画素検出は、注目画素が濃度変化の山または谷を示す極点であるかどうかを、周囲の画素との濃度関係から判定するものである。M×M画素からなるブロック内において、中心画素の濃度レベルが他のすべての濃度レベルよりも高い、あるいは低いときに、式2あるいは式3のようにして極点かどうかを判定する。式2によりピーク画素を検出しているのがピーク画素検出手段(3×3)715、式3によりピーク画素を検出しているのがピーク画素検出手段(5×5)716であり、図15のピーク画素検出と同じ処理を行っている。RGB各信号に対してピーク画素検出を行ってもよいが、簡略化する場合はG信号に対してピーク検出を行う。そして、ピーク画素の情報を基に、その領域が網点領域であるかどうかを判定する。OR回路717において2つのピーク画素検出手段715と716のうちどちらか一方でもピーク画素として検出されればピーク画素と判定し、ブロック化手段718において4×4画素からなるブロック毎にピーク画素が1つでも存在すればアクティブブロックと判定し、密度補正手段719において注目ブロックを中心とした5×5ブロック内におけるアクティブブロックを計数し、計数値が所定個以上の場合に注目ブロックを網点ブロックとし、最後に膨張手段720で3×3ブロックでの膨張処理を行い、1つでも網点ブロックが存在すれば注目ブロックを網点領域とする。
図48は、色判定手段703の構成を示す。有彩画素検出手段721でMax(|R−G|、|G−B|、|B−R|)>th3(th3は所定の閾値)に該当する画素を有彩画素として検出し、ブロック判定手段722で4×4画素からなるブロック毎に有彩画素が1つでも存在すればアクティブブロックと判定し、膨張手段723で7×7ブロックでの膨張処理を行い、1つでもアクティブブロックが存在すれば注目ブロックを有彩領域とする。これは色判定の方法の一例であり、網点判定のように計数処理するなどして誤判定を排除する処理を加えることにより、より高精度に判定できる。
図49は、文字エッジ検出手段704の構成を示す。エッジ判定手段700と白地判定手段701と網点判定手段702の結果から、白背景上文字エッジ判定手段724では文字エッジ候補画素を判定する。エッジかつ白地かつ非網点の場合に文字エッジ候補画素であると判定する。前述のエッジ判定手段700によると、内側エッジ/外側エッジともに1ドットずつが文字エッジ候補画素として検出される。内外1ドットずつの計2ドットでは、フィルタ13の処理に対して不十分であるので、膨張手段(3×3)725において膨張処理を行い、その結果を“文字エッジ”とする。膨張手段(3×3)725は、注目画素を中心とした3×3画素の文字エッジ候補画素を参照し、1つでも文字エッジ候補画素が存在すれば注目画素を文字エッジとする処理である。膨張量はここでは3×3であるが、スキャナの色ずれ特性やフィルタ処理での必要膨張量を考慮して5×5などにしても良い。黒文字/色文字判定手段726では、文字エッジと色判定手段703の結果から、文字エッジかつ有彩色の場合に“色文字エッジ”であると判定し、文字エッジかつ無彩色の場合に“黒文字エッジ”であると判定する。
実施例1では、図38のフィルタ処理手段13において、平滑化手段131およびエッジ強調手段132のフィルタ処理を行い、2つのフィルタ処理の結果を合成手段133でエッジ量および文字エッジに応じた割合で合成していた。文字エッジである場合は、エッジ量に応じて、エッジ量最大のときに平滑化結果:エッジ強調結果を1:10、エッジ量最小のときに1:0(平滑化結果のみ有効)、エッジ量が中間の値の場合は中間的な割合で合成し、文字エッジでない場合は常に1:0の割合で合成していた。
本実施例では、白背景上黒文字エッジ以外の画素に関しては実施例1と同じ比率で平滑化結果とエッジ強調結果を合成し、白背景上黒文字エッジの画素に関しては、エッジ量最大のときに更にエッジ強調の割合を大きくして1:12の割合で合成する。白背景上黒文字の鮮鋭性を特に高めて画像を再生する。
実施例1では、文字エッジかつエッジ量抽出手段40の出力値が「1」の場合、墨生成テーブル−1を使用し、Min(C、M’Y’)をそのままKに置き換えるUCR/墨生成処理を行っていた。
本実施例では、白背景上黒文字エッジかつエッジ量抽出手段40の出力値が「1」の場合、墨生成テーブル−1を使用し、Min(C、M’Y’)をそのままKに置き換え、更にその後、強制的にC=M=Y=0に変換する処理を行う。これにより白背景上黒文字のエッジ部色付きを確実に防止する。
以上、本実施例によれば、高濃度背景上文字エッジに関しては、背景の濃度や平坦さ、連結黒画素の抽出、絵柄中に多く存在する白孤立点の抽出結果に基づき、網点上文字エッジを網点絵柄中エッジと切り分けて識別し、更に、白背景上文字エッジに関しては、エッジ判定や網点判定や白地判定や色判定に基づき、白背景上文字エッジ(黒文字エッジ/色文字エッジ)を網点絵柄と切り分けて確実に識別することができる。識別結果をフィルタ処理、墨処理に適用することにより、文字エッジと網点絵柄の高画質再生を両立できると共に、特に白背景上黒文字エッジにおいて鮮鋭性を高め、色付きを抑制することができる。
また、本発明は、前述した実施例の処理手順や機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(CPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても達成される。この場合、記憶媒体から読出されたプログラムコード自体が前述した実施例の処理手順や機能を実現することになる。プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。また、コンピュータが読出したプログラムコードを実行することにより、前述した実施例の処理手順や機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施例の処理手順や機能が実現される場合も含まれる。さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施例の処理手順や機能が実現される場合も含まれる。
本発明の実施例1の構成を示す。 画像属性判定手段の構成を示す。 3値化を説明する図である。 第1の文字エッジ識別手段の構成を示す。 3値化手段の構成を示す。 連結黒画素抽出手段の構成を示す。 連結黒画素エッジ抽出手段の構成を示す。 白孤立点抽出手段の構成を示す。 白孤立点密度判定手段の構成を示す。 背景濃度算出手段の構成を示す。 平坦さ判定手段の構成を示す。 高濃度背景抽出手段の構成を示す。 文字絵柄識別手段の構成を示す。 第2の文字エッジ識別手段の構成を示す。 2値化手段の構成を示す。 エッジの滑らかさ判定手段の構成を示す。 抽出対象となるエッジ例を示す。 横/縦方向画素数カウント手段の処理を説明する図である。 左上/右上縦エッジ抽出手段、左下/右下縦エッジ抽出手段の参照領域と抽出条件を説明する図である。 左上/左下横エッジ抽出手段、右上/右下横エッジ抽出手段の参照領域と抽出条件を説明する図である。 連続エッジ検出手段の構成を示す。 ペアエッジ検出手段の構成を示す。 交点エッジ検出手段の構成を示す。 連続エッジ、ペアエッジ、交点エッジの検出を説明する図である。 文字絵柄識別手段の構成を示す。 網点上文字エッジの2値化後の画像を示す。 図26の画像に対するP1パターンマッチングの結果と横方向画素数カウント手段の結果を示す。 図26の画像に対するP2パターンマッチングの結果と横方向画素数カウント手段の結果を示す。 図26の画像に対するP3パターンマッチングの結果と縦方向画素数カウント手段の結果を示す。 図26の画像に対するP4パターンマッチングの結果と縦方向画素数カウント手段の結果を示す。 網点絵柄中エッジの2値化後の画像を示す。 図31の画像に対するP1パターンマッチングの結果と横方向画素数カウント手段の結果を示す。 図31の画像に対するP2パターンマッチングの結果と横方向画素数カウント手段の結果を示す。 図31の画像に対するP3パターンマッチングの結果と縦方向画素数カウント手段の結果を示す。 図31の画像に対するP4パターンマッチングの結果と縦方向画素数カウント手段の結果を示す。 第1のエッジ量抽出手段の構成を示す。 エッジ量検出手段の構成を示す。 フィルタ処理手段の構成を示す。 第2のエッジ量抽出手段の構成を示す。 墨生成のLUTを示す。 本発明の実施例2の構成を示す。 トナーセーブ処理を説明する図である。 実施例3の画像属性判定手段の構成を示す。 第3の文字エッジ識別手段の構成を示す。 エッジ判定手段の構成を示す。 白地判定手段の構成を示す。 網点判定手段の構成を示す。 色判定手段の構成を示す。 文字エッジ検出手段の構成を示す。 従来の課題を説明する図である。
符号の説明
10 スキャナ
11 スキャナγ補正手段
12 スキャナ色補正手段
13 フィルタ処理手段
14 プリンタ色補正手段
15 UCR/墨生成手段
16 プリンタγ補正手段
17 擬似階調処理手段
18 プリンタ
20 画像属性判定手段
30、40 エッジ量抽出手段

Claims (11)

  1. 画像中の網点上文字エッジを含む文字エッジを識別する装置において、高濃度網点背景上に存在する文字エッジを識別する第1の文字エッジ識別手段と、低濃度網点背景上に存在する文字エッジを識別する第2の文字エッジ識別手段を有することを特徴とする画像処理装置。
  2. 前記第1の文字エッジ識別手段は、第1の量子化手段を有し、前記第2の文字エッジ識別手段は、第2の量子化手段を有し、前記第1の量子化手段は低濃度網点背景を消去する量子化を行い、前記第2の量子化手段は高濃度網点背景を消去しない量子化を行い、それぞれ量子化後の画像データから異なる特徴に基づいて文字エッジを識別することを特徴とする請求項1記載の画像処理装置。
  3. 前記第1の文字エッジ識別手段は、連結して存在する黒画素を連結黒画素として抽出する連結黒画素抽出手段と、背景画像が所定濃度以上である高濃度背景であるか否かを判定する背景濃度判定手段を有し、前記連結黒画素抽出手段と前記背景濃度判定手段の出力に基づき、文字エッジを識別することを特徴とする請求項1または2記載の画像処理装置。
  4. 所定の参照領域内において、黒に囲まれた白を白孤立点として抽出する白孤立点抽出手段を有し、前記連結黒画素抽出手段と前記背景濃度判定手段と前記白孤立点抽出手段の出力に基づき、文字エッジを識別することを特徴とする請求項3記載の画像処理装置。
  5. 前記背景濃度判定手段は、背景画像の濃度を算出する背景濃度算出手段と、背景画像の平坦さを判定する平坦さ判定手段を有し、背景画像の濃度と平坦さに基づき、背景画像が所定濃度以上である高濃度背景であるか否かを判定することを特徴とする請求項3または4記載の画像処理装置。
  6. 前記背景濃度算出手段は、連結黒画素でない画素を背景画像中の画素とみなして、濃度を算出することを特徴とする請求項5記載の画像処理装置。
  7. 前記第2の文字エッジ識別手段は、エッジ部の滑らかさを判定する滑らかさ判定手段を有し、エッジ部の滑らかさに基づき、文字エッジを識別することを特徴とする請求項1記載の画像処理装置。
  8. 更に、白地背景上に存在する文字エッジを識別する第3の文字エッジ識別手段を有することを特徴とする請求項1記載の画像処理装置。
  9. 画像中の網点上文字エッジを含む文字エッジを識別する方法において、高濃度網点背景上に存在する文字エッジを識別する第1の文字エッジ識別工程と、低濃度網点背景上に存在する文字エッジを識別する第2の文字エッジ識別工程を有することを特徴とする画像処理方法。
  10. 請求項9記載の画像処理方法をコンピュータに実現させるためのプログラム。
  11. 請求項9記載の画像処理方法をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2007195475A 2007-07-27 2007-07-27 画像処理装置、画像処理方法、プログラムおよび記録媒体 Pending JP2009033493A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007195475A JP2009033493A (ja) 2007-07-27 2007-07-27 画像処理装置、画像処理方法、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007195475A JP2009033493A (ja) 2007-07-27 2007-07-27 画像処理装置、画像処理方法、プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2009033493A true JP2009033493A (ja) 2009-02-12

Family

ID=40403493

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007195475A Pending JP2009033493A (ja) 2007-07-27 2007-07-27 画像処理装置、画像処理方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2009033493A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015020417A (ja) * 2013-07-23 2015-02-02 セイコーエプソン株式会社 記録装置及び乾燥方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015020417A (ja) * 2013-07-23 2015-02-02 セイコーエプソン株式会社 記録装置及び乾燥方法

Similar Documents

Publication Publication Date Title
JP4548733B2 (ja) 画像処理装置、方法、プログラムおよび記録媒体
JP4743596B2 (ja) 画像処理装置、方法、プログラムおよび記録媒体
US10115011B2 (en) Document type recognition apparatus, image forming apparatus, document type recognition method, and computer program product
US8345310B2 (en) Halftone frequency determination method and printing apparatus
JP4988624B2 (ja) 画像処理装置、画像処理方法及び記録媒体
JP2008011267A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体
JP6221402B2 (ja) 画像処理装置、画像処理方法及びプログラム
US7460272B2 (en) Image processing apparatus, image processing method, and image processing program
US6714676B2 (en) Image processing apparatus and image processing method
JP4637054B2 (ja) 画像処理装置及びその制御方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP3334042B2 (ja) 画像処理装置およびこれを搭載した画像読取装置と画像形成装置、並びに画像処理方法、および画像処理手順を記憶したコンピュータ読み取り可能な記憶媒体
US9948824B2 (en) Image compressing device, image forming apparatus, image compressing method, and recording medium
JP4771428B2 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP6740612B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP6693310B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2004214977A (ja) 画像処理装置およびそれを備えた画像形成装置ならびに画像処理方法、画像処理プログラムおよび記録媒体
JP6676962B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP4228466B2 (ja) 画像処理装置、画像処理方法、および画像処理手順を記憶したコンピュータ読み取り可能な記憶媒体
JP2009033493A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP4846681B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体
JP4320309B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、および該プログラムを記録した記録媒体
JP3789243B2 (ja) 画像処理装置および方法
JP3988970B2 (ja) 画像処理装置、画像処理方法及び記憶媒体
JP4324532B2 (ja) 画像処理装置および記憶媒体
JP2014011590A (ja) 画像処理装置