JP2009033493A

JP2009033493A - 画像処理装置、画像処理方法、プログラムおよび記録媒体

Info

Publication number: JP2009033493A
Application number: JP2007195475A
Authority: JP
Inventors: Noriko Miyagi; 徳子宮城
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2007-07-27
Filing date: 2007-07-27
Publication date: 2009-02-12

Abstract

【課題】高濃度網点背景上に存在する文字エッジを識別する第１の文字エッジ識別手段と、低濃度網点背景上に存在する文字エッジを識別する第２の文字エッジ識別手段を持ち、異なる特徴を用いて文字エッジ識別を行うことにより、各々で最適かつ高精度な網点上文字エッジ識別を実現する
【解決手段】第１の文字エッジ識別手段２００１は、ｃｍｙ信号の各信号から高濃度網点上文字エッジを識別する。第２の文字エッジ識別手段２００２は、ｃｍｙ信号の各信号から低濃度網点上文字エッジを識別する。ＯＲ２００３で論理和演算を行い、高濃度網点上文字エッジまたは低濃度網点上文字エッジを、文字エッジと識別する。
【選択図】図２

Description

本発明は、スキャナで読み取った画像あるいはネットワークを介して取得した画像に対して、文字領域の識別を行い、識別結果に応じて異なる画像処理を実行する画像処理装置、画像処理方法、プログラムおよび記録媒体に関する。

スキャナ読取画像から、白背景上文字領域と絵柄領域（この場合は白背景上文字領域以外の領域）を識別し、識別結果に応じてフィルタ、墨処理、擬似階調処理等の画像処理を切り換える装置がある。このような画像処理の切り換えは、文字を鮮鋭に再現し、絵柄はざらつきを抑えて再現するために行うものであり、本来であれば網点背景上の文字も白背景上文字と同様に鮮鋭に再現したいが、網点上文字は網点絵柄中のエッジとの識別が困難であるため、絵柄部への影響を考慮して絵柄領域として処理している。

例えば、特許文献１、２では、白背景上文字と網点上文字を区別することなく、文字領域と絵柄領域を識別している。どちらも画像を２値化し、２値信号の連続性により文字を識別する技術であるが、網点絵柄エッジが比較的急峻である場合は特に、網点上文字エッジを網点絵柄エッジと切り分けて識別できない。

図５０（ａ）は閾値ｔｈ１で２値化処理した２値画像、図５０（ｂ）はｔｈ１よりも高濃度側の閾値ｔｈ２で２値化処理した２値画像である。網点上文字エッジであっても、例えば解像度６００ｄｐｉのスキャナで読み取った画像の場合、網点率が３０％以下くらいの低濃度の網点背景であれば、閾値を適切に設定することにより図５０（ｂ）のように文字部を黒画素、網点背景を白画素として２値化することができる。スキャナの特性上、解像度やＭＴＦの影響で、網点のピーク濃度よりも線画の尾根濃度の方がスキャナ読取値が高濃度になる傾向があり（図３の右図）、閾値を適切に設定できれば図５０（ｂ）のような２値化結果が得られる。

図５０（ｂ）において、網点絵柄中エッジと網点上文字エッジの識別が課題になるが、両者の違いは網点絵柄中エッジの方がエッジ部に局所的な凹凸があるのに対して、網点上文字エッジは局所的に見ても本来の文字形状に沿った滑らかなエッジで構成されており、局所的な凹凸が非常に少ない、という点にある。横線あるいは縦線はスキャナ読取時のノイズにより比較的凹凸が出やすいが、それでも１ドット程度の凹凸である。エッジ部の局所的な凹凸は、文字エッジ識別の有効な特徴になる。

一方、網点率が３０％を越えるような高濃度の網点背景の場合は、スキャナ読取値で網点のピーク濃度と線画の尾根濃度の差が殆どなくなってしまい（図３の右図）、どのように閾値を設定したとしても図５０（ｂ）のような２値画像を得ることができない。網点と線画の濃度値の僅かな差を利用して閾値を設定したとしても、ノイズの影響もあり、文字エッジが滑らかなエッジにはならないため、エッジ部の局所的な凹凸で文字エッジ識別を行うことは不可能である。

そこで、高濃度背景の場合は、図５０（ａ）のように網点ドットを黒画素として残すような量子化を行い、エッジ部の局所的な凹凸とは別の特徴を用いて文字エッジの識別を行う方が良い。また、高濃度網点背景に限定すれば、極端な場合、文字エッジを抽出することに重きを置いて絵柄エッジでの誤りを多少許容するような特徴を用いたとしても、画像全体としては識別精度が大幅に悪化することはまず無いとも言える。

上記した特許文献１、２の場合、白背景上文字と網点上文字を区別していないので、当然、網点上文字に関しても背景濃度に応じて異なる特徴を用いて文字エッジ識別を行ってはいない。そのため、低濃度背景上文字と高濃度背景上文字の両方に対して最適な識別結果が得られるとは言い難い。また、絵柄エッジで、局所的な凹凸があったとしても文字エッジと判定してしまう。特許文献１、２が発明された当時、スキャナの解像度が今より格段に低く、網点形状が厳密に読み取られなかったためにエッジ部の局所的な形状で識別することが難しかったという事情もある。

特開平２−２９２９５７号公報特開平１−２２７５７３号公報特開２００２−１９９２１０号公報

ところが、近年のスキャナの高解像度化に伴い、網点上文字を意識的に抽出する技術が提案されている。例えば、特許文献３では、網点上の文字を抽出しているが、網点上文字エッジと網点絵柄中エッジとを切り分けて識別していない。

本発明の目的は、高濃度網点背景上に存在する文字エッジを識別する第１の文字エッジ識別手段と、低濃度網点背景上に存在する文字エッジを識別する第２の文字エッジ識別手段を持ち、異なる特徴を用いて文字エッジ識別を行うことにより、各々で最適かつ高精度な網点上文字エッジ識別を実現する画像処理装置、画像処理方法、プログラムおよび記録媒体を提供することにある。

本発明は、画像中の網点上文字エッジを含む文字エッジを識別する装置において、高濃度網点背景上に存在する文字エッジを識別する第１の文字エッジ識別手段と、低濃度網点背景上に存在する文字エッジを識別する第２の文字エッジ識別手段を有することを最も主要な特徴とする。

請求項１、９：高濃度網点背景上に存在する文字エッジを識別する第１の文字エッジ識別手段／工程と、低濃度網点背景上に存在する文字エッジを識別する第２の文字エッジ識別手段／工程を有するため、各々に対して最適な特徴を用いて文字エッジ識別を行うことができ、特に網点上文字エッジを高精度に識別することができる。

請求項２：第１の文字エッジ識別手段は、第１の量子化手段を有し、第２の文字エッジ識別手段は、第２の量子化手段を有し、第１の量子化手段は低濃度網点背景を消去する量子化を行い、第２の量子化手段は高濃度網点背景を消去しない量子化を行い、夫々、量子化後の画像データから異なる特徴に基づいて文字エッジを識別するため、各々の識別で使用する特徴に適した量子化を前処理として行うことができ、各々に対して最適な特徴を用いて文字エッジ識別を行うことにより、特に網点上文字エッジを高精度に識別することができる。

請求項３〜６：連結黒画素や（背景濃度や平坦さに基づき判定した）高濃度背景や白孤立点に基づいて、高濃度網点背景上に存在する文字エッジを識別するため、対象とする濃度域の網点背景上に存在する文字を絵柄エッジと切り分けて高精度に識別することができる。

請求項７：第２の文字エッジ識別手段は、エッジ部の滑らかさを判定する滑らかさ判定手段を有し、エッジ部の滑らかさに基づき、文字エッジを識別するため、特に低濃度網点上文字に関しては、高精度に絵柄エッジと切り分けて識別することができる。

請求項８：高濃度網点背景上に存在する文字エッジを識別する第１の文字エッジ識別手段、低濃度網点背景上に存在する文字エッジを識別する第２の文字エッジ識別手段、白背景上に存在する文字エッジを識別する第３の文字エッジ領域識別手段を有するため、各々に対して最適な特徴を用いて文字エッジ識別を行うことができ、網点上文字エッジおよび白地上文字エッジを高精度に識別することができる。

以下、発明の実施の形態について図面により詳細に説明する。

実施例１：
図１は、本発明の実施例１の構成を示す。スキャナ１０は、原稿を読み取ることによりＲＧＢ信号からなる画像データを取得し、スキャナγ補正手段１１はスキャナのγ特性を補正し、反射率リニアの信号から濃度リニアの信号へ変換する。スキャナ色補正手段１２は、スキャナ特性に依存したＲＧＢ信号をスキャナに依存しないデバイス非依存のＲ’Ｇ’Ｂ’信号に変換する。

画像属性判定手段２０は、ＲＧＢ信号から文字エッジ領域を抽出する。文字エッジ領域には、白背景上文字も網点上文字も含まれる。エッジ量抽出手段３０は、Ｒ’Ｇ’Ｂ’信号から画像中のエッジらしさを表す信号であるエッジ量を抽出する。フィルタ処理手段１３は、画像属性判定手段２０およびエッジ量抽出手段３０の結果に基づき、網点部の起伏を抑えてモアレを抑制する平滑化処理、および、文字部の鮮鋭性を高めるエッジ強調処理を行う。プリンタ色補正手段１４は、デバイス非依存のＲ’Ｇ’Ｂ’信号からプリンタ特性に依存したＣ’Ｍ’Ｙ’信号への変換を行う。

エッジ量抽出手段４０は、Ｃ’Ｍ’Ｙ’信号から画像中のエッジらしさを表す信号であるエッジ量を抽出する。ＵＣＲ／墨生成手段１５は、画像属性判定手段２０およびエッジ量抽出手段４０の結果に基づき、Ｃ’Ｍ’Ｙ’データに応じてＫ信号を発生させ（墨生成）、Ｃ’Ｍ’Ｙ’からＫに応じた量を減ずる（下色除去（ＵＣＲ））。ＣＭＹＫはプリンタの色材色に対応している。ＵＣＲ／墨生成後の信号に対して、プリンタγ補正手段１６、擬似階調処理手段１７による処理を施し、プリンタ１８で記録媒体上に画像を出力する。プリンタγ補正手段１６は、プリンタの濃度特性に合わせて濃度変換テーブルを用いた変換処理を行う。擬似階調処理手段１７では、ディザや誤差拡散等の擬似中間調処理を行う。

図２は、画像属性判定手段２０の構成を示す。ＲＧＢ→ＣＭＹ変換手段２０１は、原稿のプロセスカラーに対応したｃｍｙ信号に変換し、第１の文字エッジ識別手段２００１において高濃度網点上文字エッジを識別し、第２の文字エッジ識別手段２００２において低濃度網点上文字エッジを識別し、ＯＲ２００３において論理和演算を行い、高濃度網点上文字エッジまたは低濃度網点上文字エッジである場合に、画像属性判定手段２０の判定結果として文字エッジを出力する。

ＲＧＢ→ＣＭＹ変換手段２０１は、次式（１）によりＲ’Ｇ’Ｂ’信号から原稿のプロセスカラーに対応したｃｍｙ信号への変換を行う。

ｃ＝ａ０＋ａ１×Ｒ＋ａ２×Ｇ＋ａ３×Ｂ
ｍ＝ｂ０＋ｂ１×Ｒ＋ｂ２×Ｇ＋ｂ３×Ｂ
ｙ＝ｃ０＋ｃ１×Ｒ＋ｃ２×Ｇ＋ｃ３×Ｂ（式１）
ａ０〜ａ３、ｂ０〜ｂ３、ｃ０〜ｃ３は、プロセスカラーのカラーパッチをスキャナで読み込み、ＲＧＢ読取値とカラーパッチの色の関係に基づき予め設定されたパラメータである。

図４は、第１の文字エッジ識別手段２００１の構成を示す。ｃｍｙ信号各々に対して３値化（５０１、５１１、５２１）を行い、連結黒画素エッジ抽出の前処理として連結黒画素エッジ抽出（５０２、５１２、５２２）、白孤立点密度判定の前処理として白孤立点抽出（５０３、５１３、５２３）、高濃度背景抽出の前処理として背景濃度算出（５０４、５１４、５２４）と平坦さ判定（５０７、５１７、５２７）を行った後、連結黒画素エッジ抽出（５０５、５１５、５２５）／白孤立点密度判定（５０６、５１６、５２６）／高濃度背景抽出（５０８、５１８、５２８）、文字絵柄識別（５０９、５１９、５２９）を行い、ＯＲ５３０において各ｃｍｙ信号から識別された文字エッジの論理和演算を行う。ｃｍｙいずれかの信号で文字エッジと識別されれば、第１の文字エッジ識別手段２００１の結果は文字エッジになる。

図５は、３値化手段５０１、５１１、５２１の構成を示す。閾値Ｔｈ１とＴｈ２（Ｔｈ１＜Ｔｈ２、図３参照）を予め設定しておき、注目画素の値がＴｈ１未満であれば白画素、Ｔｈ１以上かつＴｈ２未満であれば中間画素、Ｔｈ２以上であれば黒画素と判定する。Ｔｈ１およびＴｈ２の設定方法について説明する。網点率３０％以上の網点を高濃度網点として抽出する場合、Ｔｈ１は、３０％網点上文字が黒画素または中間画素として抽出され、かつ、３０％網点背景の網点ドットが網点のピーク部だけでなくほぼドット内に位置する全画素に関して黒画素または中間画素として抽出されるような閾値に設定しておく。Ｔｈ２は、３０％網点上文字が黒画素として抽出され、かつ、文字背景には存在しないが絵柄中には存在する網点率９０％付近の網点が全て黒画素にならず、網点と網点の隙間に位置する画素が中間画素または白画素として抽出されるような閾値に設定しておく。Ｔｈ１とＴｈ２の２つの閾値を設定して３値化する理由は、Ｔｈ１は主に後述の背景濃度算出および高濃度網点背景抽出の精度を確保するため、Ｔｈ２は主に後述の白孤立点抽出および白孤立点密度判定の精度を確保するためであり、両立が困難であるためである。

図６（ａ）は、連結黒画素抽出手段５０２、５１２、５２２の構成を示す。連結黒画素パターンマッチング６０２では、注目画素を中心とした５×５画素を参照し、図６（ｂ）〜（ｇ）に図示した●を黒画素または中間画素とみなし、このパターン（ｂ）〜（ｇ）にマッチすれば注目画素を「連結黒画素１」として抽出する。

連結黒画素パターンマッチング６０３では、注目画素を中心とした５×５画素を参照し、図６（ｂ）〜（ｇ）に図示した●を黒画素とみなし、このパターン（ｂ）〜（ｇ）にマッチすれば注目画素を「連結黒画素２」として抽出する。図６（ｂ）〜（ｇ）において、●がない画素はＤｏｎ’ｔＣａｒｅである（黒画素でも中間画素でも白画素でも構わない）。信号生成手段６０４では、２ビット信号を生成し、連結黒画素１である場合は上位ビットを“１”、連結黒画素２である場合には下位ビットを“１”にする。連結黒画素１でも連結黒画素２でもない場合は、上位ビットも下位ビットも０で、“００”になる。後段で連結黒画素１の抽出結果と連結黒画素２の抽出結果を参照する場合には、各々該当するビットの信号値を参照すればよい。

図７（ａ）は、連結黒画素エッジ抽出手段５０５、５１５、５２５の構成を示す。非連結黒画素膨張手段６０５では、注目画素を中心とした３×３画素を参照し、１つでも連結黒画素２でない画素が存在すれば、“１”を出力する。全て連結黒画素２の場合は“０”を出力する。非連結黒画素に隣接した連結黒画素判定手段６０６では、注目画素が連結黒画素２であり、かつ、非連結黒画素膨張手段６０５の出力値が“１”の場合に、注目画素を連結黒画素エッジとして抽出する。つまり、注目画素が連結黒画素２であり、隣接する周辺画素に連結黒画素２でない画素が存在するか否かを判定しており、例えば図７（ｂ）のような場合に連結黒画素エッジとして抽出される。図７（ｂ）は、●が連結黒画素２、○が連結黒画素２でない画素を表している。

図８（ａ）は、白孤立点抽出手段５０３、５１３、５２３の構成を示す。白孤立点パターンマッチング６０７では、注目画素を中心とした５×５画素を参照し、図８（ｂ）〜（ｏ）に図示した●を連結黒画素１、○を連結黒画素１でない画素とみなし、このパターン（ｂ）〜（ｏ）にマッチすれば注目画素を「白孤立点１」として抽出する。

白孤立点パターンマッチング６０８では、注目画素を中心とした５×５画素を参照し、図８（ｂ）〜（ｏ）に図示した●を連結黒画素２、○を連結黒画素２でない画素とみなし、このパターンにマッチすれば注目画素を「白孤立点２」として抽出する。図８（ｂ）〜（ｏ）において、●や○がない画素はＤｏｎ’ｔＣａｒｅである（黒画素でも中間画素でも白画素でも構わない）。ＯＲ６０９では、論理和演算を行い、注目画素が白孤立点１または白孤立点２の場合に、白孤立点として抽出する。

図９は、白孤立点密度判定手段５０６、５１６、５２６の構成を示す。白孤立点計数手段６１０において、注目画素を中心とした１５×１５画素を参照し、白孤立点の数をカウントする。閾値判定手段６１１では、白孤立点の数が予め設定した閾値（ここでは８とする）よりも多ければ、注目画素が白孤立点領域の画素であると判定する。

図１０（ａ）は、背景濃度算出手段５０４、５１４、５２４の構成を示す。注目画素を中心とした１５×１５画素を参照し、連結黒画素計数手段６２０において、連結黒画素１の画素数をカウントする。これとは別に、１５×１５画素を図１０（ｂ）に示した４領域に分け、連結黒画素計数手段−Ａ６１２では領域Ａにおける連結黒画素１の画素数をカウントする。連結黒画素計数手段−Ｂ６１４では領域Ｂにおける連結黒画素１の画素数をカウントする。連結黒画素計数手段−Ｃ６１６では領域Ｃにおける連結黒画素１の画素数をカウントする。連結黒画素計数手段−Ｄ６１８では領域Ｄにおける連結黒画素１の画素数をカウントする。

非連結黒画素の画像濃度平均算出手段−Ａ６１３では、領域Ａにおいて連結黒画素１でない画素の３値化前の信号（ｃまたはｍまたはｙ信号）の合計値を算出し、それを連結黒画素１でない画素の数（（７×７）−連結黒画素計数手段−Ａ６１２の結果）で除算する。

非連結黒画素の画像濃度平均算出手段−Ｂ６１５では、領域Ｂにおいて連結黒画素１でない画素の３値化前の信号（ｃまたはｍまたはｙ信号）の合計値を算出し、それを連結黒画素１でない画素の数（（７×７）−連結黒画素計数手段−Ｂ６１４の結果）で除算する。

非連結黒画素の画像濃度平均算出手段−Ｃ６１７では、領域Ｃにおいて連結黒画素１でない画素の３値化前の信号（ｃまたはｍまたはｙ信号）の合計値を算出し、それを連結黒画素１でない画素の数（（７×７）−連結黒画素計数手段−Ｃ６１６の結果）で除算する。

非連結黒画素の画像濃度平均算出手段−Ｄ６１９では、領域Ｄにおいて連結黒画素１でない画素の３値化前の信号（ｃまたはｍまたはｙ信号）の合計値を算出し、それを連結黒画素１でない画素の数（（７×７）−連結黒画素計数手段−Ｄ６１８の結果）で除算する。

背景濃度の決定手段６２１では、連結黒画素計数手段６２０の結果が予め設定した所定画素数以上である場合、べた画像あるいは太文字の文字なかであるとして、濃度のとりうる最大値を背景濃度として出力する。ｃｍｙ信号が各８ビット信号の場合は最大値は２５５である。所定画素数は、全画素数１５×１５の半数付近に設定しておく。

連結黒画素計数手段６２０の結果が前記所定画素数未満である場合、連結黒画素計数手段−Ａ６１２と連結黒画素計数手段−Ｂ６１４と連結黒画素計数手段−Ｃ６１６と連結黒画素計数手段−Ｄ６１８の結果から、連結黒画素が最も少ない領域を探し、その領域の非連結黒画素の画像濃度平均を背景濃度とする。例えば、連結黒画素計数手段−Ａ６１２の出力値が最も小さい場合、非連結黒画素の画像濃度平均算出−Ａ６１３の出力値を背景濃度として出力する。連結黒画素１でない画素を背景画像中の画素とみなし、いずれかの領域における非連結黒画素の画像濃度平均を背景濃度としている。

図１１は、平坦さ判定手段５０７、５１７、５２７の構成を示す。注目画素を中心とした９×９画素の背景濃度を参照し、最大値算出手段６２２において参照領域内の最大値を選択し、最小値算出手段６２３において参照領域内の最小値を選択する。差分演算手段６２４は最大値と最小値の差分、（最大値−最小値）の値を求め、閾値判定手段６２５において予め設定した閾値（ここでは３０とする）と比較して、差分が閾値よりも小さい場合、注目画素を平坦背景として抽出する。網点率が一様な網点背景を平坦背景として抽出するのが目的である。

図１２は、高濃度背景抽出手段５０８、５１８、５２８の構成を示す。平坦領域抽出手段６２９では、注目画素を中心とした９×９画素の平坦さ判定結果を参照し、参照領域内の全画素が平坦背景である場合に、注目画素を平坦領域の画素であると判定する。遅延ライン調整手段６２６は、平坦さ判定手段の結果と背景濃度算出手段の結果の画素が存在するラインの位置を合わせるため、４ライン分の背景濃度算出を一旦蓄積する。

平坦さ判定手段５０７、５１７、５２７は９×９画素を参照しているため、入力に対して４ライン遅れて結果が出力される。その分の遅延ライン調整が背景濃度算出の結果に対して必要になる。最小値算出手段６２７では、注目画素を中心とした９×９画素の遅延後の背景濃度を参照して、参照領域内における最小値を選択し、閾値判定手段６２８において予め設定した閾値（ここでは１４０とする）を用いて、閾値以上であれば高濃度背景候補として抽出する。閾値は、網点率３０％以上を高濃度背景候補として抽出したい場合、網点率３０％以上の領域が抽出されるように３０％網点原稿のｃｍｙ値を参照して設定しておけばよい。ＡＮＤ６３０において、論理積演算を行い、注目画素が平坦領域かつ高濃度背景候補である場合に、注目画素を高濃度背景として抽出する。

図１３は、文字絵柄識別手段５０９、５１９、５２９の構成を示す。高濃度背景抽出結果、連続黒画素エッジ抽出結果、白孤立点密度判定結果から、文字エッジを識別する。ここで識別されるのは、高濃度網点背景上文字エッジである。膨張手段６３１では、注目画素を中心とした５×５画素の連続黒画素エッジ抽出結果を参照し、参照領域内に１つでも連続黒画素エッジが存在すれば、注目画素を連続黒画素エッジとして信号“１”を出力する。

膨張手段６３２では、注目画素を中心とした１３×１３画素の白孤立点密度判定結果を参照し、参照領域内に１つでも白孤立点領域の画素が存在すれば、注目画素を白孤立点領域として信号“１”を出力する。信号反転手段６３３では、白孤立点領域に対して“１”、非白孤立点領域に対して“０”の信号が割り当てられていたものを反転し、非白孤立点領域に対して信号“１”が割り当てられるように変更する。

膨張後の連続黒画素エッジ、膨張および反転後の白孤立点領域に対して、遅延ライン調整手段６３４と遅延ライン調整手段６３５において高濃度背景抽出結果との遅延ライン調整のため、各々１４ライン分と２ライン分を一旦蓄積し、ＡＮＤ６３６において３つの信号の論理積演算を行う。高濃度背景抽出結果も、高濃度背景に対して信号“１”を予め割り当てておき、３つの信号が全て“１”の場合に、注目画素を文字エッジとして識別する。高濃度背景、かつ、連続黒画素エッジ、かつ、非白孤立点領域の画素を抽出していることになる。

図１４は、第２の文字エッジ識別手段２００２の構成を示す。ｃｍｙ信号各々に対して２値化（２０２、２１２、２２２）、エッジの滑らかさ判定（２０３、２１３、２２３）、連続エッジ検出（２０４、２１４、２２４）／ペアエッジ検出（２０５、２１５、２２５）／交点エッジ検出（２０６、２１６、２２６）、文字絵柄識別（２０７、２１７、２２７）を行い、ＯＲ２０８において各ｃｍｙ信号から識別された文字エッジの論理和演算を行う。ｃｍｙいずれかの信号で文字エッジと識別されれば、第２の文字エッジ識別手段２００２の結果は文字エッジになる。
図１５（ａ）は、２値化手段２０２、２１２、２２２の構成を示す。ピーク画素検出は、注目画素が濃度変化の山を示す極点であるかどうかを、周囲の画素との濃度関係から判定するものである。Ｍ×Ｍ画素からなるブロック内において、中心画素の濃度レベルが他のすべての濃度レベルよりも高いときに、式２あるいは式３のようにして極点かどうかを判定する。式２によりピーク画素を検出しているのがピーク画素検出手段（３×３）２３１、式３によりピーク画素を検出しているのがピーク画素検出手段（５×５）２３２である。
Ｍ＝３（図１５（ｂ））の場合、
（２ｍ０−ｍ１−ｍ８）≧ΔｍＴＨかつ、
（２ｍ０−ｍ２−ｍ７）≧ΔｍＴＨかつ、
（２ｍ０−ｍ３−ｍ６）≧ΔｍＴＨかつ、
（２ｍ０−ｍ４−ｍ５）≧ΔｍＴＨ（式２）
Ｍ＝５（図１５（ｃ））の場合、
（２ｍ０−ｍ１−ｍ２４）≧ΔｍＴＨかつ、
（２ｍ０−ｍ７−ｍ１８）≧ΔｍＴＨかつ、
（２ｍ０−ｍ３−ｍ２２）≧ΔｍＴＨかつ、
（２ｍ０−ｍ８−ｍ１７）≧ΔｍＴＨかつ、
（２ｍ０−ｍ５−ｍ２０）≧ΔｍＴＨかつ、
（２ｍ０−ｍ９−ｍ１６）≧ΔｍＴＨかつ、
（２ｍ０−ｍ１１−ｍ１４）≧ΔｍＴＨかつ、
（２ｍ０−ｍ１２−ｍ１３）≧ΔｍＴＨ（式３）
つまり、中心画素を挟んで対称の位置にある２つの画素レベルの平均値と中心画素の濃度差が、閾値ΔｍＴＨよりも大きいときに、中心画素をピークとして検出する。ＯＲ回路２３３において２つのピーク画素検出手段２３１と２３２のうちどちらか一方でもピーク画素として検出されればピーク画素と判定する。閾値設定手段２３４では、注目画素を中心として９×９画素内にあるピーク画素および画素値（ｃまたはｍまたはｙの値）からピーク画素の中から最も画素値が大きいもの（濃度が高いもの）を検出し、閾値＝ピーク画素最大値＋αとする。αは閾値に余裕を持たせるためのパラメータであり、ｃｍｙ信号が各８ｂｉｔの場合はα＝１０〜３０程度の値に設定しておく。参照領域内にピーク画素が殆ど無い、例えば４つ未満の場合は、閾値＝予め設定した固定値とする。色々な濃度を有する白地原稿の白地部分よりもやや大きい値に設定しておけばよい（ここでは１３０とする）。白画素／黒画素判定手段２３５は、設定した閾値以上であれば黒画素、設定した閾値未満であれば白画素と判定する。これにより、網点上文字の平網部分は白画素と判定され、文字部分は（網点上の白抜き文字のようなものは例外として）網点よりも濃度が高いので、黒画素と判定される。

図１６（ａ）は、エッジの滑らかさ判定手段２０３、２１３、２２３の構成を示す。Ｐ１パターンマッチング２４１は図１６（ｂ）のＰ１、Ｐ２パターンマッチング２４２は図１６（ｂ）のＰ２、Ｐ３パターンマッチング２４３は図１６（ｂ）のＰ３、Ｐ４パターンマッチング２４４は図１６（ｂ）のＰ４の３×３サイズの２値画像パターンとのパターンマッチングを行い、一致すれば「１」、不一致ならば「０」を出力する。

次に、各出力値に対して、横方向または縦方向の画素数カウントを行い、注目画素から見た４方向の領域に対して縦エッジまたは横エッジの抽出を行う。ここで抽出されるのは、左上縦エッジ／左下縦エッジ／右上縦エッジ／右下縦エッジ／左上横エッジ／右上横エッジ／左下横エッジ／右下横エッジの８つの２値信号である。

図１７（ａ）−２のように、注目画素を中心として参照領域を４等分し、左上領域に縦線の左側エッジ（立上りエッジ）があるとき左上縦エッジ、左下領域に縦線の左側エッジ（立上りエッジ）があるとき左下縦エッジとして抽出する。

図１７（ａ）−１、（ａ）−３のように、４５°〜１３５°の傾きがある場合も、左上縦エッジおよび左下縦エッジの抽出対象とする。

縦線の右側エッジも同様に、図１７（ｂ）−２のように、右上領域に縦線の右側エッジ（立下りエッジ）があるとき右上縦エッジ、右下領域に縦線の右側エッジ（立下りエッジ）があるとき右下縦エッジとして抽出し、４５°〜１３５°の傾きがある場合も抽出対象とする（図１７（ｂ）−１、（ｂ）−３）。

図１７（ｃ）−２のように、注目画素を中心として参照領域を４等分し、左上領域に横線の上側エッジ（立上りエッジ）があるとき左上横エッジ、右上領域に横線の上側エッジ（立上りエッジ）があるとき右上横エッジとして抽出する。図１７（ｃ）−１、（ｃ）−３のように、−４５°〜４５°の傾きがある場合も左上横エッジおよび右上横エッジの抽出対象とする。

横線の下側エッジも同様に、図１７（ｄ）−２のように、左下領域に横線の下側エッジ（立下りエッジ）があるとき左下横エッジ、右下領域に横線の下側エッジ（立下りエッジ）があるとき右下横エッジとして抽出し、−４５°〜４５°の傾きがある場合も抽出対象とする（図１７（ｄ）−１、（ｄ）−３）。なお、図１７（ａ）〜（ｄ）では、参照領域内に対となるエッジが存在する比較的細い線を例に図示したが、図１７（ｅ）−１のように、対となるエッジが参照領域内には存在しない太い線のエッジに関しても同じく、左上縦エッジや左下縦エッジを抽出する。また、ここで抽出するのは直線だけでなく、図１７（ｅ）−２のように、滑らかな曲線のエッジも含めて左上縦エッジや左下縦エッジを抽出する。

図１８（ａ）は、横方向画素数カウント手段２４５および横方向画素数カウント手段２４６の処理を説明する図である。注目画素を挟んで横方向１３画素のパターンマッチング結果が（１）の場合を例に説明する。パターンマッチング結果に対して、画素位置に対応した（２）横方向画素数カウント用の重みを各々乗算する。重みは、注目画素位置でゼロ、離れるに従って絶対値が大きくなるものであり、左方向がマイナス、右方向がプラスである。つまり、（１）×（２）の結果はパターンにマッチした画素が注目画素から数えて左右どちらの方向に何画素離れた画素位置に存在するかを求めたものになっている。パターンにマッチした画素のうち注目画素に最も近い画素の位置（（１）×（２）の結果から、絶対値が最小になるものを選択する）を横方向画素数カウントの結果として出力する。ただし、（１）パターンマッチング結果が参照領域内で全てゼロの場合は、画素数カウントの結果は最大値「７」を出力する。

図１８（ｂ）は、縦方向画素数カウント手段２４７および縦方向画素数カウント手段２４８の処理を説明する図である。注目画素を挟んで縦方向１３画素のパターンマッチング結果が（１）の場合を例に説明する。パターンマッチング結果に対して、画素位置に対応した（２）縦方向画素数カウント用の重みを各々乗算する。重みは、注目画素位置でゼロ、離れるに従って絶対値が大きくなるものであり、上方向がマイナス、下方向がプラスである。つまり、（１）×（２）の結果はパターンにマッチした画素が注目画素から数えて上下どちらの方向に何画素離れた画素位置に存在するかを求めたものになっている。パターンにマッチした画素のうち注目画素に最も近い画素の位置（（１）×（２）の結果から、絶対値が最小になるものを選択する）を縦方向画素数カウントの結果として出力する。ただし、（１）パターンマッチング結果が参照領域内で全てゼロの場合は、画素数カウントの結果は最大値「７」を出力する。

図１９（ａ）は、左上縦エッジ抽出手段２４９および右上縦エッジ手段抽出手段２５１の参照領域と抽出条件を説明する図である。横方向画素数カウントの結果ｙ１〜ｙ７を縦方向に注目画素（ｙ７）を含む上７画素参照し、（１）縦線の抽出条件、（２）斜め線の抽出条件（滑らかな曲線も含む）のいずれかを満たせば、左上縦エッジまたは右上縦エッジとして「１」を出力、どちらも満たさなければ「０」を出力する。（１）縦線の抽出条件および（２）斜め線の抽出条件ともに、第１の条件は、７画素全ての横方向画素数カウントの結果が「７」より小さいこと、つまり、横方向に必ずパターンマッチングでマッチした画素が存在することである。（１）縦線の抽出条件の第２の条件は、横方向画素数カウントの最大値と最小値の差分が１以下であることである。（２）斜め線の抽出条件の第２の条件は、横方向画素数カウントの結果が上から下に向かって降順に並んでいることである。（１）縦線の抽出条件の方は、完全にノイズの無い縦線は勿論のこと、図５０（ｂ）の網点上文字画像の例のように、縦線に１ドットが突起状に付いている場合も縦線として抽出する条件になっており、斜め線よりも判定条件をやや緩くしている。

図１９（ｂ）は、左下縦エッジ抽出手段２５０および右下縦エッジ抽出手段２５２の参照領域と抽出条件を説明する図である。横方向画素数カウントの結果ｙ７〜ｙ１３を縦方向に注目画素（ｙ７）を含む下７画素参照する。それ以外は図１９（ａ）の左上縦エッジ抽出手段２４９および右上縦エッジ抽出手段２５１と同様である。

図２０（ａ）は、左上横エッジ抽出手段２５３および左下横エッジ抽出手段２５５の参照領域と抽出条件を説明する図である。縦方向画素数カウントの結果ｔ１〜ｔ７を横方向に注目画素（ｙ７）を含む左７画素参照し、（１）横線の抽出条件、（２）斜め線の抽出条件（滑らかな曲線も含む）のいずれかを満たせば、左上横エッジまたは左下横エッジとして「１」を出力、どちらも満たさなければ「０」を出力する。（１）横線の抽出条件および（２）斜め線の抽出条件ともに、第１の条件は、７画素全ての縦方向画素数カウントの結果が「７」より小さいこと、つまり、縦方向に必ずパターンマッチングでマッチした画素が存在することである。（１）横線の抽出条件の第２の条件は、縦方向画素数カウントの最大値と最小値の差分が１以下であることである。（２）斜め線の抽出条件の第２の条件は、縦方向画素数カウントの結果が左から右に向かって降順に並んでいることである。（１）横線の抽出条件の方は、完全にノイズの無い横線は勿論のこと、横線に１ドットが突起状に付いている場合も縦線として抽出する条件になっており、斜め線よりも判定条件をやや緩くしている。

図２０（ｂ）は、右上横エッジ抽出手段２５４および右下横エッジ抽出手段２５６の参照領域と抽出条件を説明する図である。縦方向画素数カウントの結果ｔ７〜ｔ１３を横方向に注目画素（ｔ７）を含む右７画素参照する。それ以外は図２０（ａ）の左上横エッジ抽出手段２５３および左下横エッジ抽出手段２５５と同様である。

以上、説明した各エッジの抽出条件のうち、第２の条件として説明したものが、エッジの滑らかさを判定する条件に該当し、参照領域内における局所的な凹凸の有無を判定している。

図２１は、連続エッジ検出手段２０４、２１４、２２４の構成を示す。図２１に示すように、論理積演算（ＡＮＤ）２６１〜２６４および論理和演算（ＯＲ）２６５で構成される。例えば図２４（ａ）のように、注目画素が左上縦エッジかつ左下縦エッジの場合、連続エッジとして検出される。滑らかな線が連続する場合に連続エッジが検出され、主に太い文字や線のエッジが検出される。

図２２は、ペアエッジ検出手段２０５、２１５、２２５の構成を示す。図２２に示すように、論理積演算（ＡＮＤ）２７１〜２７４および論理和演算（ＯＲ）２７５で構成される。例えば図２４（ｂ）のように、注目画素が左上縦エッジかつ右上縦エッジ、または、左下縦エッジかつ右下縦エッジの場合、ペアエッジとして検出される。主に細い文字や線が検出される。また、図２４（ｃ）のように、端点付近のエッジもペアエッジとして検出される。

図２３は、交点エッジ検出手段２０６、２１６、２２６の構成を示す。図２３に示すように、論理積演算（ＡＮＤ）２８１〜２８８および論理和演算（ＯＲ）２８９で構成される。例えば図２４（ｄ）のように、注目画素が右上横エッジかつ左下縦エッジの場合、交点エッジとして検出される。主に文字を構成する線同士の交点、太文字の端点、折れ線の角付近が検出される。

図２５は、文字絵柄識別手段２０７、２１７、２２７の構成を示す。太文字（太線）エッジおよび細文字（細線）エッジをそれぞれ識別し、ＯＲ２９５で太文字エッジまたは細文字エッジであれば文字エッジとして識別する。ここで識別されるのは、低濃度網点背景上文字エッジおよび白背景上文字エッジである。太文字エッジの抽出は、補正手段２９１で補正を行い、その結果を膨張手段２９２で膨張する。太文字エッジでは、連続エッジ／ペアエッジ／交点エッジのうち、連続エッジと交点エッジが抽出されるはずである。補正手段２９１では、５×５の参照領域内の画素全てにおいて連続エッジまたは交点エッジが検出されていれば「１」を出力し、連続エッジでも交点エッジでもない画素が存在する場合は「０」を出力する。膨張手段２９２は、９×９画素の補正手段２９１の結果を参照し、「１」が存在すれば太文字エッジとして抽出する。細文字エッジの抽出は、補正手段２９３で補正を行い、その結果を膨張手段２９４で膨張する。細文字エッジでは、連続エッジ／ペアエッジ／交点エッジのうち、ペアエッジと交点エッジが抽出されるはずである。補正手段２９３では５×５の参照領域内の画素全てにおいてペアエッジまたは交点エッジが検出されていれば「１」を出力し、ペアエッジでも交点エッジでもない画素が存在する場合は「０」を出力する。膨張手段２９４は、９×９画素の補正手段２９３の結果を参照し、「１」が存在すれば細文字エッジとして抽出する。

エッジの滑らかさ判定から文字絵柄識別までの処理を、網点上文字エッジの場合、網点絵柄中エッジの場合の２つの具体例で説明する。
（エッジの滑らかさ判定の具体例１）
図２６は、網点上文字エッジの２値化後の画像である。図２７は、図２６の画像に対するＰ１パターンマッチング２４１の結果と横方向画素数カウント手段２４５の結果であり、左上縦エッジ、左下縦エッジともに、横方向画素数カウント結果＝７が存在するので、抽出結果は「０」になる。

図２８は、図２６の画像に対するＰ２パターンマッチング２４２の結果と横方向画素数カウント手段２４６の結果であり、右上縦エッジ、右下縦エッジともに、横方向画素数カウント結果＝７が存在するので、抽出結果は「０」になる。

図２９は、図２６の画像に対するＰ３パターンマッチング２４３の結果と縦方向画素数カウント手段２４７の結果であり、左上横エッジ、右上横エッジともに、縦方向画素数カウント結果が全て７未満、かつ、左から右に向かって降順に並んでいるので、抽出結果は「１」になる。

図３０は、図２６の画像に対するＰ４パターンマッチング２４４の結果と縦方向画素数カウント手段２４８の結果であり、左下横エッジ、右下横エッジともに、縦方向画素数カウント結果が全て７未満、かつ、左から右に向かって降順に並んでいるので、抽出結果は「１」になる。

以上の各抽出結果から、図２６の画像に対するエッジの滑らかさ判定の結果、滑らかなエッジであるとして抽出されるのは、左上横エッジ、右上横エッジ、左下横エッジ、右下横エッジ、ということになる。これは連続エッジおよびペアエッジとして検出され、（補正手段２９３で排除されなければ）最終的に文字エッジとして識別される。
（エッジの滑らかさ判定の具体例２）
図３１は、網点絵柄中エッジの２値化後の画像である。図３２は、図３１の画像に対するＰ１パターンマッチング２４１の結果と横方向画素数カウント手段２４５の結果である。左上縦エッジは、横方向画素数カウント結果が全て７未満、かつ、上から下に向かって降順に並んでいるので抽出結果は「１」、左下縦エッジは、横方向画素数カウント結果＝７が存在するので抽出結果は「０」になる。

図３３は、図３１の画像に対するＰ２パターンマッチング２４２の結果と横方向画素数カウント手段２４６の結果であり、右上縦エッジは、横方向画素数カウント結果＝７が存在するので抽出結果は「０」、右下縦エッジは、横方向画素数カウント結果が全て７未満、かつ、上から下に向かって降順に並んでいるので抽出結果は「１」になる。

図３４は、図３１の画像に対するＰ３パターンマッチング２４３の結果と縦方向画素数カウント手段２４７の結果であり、左上横エッジは、縦方向画素数カウント結果が全て７未満であるが左から右に向かって降順に並んでいないため抽出結果は「０」、右上横エッジは、縦方向画素数カウント結果が全て７未満、かつ、左から右に向かって降順に並んでいるので抽出結果は「１」になる。

図３５は、図３１の画像に対するＰ４パターンマッチング２４４の結果と縦方向画素数カウント手段２４８の結果であり、左下横エッジは、縦方向画素数カウント結果が全て７未満、かつ、左から右に向かって降順に並んでいるので抽出結果は「１」、右下横エッジは、縦方向画素数カウント結果が全て７未満であるが左から右に向かって降順に並んでいないため抽出結果は「０」になる。

以上の各抽出結果から、図３１の画像に対するエッジの滑らかさ判定の結果、滑らかなエッジであるとして抽出されるのは、左上縦エッジ、右下縦エッジ、右上横エッジ、左下横エッジ、ということになる。これは連続エッジ、ペアエッジ、交点エッジのいずれでもなく、最終結果は文字エッジでないということになる。注目すべきは、左上横エッジと右下横エッジが、参照領域に局所的な凹凸があるため滑らかなエッジでないと判定され、抽出されない点であり、これにより絵柄エッジを文字エッジとして誤って識別してしまうことを防いでいる。

図３６は、エッジ量抽出手段３０の構成を示す。信号合成手段３０１は、Ｒ’Ｇ’Ｂ’信号を合成（（Ｒ’＋２Ｇ’＋Ｂ’）／４）して１信号に変換し、エッジ量検出手段３０２においてエッジ量を検出する。

図３７（ａ）は、エッジ量検出手段３０２の構成を示す。エッジ量検出フィルタ３０３〜３０６（１〜４）では、それぞれ図３７（ｂ）〜（ｅ）に示した４種類の７×７フィルタを使用して、マスキング演算を行う。４つの出力のうち絶対値が最大のものを最大値選択手段３１１で選択し、出力する。

図３８は、フィルタ処理手段１３の構成を示す。平滑化手段１３１およびエッジ強調手段１３２のフィルタ処理を行い、２つのフィルタ処理の結果を合成手段１３３は、エッジ量および文字エッジに応じた割合で合成する。文字エッジである場合は、エッジ量に応じて、エッジ量最大のときに平滑化結果：エッジ強調結果を１：１０、エッジ量最小のときに１：０（平滑化結果のみ有効）、エッジ量が中間の値の場合は中間的な割合で合成する。文字エッジでない場合は常に１：０の割合で合成する。白背景上文字エッジおよび網点上文字エッジを強調して鮮鋭に再現し、絵柄部は滑らかに粒状性良く再現するのに有効である。

図３９は、エッジ量抽出手段４０の構成を示す。Ｃ’Ｍ’Ｙ’各色毎にエッジ量検出手段４０１、４０２、４０３は多値のエッジ量を検出する。エッジ量検出手段の構成は、エッジ量抽出手段３０のものと同様である（図３７（ａ））。ただし、エッジ量検出フィルタは図３９（ｂ）〜（ｅ）の５×５サイズのものを使用する。フィルタ処理後の信号からのエッジ量検出であるため、解像度の違いを考慮して検出フィルタのサイズを変えている。最大値選択手段４０４は、検出した３色のエッジ量のうち最大のものを選択する。一方、信号合成手段４０５は、Ｃ’Ｍ’Ｙ’の３信号を所定の割合で足し合わせて１信号に変換する。例えば（Ｃ’×１／４＋Ｍ’×２／４＋Ｙ’×１／４）を合成信号として出力する。ラプラシアンフィルタ演算手段４０６は、合成信号に対して図３９（ｆ）のフィルタを使用してマスキング演算を行い、符号判定手段４０７は正の値か否かを判定する。正なら１、負なら０を出力する。内側エッジ量抽出手段４０８は、符号判定手段４０７の結果が「１」である場合に、最大値選択手段４０４の出力値をそのまま出力する。符号判定手段４０７の結果が「０」の場合は、エッジ量をキャンセルして０を出力する。ラプラシアンフィルタ演算手段４０６の出力値は、文字の内側エッジに相当するエッジの高濃度側では正の値、文字の外側エッジに相当するエッジの低濃度側では負の値を出力するため、これを利用し、ラプラシアンが正の内側エッジでのみエッジ量を有効にし、ラプラシアンが負の外側エッジではエッジ量を無効にしている。Ｎ値化手段４０９においてＮ値に量子化する。Ｎは、エッジ量抽出結果の適用先であるＵＣＲ／墨生成手段１５において、処理を何段階で制御するかに応じて決まるものであるが、ここでは説明を簡単にするため２段階で制御するものとし、０〜６３の値で抽出された内側エッジ量を０／１（Ｎ＝２）に量子化しておく。

ＵＣＲ／墨生成手段１５は、墨生成、ＵＣＲともに式で行う方法、ＬＵＴで行う方法等があるが、本実施例では墨生成をＬＵＴで行い、ＵＣＲを式で行う場合について説明する。図４０は、墨生成のＬＵＴである。墨生成では、Ｃ’、Ｍ’、Ｙ’（０が白、２５５が黒）の最小値Ｍｉｎ（Ｃ’、Ｍ’、Ｙ’）を算出し、これをＬＵＴへ入力して出力値を得る。ＵＣＲは次の式により行う。αはＵＣＲ調整パラメータである。
Ｃ＝Ｃ’−α×Ｋ
Ｍ＝Ｃ’−α×Ｋ
Ｙ＝Ｃ’−α×Ｋ（式４）
文字エッジかつエッジ量抽出手段４０の出力値が「１」の場合、墨生成テーブル−１を使用し、Ｍｉｎ（Ｃ、Ｍ’Ｙ’）をそのままＫに置き換え、ＵＣＲ調整パラメータはα＝１とする。その他の場合は、墨生成テーブル−２を使用し、ハイライトではＫを発生させず中間から徐々にＫを発生させる。ＵＣＲ調整パラメータはα＝０．５とする。フィルタ処理のようにエッジ量を多値で求め、中間的な墨生成テーブルをいくつも準備して多段階制御しても良い。このように墨生成およびＵＣＲを切り換えることにより、文字（黒文字）を鮮鋭に色付きなく再現し、絵柄を高階調に再現することができる。

以上、本実施例によれば、高濃度背景上文字エッジに関しては、背景の濃度や平坦さ、連結黒画素の抽出、絵柄中に多く存在する白孤立点の抽出結果に基づき、網点上文字エッジを網点絵柄中エッジと切り分けて識別することができる。低濃度背景上文字エッジに関しては、局所的な凹凸に着目し、滑らかなエッジであるか否かを判定することで、網点上文字エッジを網点絵柄中エッジと切り分けて識別することができる。白背景上文字エッジも低濃度背景上文字エッジを識別する際に、区別無く同時に識別される。また、高濃度背景上文字エッジ識別用の第１の文字エッジ識別手段において文字エッジとして識別された画素、あるいは、低濃度背景上文字エッジ識別用の第２の文字エッジ識別手段において文字エッジとして識別された画素を、文字エッジとし、フィルタ処理、墨処理に適用することにより、網点上文字エッジと網点絵柄の高画質再生を両立できる。なお、本実施例では文字絵柄識別結果をフィルタ処理と墨処理に適用する例を示したが、色補正や擬似階調処理など、様々な高画質化処理に文字絵柄識別結果を使用する従来技術があり、それらに本発明の識別結果を適用しても勿論有効である。

実施例２：
実施例１では、本発明の文字絵柄識別結果を高画質化処理に適用する例を示した。実施例２では、高画質化ではなく画質加工的な処理であるトナーセーブ処理に適用する例を示す。トナーセーブ処理は、濃度を下げて出力することにより、トナー消費量を抑える処理である。なお、“トナーセーブ”のトナーとは、粉体トナーに限らない。液体トナー（インク）もこれに含まれる。

図４１は、本発明の実施例２の構成を示す。操作パネル５０では、ユーザーがトナーセーブモードで出力したい場合にトナーセーブモードを選択指定することができる。ユーザーがトナーセーブモードを指定した場合、トナーセーブ処理手段１９がトナーセーブ処理を行う。

トナーセーブ処理手段１９は、操作パネル５０からの信号、および、画像属性判定手段２０の結果（文字エッジであるか否か）、および、エッジ量抽出手段４０の出力値に応じて、トナーセーブ処理を切り換える。

トナーセーブ処理は、図４２のγ変換により行う。トナーセーブγ−１を使用した場合、入力値＝出力値になり、濃度がそのまま保存され、実質的にトナーセーブ処理が行われないことになる。トナーセーブγ−２を使用した場合、入力値に対して出力値が５０％程度になる処理が施される。操作パネル５０でトナーセーブモードが指定されない場合は、常にトナーセーブγ−１を使用する。操作パネル５０でトナーセーブモードが指定された場合は、文字エッジであり、かつ、エッジ量抽出の出力値が「１」である場合、トナーセーブγ−１を使用してトナーセーブ処理を行う（実質的に行わない）。その他の場合は、トナーセーブγ−２を使用する。

これにより、トナーセーブモード設定時、白背景上文字エッジおよび網点上文字エッジの濃度を保存することで文字判読性を維持しつつ、絵柄部に対して効果的にトナーを節約し、かつ、網点絵柄中エッジが文字エッジのように濃度保存されてしまう画質上の不具合（文字絵柄識別の精度が悪いと頻繁に発生してしまう不具合）を抑えて絵柄部でも良好なトナーセーブ画像を生成することができる。

以上、実施例２によれば、実施例１の文字絵柄識別をトナーセーブ処理に適用することにより、文字判読性の維持、絵柄画質の不具合の抑制、トナーの節約効果の発揮を同時に達成することができる。このように、本発明の識別技術は高画質化のための画像処理に限定されるものではなく、適用範囲は極めて広い。ここで挙げたトナーセーブもその適用例の一つであり、この他に例えば文字絵柄を識別して圧縮方式を変えることで圧縮効率を高める技術等に適用しても効果的である。

実施例３：
実施例１の画像属性判定２０では、高濃度背景上文字エッジ識別用の第１の文字エッジ識別手段と、低濃度背景上文字エッジ識別用の第２の文字エッジ識別手段を持ち、各々適した別の特徴および識別方法を用いて文字エッジを識別していた。

本実施例では、高濃度背景上文字エッジ識別用の第１の文字エッジ識別手段と、低濃度背景上文字エッジ識別用の第２の文字エッジ識別手段に加えて、白背景上文字エッジ識別用の第３の文字エッジ識別手段を備える実施例について説明する。

白背景上文字エッジは、前述のとおり、第２の文字エッジ識別手段においても特に区別無く文字エッジとして識別されるが、やや不十分なケースがある。白背景上文字の場合はコントラストの低いやや薄い文字も多く存在するが、網点上文字を意識した２値化では狙い通りに２値化できないことがあり、薄い文字エッジの識別精度がやや悪くなる恐れがある。また、白背景上文字エッジと絵柄エッジとの識別は、網点があるか否かの情報で絵柄エッジにおける識別の誤りをより効果的に防止することができるため、逆に言えば、白背景上文字エッジを文字エッジでないと判定してしまう識別の誤りを防止することもできる。白背景上文字エッジの識別に最適な特徴は網点上文字エッジの識別に最適な特徴とは異なるため、識別手段を別々に持つことにより、各々に最適で精度の良い識別を行うことが実施例３の目的である。

また、白背景上文字エッジのうち、特に黒文字エッジは、ＣＭＹトナーを使わずＫトナーのみで画像再生を行うことにより、黒文字の色つきを抑制することが一般的に行われている。その処理のために、他の文字エッジとは別に白背景上黒文字エッジを識別することは大変意味がある。

図４３は、実施例３の画像属性判定手段２０の構成を示す。本実施例では、実施例１における第１の文字エッジ識別手段２００１、第２の文字エッジ識別手段２００２に加えて、第３の文字エッジ識別手段２００４を有し、文字エッジ属性判定手段２００５では、ＯＲ２００３から出力される網点上文字エッジに対する識別結果である“文字エッジ”と、第３の文字エッジ識別手段２００４から出力される白背景上文字エッジに対する識別結果である“黒文字エッジ／色文字エッジ”を参照して、文字エッジまたは黒文字エッジまたは色文字エッジである場合に、最終的に文字エッジであると判定し、判定結果を信号として出力する。また、黒文字エッジである場合に、白背景上文字エッジであることを表す信号も出力し、合わせて２ビットの信号を出力する。

図４４は、第３の文字エッジ識別手段２００４の構成を示す。第３の文字エッジ識別手段２００４は、エッジ判定手段７００、白地判定手段７０１、網点判定手段７０２、色判定手段７０３、文字エッジ検出手段７０４から構成されている。

図４５（ａ）は、エッジ判定手段７００の構成を示す。３値化回路７０５によって、ＲＧＢ各８ビットからなる入力画像のうちＧ信号を２つの閾値ｔｈ１およびｔｈ２（ｔｈ１＜ｔｈ２）で３値化する。０がシャドー側、２５５がハイライト側で、０≦Ｇ≦ｔｈ１ならば黒画素、ｔｈ１＜Ｇ＜ｔｈ２ならば中間画素、ｔｈ２≦Ｇ≦２５５ならば白画素とする。

黒画素パターンマッチング７０６では３×３のマトリクス内の黒画素パターンが図４５（ｂ）のいずれかとマッチングしたときに注目画素を連結黒画素と判定する。白画素パターンマッチング７０７も同様に白画素が図４５（ｃ）とマッチするかどうかをみて連結白画素を判定する。

計数手段７０８と７０９では、注目画素を中心とした３×３画素内で連結黒画素の数と連結白画素を計数し、計数値が一定値（例えば２）以上のとき“１”を出力し、ＡＮＤ７１０において両方の計数結果が“１”である場合にエッジ部であると判定する。つまり、文字の輪郭部分には連結白画素及び連結黒画素が同時に一定以上の密度で存在するという性質を利用して判定する。

図４６（ａ）は、白地判定手段７０１の構成を示す。２値化手段７１１は、Ｇ信号に対して白画素であるか黒画素であるかを２値判定する。判定した白画素でパターンマッチング７１２を行い、孤立で存在する白画素の判定を覆す。具体的には図４６（ｂ）の縦横斜め４方向の白画素連続性をみるパターンでパターンマッチングを行い、マッチすれば白画素、マッチしなければ黒画素ということにする。次に、注目画素を含む周囲１１×１１画素をみて、その中に１つでも白画素があれば注目画素を白画素に覆す膨張処理を膨張処理手段７１３により行う。更に、注目画素を含む周囲１７×１７画素をみて、その中に１つでも黒画素があれば注目画素を黒画素に覆す収縮処理を収縮処理手段７１４により行う。収縮処理後に白画素として残った領域が、最終的に白地判定される領域になる。

図４７は、網点判定手段７０２の構成を示す。網点判定手段７０２はピーク画素検出による方法を用いて行う。ピーク画素検出は、注目画素が濃度変化の山または谷を示す極点であるかどうかを、周囲の画素との濃度関係から判定するものである。Ｍ×Ｍ画素からなるブロック内において、中心画素の濃度レベルが他のすべての濃度レベルよりも高い、あるいは低いときに、式２あるいは式３のようにして極点かどうかを判定する。式２によりピーク画素を検出しているのがピーク画素検出手段（３×３）７１５、式３によりピーク画素を検出しているのがピーク画素検出手段（５×５）７１６であり、図１５のピーク画素検出と同じ処理を行っている。ＲＧＢ各信号に対してピーク画素検出を行ってもよいが、簡略化する場合はＧ信号に対してピーク検出を行う。そして、ピーク画素の情報を基に、その領域が網点領域であるかどうかを判定する。ＯＲ回路７１７において２つのピーク画素検出手段７１５と７１６のうちどちらか一方でもピーク画素として検出されればピーク画素と判定し、ブロック化手段７１８において４×４画素からなるブロック毎にピーク画素が１つでも存在すればアクティブブロックと判定し、密度補正手段７１９において注目ブロックを中心とした５×５ブロック内におけるアクティブブロックを計数し、計数値が所定個以上の場合に注目ブロックを網点ブロックとし、最後に膨張手段７２０で３×３ブロックでの膨張処理を行い、１つでも網点ブロックが存在すれば注目ブロックを網点領域とする。

図４８は、色判定手段７０３の構成を示す。有彩画素検出手段７２１でＭａｘ（｜Ｒ−Ｇ｜、｜Ｇ−Ｂ｜、｜Ｂ−Ｒ｜）＞ｔｈ３（ｔｈ３は所定の閾値）に該当する画素を有彩画素として検出し、ブロック判定手段７２２で４×４画素からなるブロック毎に有彩画素が１つでも存在すればアクティブブロックと判定し、膨張手段７２３で７×７ブロックでの膨張処理を行い、１つでもアクティブブロックが存在すれば注目ブロックを有彩領域とする。これは色判定の方法の一例であり、網点判定のように計数処理するなどして誤判定を排除する処理を加えることにより、より高精度に判定できる。

図４９は、文字エッジ検出手段７０４の構成を示す。エッジ判定手段７００と白地判定手段７０１と網点判定手段７０２の結果から、白背景上文字エッジ判定手段７２４では文字エッジ候補画素を判定する。エッジかつ白地かつ非網点の場合に文字エッジ候補画素であると判定する。前述のエッジ判定手段７００によると、内側エッジ／外側エッジともに１ドットずつが文字エッジ候補画素として検出される。内外１ドットずつの計２ドットでは、フィルタ１３の処理に対して不十分であるので、膨張手段（３×３）７２５において膨張処理を行い、その結果を“文字エッジ”とする。膨張手段（３×３）７２５は、注目画素を中心とした３×３画素の文字エッジ候補画素を参照し、１つでも文字エッジ候補画素が存在すれば注目画素を文字エッジとする処理である。膨張量はここでは３×３であるが、スキャナの色ずれ特性やフィルタ処理での必要膨張量を考慮して５×５などにしても良い。黒文字／色文字判定手段７２６では、文字エッジと色判定手段７０３の結果から、文字エッジかつ有彩色の場合に“色文字エッジ”であると判定し、文字エッジかつ無彩色の場合に“黒文字エッジ”であると判定する。

実施例１では、図３８のフィルタ処理手段１３において、平滑化手段１３１およびエッジ強調手段１３２のフィルタ処理を行い、２つのフィルタ処理の結果を合成手段１３３でエッジ量および文字エッジに応じた割合で合成していた。文字エッジである場合は、エッジ量に応じて、エッジ量最大のときに平滑化結果：エッジ強調結果を１：１０、エッジ量最小のときに１：０（平滑化結果のみ有効）、エッジ量が中間の値の場合は中間的な割合で合成し、文字エッジでない場合は常に１：０の割合で合成していた。

本実施例では、白背景上黒文字エッジ以外の画素に関しては実施例１と同じ比率で平滑化結果とエッジ強調結果を合成し、白背景上黒文字エッジの画素に関しては、エッジ量最大のときに更にエッジ強調の割合を大きくして１：１２の割合で合成する。白背景上黒文字の鮮鋭性を特に高めて画像を再生する。

実施例１では、文字エッジかつエッジ量抽出手段４０の出力値が「１」の場合、墨生成テーブル−１を使用し、Ｍｉｎ（Ｃ、Ｍ’Ｙ’）をそのままＫに置き換えるＵＣＲ／墨生成処理を行っていた。

本実施例では、白背景上黒文字エッジかつエッジ量抽出手段４０の出力値が「１」の場合、墨生成テーブル−１を使用し、Ｍｉｎ（Ｃ、Ｍ’Ｙ’）をそのままＫに置き換え、更にその後、強制的にＣ＝Ｍ＝Ｙ＝０に変換する処理を行う。これにより白背景上黒文字のエッジ部色付きを確実に防止する。

以上、本実施例によれば、高濃度背景上文字エッジに関しては、背景の濃度や平坦さ、連結黒画素の抽出、絵柄中に多く存在する白孤立点の抽出結果に基づき、網点上文字エッジを網点絵柄中エッジと切り分けて識別し、更に、白背景上文字エッジに関しては、エッジ判定や網点判定や白地判定や色判定に基づき、白背景上文字エッジ（黒文字エッジ／色文字エッジ）を網点絵柄と切り分けて確実に識別することができる。識別結果をフィルタ処理、墨処理に適用することにより、文字エッジと網点絵柄の高画質再生を両立できると共に、特に白背景上黒文字エッジにおいて鮮鋭性を高め、色付きを抑制することができる。

また、本発明は、前述した実施例の処理手順や機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ（ＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラムコードを読出し実行することによっても達成される。この場合、記憶媒体から読出されたプログラムコード自体が前述した実施例の処理手順や機能を実現することになる。プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、磁気テープ、不揮発性のメモリカード、ＲＯＭなどを用いることができる。また、コンピュータが読出したプログラムコードを実行することにより、前述した実施例の処理手順や機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているＯＳ（オペレーティングシステム）などが実際の処理の一部または全部を行い、その処理によって前述した実施例の処理手順や機能が実現される場合も含まれる。さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行い、その処理によって前述した実施例の処理手順や機能が実現される場合も含まれる。

本発明の実施例１の構成を示す。画像属性判定手段の構成を示す。３値化を説明する図である。第１の文字エッジ識別手段の構成を示す。３値化手段の構成を示す。連結黒画素抽出手段の構成を示す。連結黒画素エッジ抽出手段の構成を示す。白孤立点抽出手段の構成を示す。白孤立点密度判定手段の構成を示す。背景濃度算出手段の構成を示す。平坦さ判定手段の構成を示す。高濃度背景抽出手段の構成を示す。文字絵柄識別手段の構成を示す。第２の文字エッジ識別手段の構成を示す。２値化手段の構成を示す。エッジの滑らかさ判定手段の構成を示す。抽出対象となるエッジ例を示す。横／縦方向画素数カウント手段の処理を説明する図である。左上／右上縦エッジ抽出手段、左下／右下縦エッジ抽出手段の参照領域と抽出条件を説明する図である。左上／左下横エッジ抽出手段、右上／右下横エッジ抽出手段の参照領域と抽出条件を説明する図である。連続エッジ検出手段の構成を示す。ペアエッジ検出手段の構成を示す。交点エッジ検出手段の構成を示す。連続エッジ、ペアエッジ、交点エッジの検出を説明する図である。文字絵柄識別手段の構成を示す。網点上文字エッジの２値化後の画像を示す。図２６の画像に対するＰ１パターンマッチングの結果と横方向画素数カウント手段の結果を示す。図２６の画像に対するＰ２パターンマッチングの結果と横方向画素数カウント手段の結果を示す。図２６の画像に対するＰ３パターンマッチングの結果と縦方向画素数カウント手段の結果を示す。図２６の画像に対するＰ４パターンマッチングの結果と縦方向画素数カウント手段の結果を示す。網点絵柄中エッジの２値化後の画像を示す。図３１の画像に対するＰ１パターンマッチングの結果と横方向画素数カウント手段の結果を示す。図３１の画像に対するＰ２パターンマッチングの結果と横方向画素数カウント手段の結果を示す。図３１の画像に対するＰ３パターンマッチングの結果と縦方向画素数カウント手段の結果を示す。図３１の画像に対するＰ４パターンマッチングの結果と縦方向画素数カウント手段の結果を示す。第１のエッジ量抽出手段の構成を示す。エッジ量検出手段の構成を示す。フィルタ処理手段の構成を示す。第２のエッジ量抽出手段の構成を示す。墨生成のＬＵＴを示す。本発明の実施例２の構成を示す。トナーセーブ処理を説明する図である。実施例３の画像属性判定手段の構成を示す。第３の文字エッジ識別手段の構成を示す。エッジ判定手段の構成を示す。白地判定手段の構成を示す。網点判定手段の構成を示す。色判定手段の構成を示す。文字エッジ検出手段の構成を示す。従来の課題を説明する図である。

符号の説明

１０スキャナ
１１スキャナγ補正手段
１２スキャナ色補正手段
１３フィルタ処理手段
１４プリンタ色補正手段
１５ＵＣＲ／墨生成手段
１６プリンタγ補正手段
１７擬似階調処理手段
１８プリンタ
２０画像属性判定手段
３０、４０エッジ量抽出手段

Claims

画像中の網点上文字エッジを含む文字エッジを識別する装置において、高濃度網点背景上に存在する文字エッジを識別する第１の文字エッジ識別手段と、低濃度網点背景上に存在する文字エッジを識別する第２の文字エッジ識別手段を有することを特徴とする画像処理装置。
前記第１の文字エッジ識別手段は、第１の量子化手段を有し、前記第２の文字エッジ識別手段は、第２の量子化手段を有し、前記第１の量子化手段は低濃度網点背景を消去する量子化を行い、前記第２の量子化手段は高濃度網点背景を消去しない量子化を行い、それぞれ量子化後の画像データから異なる特徴に基づいて文字エッジを識別することを特徴とする請求項１記載の画像処理装置。
前記第１の文字エッジ識別手段は、連結して存在する黒画素を連結黒画素として抽出する連結黒画素抽出手段と、背景画像が所定濃度以上である高濃度背景であるか否かを判定する背景濃度判定手段を有し、前記連結黒画素抽出手段と前記背景濃度判定手段の出力に基づき、文字エッジを識別することを特徴とする請求項１または２記載の画像処理装置。
所定の参照領域内において、黒に囲まれた白を白孤立点として抽出する白孤立点抽出手段を有し、前記連結黒画素抽出手段と前記背景濃度判定手段と前記白孤立点抽出手段の出力に基づき、文字エッジを識別することを特徴とする請求項３記載の画像処理装置。
前記背景濃度判定手段は、背景画像の濃度を算出する背景濃度算出手段と、背景画像の平坦さを判定する平坦さ判定手段を有し、背景画像の濃度と平坦さに基づき、背景画像が所定濃度以上である高濃度背景であるか否かを判定することを特徴とする請求項３または４記載の画像処理装置。
前記背景濃度算出手段は、連結黒画素でない画素を背景画像中の画素とみなして、濃度を算出することを特徴とする請求項５記載の画像処理装置。
前記第２の文字エッジ識別手段は、エッジ部の滑らかさを判定する滑らかさ判定手段を有し、エッジ部の滑らかさに基づき、文字エッジを識別することを特徴とする請求項１記載の画像処理装置。
更に、白地背景上に存在する文字エッジを識別する第３の文字エッジ識別手段を有することを特徴とする請求項１記載の画像処理装置。
画像中の網点上文字エッジを含む文字エッジを識別する方法において、高濃度網点背景上に存在する文字エッジを識別する第１の文字エッジ識別工程と、低濃度網点背景上に存在する文字エッジを識別する第２の文字エッジ識別工程を有することを特徴とする画像処理方法。
請求項９記載の画像処理方法をコンピュータに実現させるためのプログラム。
請求項９記載の画像処理方法をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。