JP2010232795A

JP2010232795A - 階調数低減装置、階調数低減方法

Info

Publication number: JP2010232795A
Application number: JP2009075934A
Authority: JP
Inventors: Taira Obara; 平小原; Yasuyuki Harada; 泰行原田
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 2009-03-26
Filing date: 2009-03-26
Publication date: 2010-10-14

Abstract

【課題】背景のある文字領域や極めて大きな文字等といった条件下で、正確に文字領域を判定することができなかった。
【解決手段】矩形領域の検出（Ｓ１）にて画像データの中で文字を含む矩形領域を検出したら、ピーク評価（Ｓ２）にてヒストグラムを作成しつつピーク形状に基づく評価をする。ヒストグラムのピーク評価（Ｓ２）にてヒストグラムのピーク評価を行ったら、画素情報評価（Ｓ３）にて画素がエッジか、平面か、網点かに基づく評価を行う。画素情報評価（Ｓ３）にて画素の情報の評価を行ったら、ヒストグラムの代表値評価（Ｓ４）にてヒストグラムに基づく統計値を利用して所定の代表値を算出する。ヒストグラムの代表値評価（Ｓ４）にて代表値の評価を終了したら、属性判定（Ｓ５）では各評価に基づいて矩形領域の属性を判定する。属性判定（Ｓ５）で属性を求めたら、二値化（Ｓ６）にて同属性に対応する手法で閾値を求めつつ二値化処理を行う。
【選択図】図１

Description

本発明は、階調数低減装置、階調数低減方法に関する。

特許文献１に開示される従来技術では、読み取り画像の非背景領域を文字領域と絵柄領域に分離する方法として本特許文献に開示される技術が知られている。本技術においては、背景領域と非背景領域に分離し、文字間スペースが網点パターンの間隔に比べて広くなっていることと、エッジ情報を併用することにより、文字領域と絵柄領域に識別している。

特開2005−159576

上述した特許文献１の技術においては、背景のある文字領域や極めて大きな文字等といった条件では、正確に文字領域と判定をすることができないという課題があった。
本発明の目的は、背景のある文字領域や極めて大きな文字等といった条件下でも、正確に文字領域を判定することにある。

上記課題を解決するため、本発明においては、上記画像データにおける所定の領域を処理対象として設定する処理対象設定手段と、上記領域の画像データを処理対象として所定の階調範囲毎の度数分布を求めるとともに、同度数分布の度数分布状況からピーク形状の分布状況を求めるピーク評価手段と、求められたピーク形状の分布状況に基づいて上記領域に含まれる画像の種類である属性を判定する属性判定手段と、判定された属性に対応づけられた手法で上記画像データの階調数を減らす階調変換手段とを具備する構成としてある。

上記のように構成した本発明においては、処理対象設定手段が上記画像データにおける所定の領域を処理対象として設定すると、ピーク評価手段は上記領域の画像データを処理対象として所定の階調範囲毎の度数分布を求めるとともに、同度数分布の度数分布状況からピーク形状の分布状況を求める。そして、属性判定手段は求められたピーク形状の分布状況に基づいて上記領域に含まれる画像の種類である属性を判定し、階調変換手段は判定された属性に対応づけられた手法で上記画像データの階調数を減らす。

本発明の他の態様においては、上記ピーク評価手段は、上記ピーク形状の分布状況として最高ピークの度数を求める。
上記属性判定手段は、上記最高ピークの度数が高い場合は文字属性と判定し、低い場合は上記領域に絵柄が含まれる絵柄属性と判定する構成としてある。
上記のように構成した本態様においては、ピーク評価手段は、上記ピーク形状の分布状況として最高ピークの度数を求め、上記属性判定手段は上記最高ピークの度数が高い場合は文字属性と判定し、低い場合は上記領域に絵柄が含まれる絵柄属性と判定する。

本発明の他の態様においては、上記ピーク評価手段は、上記ピーク形状の分布状況としてピーク形状の数を求める。
上記属性判定手段は、上記ピーク形状の数が０または第一の所定値よりも小さい場合には絵柄属性と判定し、上記ピーク形状の数が上記第一の所定値よりも大きく第二の所定値よりも小さい場合には文字属性と判定し、上記ピーク形状の数が上記第二の所定値よりも大きい場合には上記領域に絵柄と文字の画像を含む文字絵柄属性と判定する構成としてある。

上記のように構成した本態様においては、上記ピーク評価手段が上記ピーク形状の分布状況としてピーク形状の数を求めると、上記属性判定手段は、上記ピーク形状の数が０または第一の所定値よりも小さい場合には絵柄属性と判定し、上記ピーク形状の数が上記第一の所定値よりも大きく第二の所定値よりも小さい場合には文字属性と判定し、上記ピーク形状の数が上記第二の所定値よりも大きい場合には上記領域に絵柄と文字の画像を含む文字絵柄属性と判定する。

本発明の他の態様においては、上記属性判定手段は、上記領域内の画素を対象として、エッジと網点と平面の画素を検出し、検出された画素数と同領域全体の画素数との割合に基づいて、上記属性を判定する構成としてある。
上記のように構成した本態様においては、上記属性判定手段は、まず、上記領域内の画素を対象として、エッジと網点と平面の画素を検出する。次に、検出された画素数と同領域全体の画素数との割合に基づいて、上記属性を判定する。

本発明の他の態様においては、上記属性判定手段は、エッジと平面の割合が高い場合は文字属性と判定し、低い場合は絵柄属性と判定する構成としてある。
上記のように構成した本態様においては、上記属性判定手段は、エッジと平面の割合が高い場合は上記領域を文字属性と判定し、低い場合は上記領域を絵柄属性と判定する。

本発明の他の態様においては、上記属性判定手段は、網点の割合が高い場合は絵柄属性と判定する構成としてある。
上記のように構成した本態様においては、上記属性判定手段は、網点の割合が高い場合は上記領域を絵柄属性と判定する。
本発明の他の態様においては、上記属性判定手段は、上記領域内の画素の階調値を対象として、所定の統計的演算を行い、得られた統計値を利用して、上記属性を判定する構成としてある。

上記のように構成した本態様においては、上記属性判定手段は、まず、上記領域内の画素の階調値を対象として、所定の統計的演算を行なう。そして、得られた統計値を利用して、上記領域が文字の画像を含む領域か、絵柄の画像を含む領域か、文字と絵柄の画像を含む領域かを判定する。
本発明の他の態様においては、上記属性判定手段は、上記統計値として、平均値を求め、同平均値が高い場合は文字属性と判定し、同平均値が低い場合は絵柄属性と判定する構成としてある。
上記のように構成した本態様においては、上記属性判定手段は、上記統計値として、平均値を求め、同平均値が高い場合は文字属性と判定し、同平均値が低い場合は絵柄属性と判定する。

本発明の他の態様においては、上記属性判定手段は、上記統計値として、上記ヒストグラムのレンジと中間値とを求め、上記レンジが広く上記平均値と上記中間値との差が大きい場合には文字属性と判定し、上記平均値と上記中間値との差が小さい場合には絵柄属性と判定する構成としてある。
上記のように構成した本態様においては、上記属性判定手段は、上記統計値として、上記ヒストグラムのレンジと中間値とを求め、上記レンジが広く上記平均値と上記中間値との差が大きい場合には文字属性と判定し、上記平均値と上記中間値との差が小さい場合には絵柄属性と判定する。

本発明の他の態様においては、上記属性判定手段は、上記統計値として最頻値を求め、上記平均値より最頻値が大きい場合には文字属性と判定する構成としてある。
上記のように構成した本態様においては、上記属性判定手段は、上記統計値として最頻値を求め、上記平均値より最頻値が大きい場合には文字属性と判定する。
本発明の他の態様においては、上記属性判定手段は、一つの領域について文字属性と絵柄属性と判定する場合、および、一つの領域について文字属性でも絵柄属性でもないと判定する場合、文字絵柄属性と判定する構成としてある。
上記のように構成した本態様においては、上記属性判定手段は、一つの領域について文字属性と絵柄属性と判定する場合、および、一つの領域について文字属性でも絵柄属性でもないと判定する場合、文字絵柄属性と判定する。

本発明の他の態様においては、上記画像データにおける所定の領域を処理対象として設定する処理対象設定工程と、
上記領域の画像データを処理対象として所定の階調範囲毎の度数分布を求めるとともに、同度数分布の度数分布状況からピーク形状の分布状況を求めるピーク評価工程と、
求められたピーク形状の分布状況に基づいて上記領域に含まれる画像の種類である属性を判定する属性判定工程と、
判定された属性に対応づけられた手法で上記画像データの階調数を減らす階調変換工程とを具備する構成としてある。

上記のように構成した本態様においては、処理対象設定工程で上記画像データにおける所定の領域を処理対象として設定すると、ピーク評価工程では上記領域の画像データを処理対象として所定の階調範囲毎の度数分布を求めるとともに、同度数分布の度数分布状況からピーク形状の分布状況を求める。そして、属性判定工程では求められたピーク形状の分布状況に基づいて上記領域に含まれる画像の種類である属性を判定し、階調変換工程では判定された属性に対応づけられた手法で上記画像データの階調数を減らす。

上記のように構成した本発明によれば、領域に含まれる画像の種類により、階調値ごとの度数分布状況、特にピーク形状の分布状況に特徴が見られ、その分布状況を判定することで領域の属性を判定でき、属性に応じた適切な階調変換を実現できる。
また、含まれる画像に応じて最高ピークの度数が異なる。より具体的には、文字属性の場合は最高ピークの度数は高く、絵柄属性の場合は最高ピークの度数は低くなる傾向がある。このため、請求項２の発明によれば、最高ピークの度数を求めることにより、文字属性か否かを的確に判定することができる。

また、含まれる画像に応じてピーク形状の数が異なる。より具体的には、絵柄属性であるときにピーク形状の数が最も少なく、文字属性であるときにピーク形状の数は増え、文字絵柄属性の場合にはさらに増える。このため、請求項３の発明によれば、ピーク形状の数に基づいて属性を的確に判定することができる。
また、領域が文字の画像を含む領域か、絵柄の画像を含む領域か、文字と絵柄の画像を含む領域かにより、エッジと網点と平面の画素が含まれる割合が異なる。このため、請求項４の発明によれば、所定の領域ごとに、エッジと網点と平面の画素を検出することにより、検出された画素数と同領域全体の画素数との割合に基づいて、上記領域が文字の画像を含む領域か、絵柄の画像を含む領域か、文字と絵柄の画像を含む領域かという属性を判定することができる。

また、文字の画像を含む場合にはエッジと平面の画素が多く含まれ、絵柄の画像を含む場合は減る傾向にある。このため、請求項５の発明によれば、これらの割合に基づいて、文字や絵柄を正確に判定することができる。
また、絵柄の画像を含む場合には網点の画素が多く含まれる傾向にある。このため、請求項６の発明によれば、網点の画素の割合に基づいて、絵柄を正確に判定することができる。

また、文字の画像を含む領域か、絵柄の画像を含む領域か、文字と絵柄の画像を含む領域かにより、含まれる画素の階調値には統計的特徴が表れる。このため、請求項７の発明によれば、領域内の画素の階調値を対象として所定の統計的演算を行なうことにより、得られた統計値を利用して上記領域の属性を判定することができる。
また、領域が文字の画像を含む領域か、絵柄の画像を含む領域かにより、平均値の大きさが異なる。具体的には、文字属性の場合には平均値が高く、絵柄属性の場合には平均値が低くなる傾向にある。このため、請求項８の発明によれば、平均値より属性を正確に判定できる。

また、文字の画像を含む場合は上記レンジが広く上記平均値と上記中間値との差が大きく、絵柄の画像を含む場合は上記平均値と上記中間値との差が小さくなる傾向がある。このため、請求項９の発明によれば、これらを算出することで、属性を正確に判定することができる。
また、文字属性の場合は、平均値より最頻値が大きい傾向があるため、請求項１０の発明によれば、平均値と最頻値とから、属性を正確に判定することができる。

また、各種の判定を並行する中で、一つの領域について文字属性と絵柄属性と判定する要素が強くある場合もあるし、逆に、文字属性でも絵柄属性でもないと要素が強くある場合もある。従って、請求項１１の発明によれば、このような場合にはいずれか一方と決めつけるのではなく、文字と図柄をともに含むと判定することで、属性を正確に判定することができる。

また、領域に含まれる画像の種類により、階調値ごとの度数分布状況、特にピーク形状の分布状況に特徴が見られ、請求項１２の発明によれば、その分布状況を判定することで領域の属性を判定でき、属性に応じた適切な階調変換を実現できる。

ノイズ成分除去処理のフローチャートである。矩形領域の検出を説明する図である。２５６階調のヒストグラムを３２階調に変換する説明図である。３２階調のヒストグラムの隣り合う階調の差分を求める説明図である。差分がプラスの値からマイナスの値に変わる部分をピークの候補とする説明図である。ピークの候補の尖度を考慮してピークを検出する説明図である。ピーク評価のフローチャートである。一文字が一つの矩形領域として検出された場合のヒストグラムとピークの評価値を示す図である。均一濃度の背景上の文字がまとめて矩形領域として検出された場合のヒストグラムとピークの評価値を示す図である。絵柄が矩形領域として検出された場合のヒストグラムとピークの評価値を示す図である。グラフのような文字絵柄の代表サンプルが矩形領域として検出された場合のヒストグラムとピークの評価値を示す図である。エッジと平面の割合と評価値の算出を説明する図である。画素情報評価のフローチャートである。一文字が一つの矩形領域として検出された場合のエッジ、平面、網点検出結果と、その割合と、評価値の算出を示す図である。均一濃度の背景上の文字がまとめて矩形領域として検出された場合のエッジ、平面、網点検出結果と、その割合と、評価値の算出を示す図である。絵柄が矩形領域として検出された場合のエッジ、平面、網点検出結果と、その割合と、評価値の算出を示す図である。グラフのような文字絵柄の代表サンプルが矩形領域として検出された場合のエッジ、平面、網点検出結果と、その割合と、評価値の算出を示す図である。代表値評価のフローチャートである。一文字が一つの矩形領域として検出された場合のヒストグラムと、代表値と、評価値の算出を示す図である。均一濃度の背景上の文字がまとめて矩形領域として検出された場合のヒストグラムと、代表値と、評価値の算出を示す図である。絵柄が矩形領域として検出された場合のヒストグラムと、代表値と、評価値の算出を示す図である。グラフのような文字絵柄の代表サンプルが矩形領域として検出された場合のヒストグラムと、代表値と、評価値の算出を示す図である。属性判定のフローチャートである。画像サンプルと、評価値と、属性判定結果を示す図である。各画像サンプルの二値化処理後の画像を示す図である。

以下、図面を参照しながら、本発明の実施の形態について、詳細に説明する。
図１は、ノイズ成分除去処理のフローチャートである。
同図は、矩形領域の検出（Ｓ１）、ヒストグラムのピーク評価（Ｓ２）、画素情報評価（Ｓ３）、ヒストグラムの代表値評価（Ｓ４）、属性判定（Ｓ５）、二値化（Ｓ６）の各処理を示している。

次に、これらについて説明する。
矩形領域の検出（Ｓ１）は、画像データの中で文字や絵柄が含まれている領域を検出する処理である。ヒストグラムのピーク評価（Ｓ２）は、矩形領域内の画素についてその階調値のヒストグラムを作成し、表れるピークについての評価値を算出する処理である。画素情報評価（Ｓ３）は、矩形領域内のエッジ、網点、平面画素を検出し、それぞれの画素数が全画素数に占める割合を求める処理である。
ヒストグラムの代表値評価（Ｓ４）は、矩形領域に含まれる画素についての階調値のヒストグラムを利用し、統計処理を行った所定の統計値を求め、さらに同統計値を利用して代表値を算出する処理である。属性判定（Ｓ５）は、各評価の結果を利用して矩形領域の属性（文字、絵柄、文字絵柄）を判定する処理である。二値化（Ｓ６）は、矩形領域の属性に応じた手法で二値化の閾値を算出し、同閾値を利用して画像データを二値化する処理である。

次に、これらの関係について説明する。
矩形領域の検出（Ｓ１）にて画像データの中で文字を含む矩形領域を検出したら、ピーク評価（Ｓ２）にてヒストグラムを作成しつつピーク形状に基づく評価をする。ヒストグラムのピーク評価（Ｓ２）にてヒストグラムのピーク評価を行ったら、画素情報評価（Ｓ３）にて画素がエッジか、平面か、網点かに基づく評価を行う。画素情報評価（Ｓ３）にて画素の情報の評価を行ったら、ヒストグラムの代表値評価（Ｓ４）にてヒストグラムに基づく統計値を利用して所定の代表値を算出する。ヒストグラムの代表値評価（Ｓ４）にて代表値の評価を終了したら、属性判定（Ｓ５）では各評価に基づいて矩形領域の属性を判定する。属性判定（Ｓ５）で属性を求めたら、二値化（Ｓ６）にて同属性に対応する手法で閾値を求めつつ二値化処理を行う。

本実施例の原理は、入力画像の文字や絵柄部分を矩形領域として検出し、検出した矩形領域内の輝度分布の最高ピークの度数、ピーク数、代表値、及び矩形領域内のエッジ、網点、平面画素の割合等の複数の情報から、矩形領域の属性（文字・文字絵柄・絵柄）を判定する。図１に示すフローチャートに従って処理を進めることにより、かかる原理に則って二値化を行うことができる。
なお、本発明は、文字認識のための前処理という位置づけにある。例えば、文字を印刷した書類などをスキャナーなどで多値画像で読み込んだり、風景の中に文字が含まれる写真の画像データなどを処理対象とする。入力が直にスキャナーやデジタルスチルカメラなどである必要はなく、他の機器で取得された画像データを通信によって取得する場合でも全く同様である。文字認識には、いわゆる文字だけでなく、記号等の認識も当然に含まれる。

このような文字認識では処理対象とする画像データが文字部分と背景とに明確に分離されているほど認識効率が良いため、文字以外の成分をノイズ成分として除去する本発明の階調低減処理（二値化処理）が利用される。
以下、各処理の詳細について説明する。
図２は、矩形領域の検出（Ｓ１）を説明する図であり、矩形領域の検出を行った場合の模式図を示している。

同図は上下二段に図を並べており、上段には左右に図を二つ並べて示している。上段左方が多値の入力画像のイメージを示しており、まず、一定の閾値で単純二値化する。二値化後のイメージを上段右方に示している。さらに、この二値化後の画像データを処理対象として輪郭追跡し、概説矩形を取得すると、下段に示すイメージの矩形領域を設定できる。
矩形領域の検出（Ｓ１）としては、ある一定の閾値で二値化した画像またはエッジ画像(エッジとそれ以外の画素とを二値で示した画像)についてラベリングまたは輪郭追跡を行うことにより検出された領域の外接矩形を設定する方法が知られている。

ここでの二値化の閾値については、画像全体のヒストグラムのピークを背景領域の濃度分布と考え、そのピークに一番近い谷を領域分離の二値化閾値として用いている。また、先にエッジ画素を検出してその結果をエッジ画像とし、このエッジ画像について輪郭追跡を行なって外接矩形領域を検出して各矩形領域を設定することもできる。

次に、ヒストグラムのピーク評価（Ｓ２）を説明する。このヒストグラムのピーク評価は、ピークの検出、およびピークの評価という二段階の処理で行う。
・ピークの検出方法
まず、矩形領域内のヒストグラムからピークを検出する。ピーク検出は、同様の目的の処理が多く存在しているが、本実施例では以下の方法を用いている。
I 矩形領域内のヒストグラムを３２階調で作成する。ここで、ヒストグラムを３２階調とする目的は２５６階調でヒストグラムを作成した場合に発生するイレギュラーな階調の影響を軽減するためである。

図３は、２５６階調のヒストグラムを３２階調に変換する説明図である。
本図は、上段と下段とに別れており、上段の図は２５６階調のそれぞれについての度数を求めたヒストグラムであり、下段の図は３２階調に階調数を落として度数を求めたヒストグラムである。
同図に示すように、元の階調数のままでヒストグラムを作成すると、大きなピークが二つあるだけでなく、それぞれの山の斜面には細かなピークが多数存在する。このため、このままではピークの数を正確に判定できない。
しかし、下段に示すように階調数を落とすことで、山の斜面に生じていた細かなピークは解消され、大きな二つの山を判定しやすくなる。

II I で作成した３２階調のヒストグラムの隣り合う階調の度数の差分を求める。
図４は、３２階調のヒストグラムの隣り合う階調の差分を求める説明図である。
本図は、上段と下段とに別れており、上段には３２階調としたヒストグラムを示しており、下段には隣り合う階調の度数の差分を求めて図示している。
同図に示すように、ピークを境にして左の斜面では差分がプラスであったものが、右の斜面では差分がマイナスとなっている。

III IIで求めた隣り合う階調での差分を階調の低い側から走査し、差分がプラスの値からマイナスの値に変わる部分を検索し、ピークの候補とする。
図５は、差分がプラスの値からマイナスの値に変わる部分をピークの候補とする説明図である。
本図は、上段と下段とに別れており、上段に３２階調としたときの隣り合う階調での度数の差分を示しており、下段にヒストグラムを示している。
同図に示すように、差分の極性が変化する点がピークに該当しているので、この極性の変化点をピークの候補とする。

IV III で求めたピークの候補のそれぞれについて、尖度（とがり具合）を考慮してピークを検出する。
ここで尖度を考慮したピークの判定のための演算式を示す。
階調xをピーク候補とした場合、fmax：最頻値、Sfmax：基準最頻値、Sheight：基準高さ、とすると、

f(x-2)≦ f(x)×a、かつ f(x+2) ≦ f(x)×a
となる条件を満足する場合において、さらに、
f(x)-｛ f(x-2) + f(x+2) ｝/2 ≧ (fmax/Sfmax)×Sheight
が成立するか否かを判定する。そして、成立する場合に、ピーク候補f(ｘ)をピークとして見なす。
図６は、このようにしてピークの候補の尖度を考慮してピークを検出する説明図である。

次に、ピークの評価について説明する。
ピーク評価では、ピーク検出にて検出されたピーク数と、最高ピークの度数について評価を行う。
具体的には、以下のような条件を用いて「評価値：Ｅｖ」を増減させる。
・ピーク数
ピーク数＝０ならば、評価値：Ｅｖ−３
ピーク数＝１〜３ならば、評価値：Ｅｖ＋１
ピーク数≧４ならば矩形領域の属性は「文字絵柄」（※この条件に当てはまる場合は以降の評価は行わない。）

・最高ピークの度数
最高ピークの度数＜２.５［％］ならば、評価値：Ｅｖ−５
最高ピークの度数＜４.０［％］ならば、評価値：Ｅｖ−１
最高ピークの度数≧４.０［％］ならば、評価値：Ｅｖ＋５
図２は、このような条件と評価値の算出をフローチャート化している。
なお、ピーク数の閾値、最高ピークの度数の閾値となるパーセンテージ、及びＥｖの増減幅は、経験的に定めた値である。従って、これらの値に限定されるのではなく、実際の環境下において最適となるような任意の数値を用いて良い。

図７は、以上の判定を実現するためのピーク評価のフローチャートである。
同図は、Ｅｖ＝０（Ｓ２１）、ピーク数（Ｓ２２）、Ｅｖ−３（Ｓ２３）、Ｅｖ＋１（Ｓ２４）、文字絵柄判定で二値化処理へ（Ｓ２５）、最高ピーク度数（Ｓ２６）、Ｅｖ−５（Ｓ２７）、Ｅｖ−１（Ｓ２８）、Ｅｖ＋５（Ｓ２９）、画素情報評価へ（Ｓ３０）の各処理を示している。

次に、これらについて説明する。
ピーク評価は、矩形領域内の画素についてその階調値のヒストグラムを作成し、表れるピークについての評価値を算出する（Ｓ２）処理である。Ｅｖ＝０（Ｓ２１）は、評価値Ｅｖの初期値として「０」を設定する処理である。ピーク数（Ｓ２２）は、ピーク数に基づいて処理を分岐させる処理である。Ｅｖ−３（Ｓ２３）は、評価値Ｅｖを「３」減らす処理である。Ｅｖ＋１（Ｓ２４）は、評価値Ｅｖを「１」増やす処理である。
文字絵柄判定で二値化処理へ（Ｓ２５）は、ピーク評価を終了して処理を二値化へ進める処理である。最高ピーク度数（Ｓ２６）は、最高ピーク度数に基づいて処理を分岐させる処理である。Ｅｖ−５（Ｓ２７）は、評価値Ｅｖを「５」減らす処理である。Ｅｖ−１（Ｓ２８）は、評価値Ｅｖを「１」減らす処理である。Ｅｖ＋５（Ｓ２９）は、評価値Ｅｖを「５」増やす処理である。画素情報評価へ（Ｓ３０）は、ピーク評価を終了して処理を画素情報評価へ進める処理である。

次に、これらの関係について説明する。
Ｅｖ＝０（Ｓ２１）にて評価値の初期値「０」を設定したら、ピーク数（Ｓ２２）ではピーク数に基づいて処理を分岐する。ピーク数（Ｓ２２）にてピーク数が「０」と判定されたら、Ｅｖ−３（Ｓ２３）では評価値を文字通り「３」減らす。ピーク数（Ｓ２２）にてピーク数が「１〜３」と判定されたら、Ｅｖ＋１（Ｓ２４）では評価値を文字通り「１」増やす。ピーク数（Ｓ２２）にてピーク数が「４以上」と判定されたら、属性を文字絵柄と判定し、二値化処理へ進む（Ｓ２５）。Ｅｖ−３（Ｓ２３）の処理を終えたら、最高ピーク度数（Ｓ２６）に基づく分岐処理へと進む。
Ｅｖ＋１（Ｓ２４）の処理を終えたら、最高ピーク度数（Ｓ２６）に基づく分岐処理へと進む。最高ピーク度数（Ｓ２６）にて最高ピーク度数が「２．５％未満」と判定されたら、Ｅｖ−５（Ｓ２７）では評価値を文字通り「５」減らす。最高ピーク度数（Ｓ２６）にて最高ピーク度数が「２．５〜４．０％未満」と判定されたら、Ｅｖ−１（Ｓ２８）では評価値を文字通り「１」減らす。最高ピーク度数（Ｓ２６）にて最高ピーク度数が「４．０％以上」と判定されたら、Ｅｖ＋５（Ｓ２９）では評価値を文字通り「５」増やす。Ｅｖ−５（Ｓ２７）処理、Ｅｖ−１（Ｓ２８）処理、Ｅｖ＋５（Ｓ２９）処理を終えたら、ピーク評価を終了して画素情報評価へ（Ｓ３０）処理を進める。

本発明の各評価については、「評価値：Ｅｖ（初期値＝０）」の値をいつくかの条件に沿って増減させていき、最終的に「Ｅｖの値が高ければ文字属性」、「Ｅｖの値が低ければ絵柄属性」、「Ｅｖの値がその中間ならば文字絵柄属性」という方法により行う。従って、評価値を下げる処理は絵柄属性の特徴が見られ、絵柄属性を強めることに他ならない。また、評価値を上げる処理は文字属性の特徴が見られ、文字属性を強めることに他ならない。

画像サンプルを用いたピーク評価結果について
以下に、実際の画像では評価値がどのように増減しているかを例に挙げる。
なお、画像Ａ、Ｂは文字属性、Ｃは絵柄属性、Ｄは文字絵柄属性の代表サンプルとなっている。ちなみに、Ａは１文字がひとつの矩形領域として取られた場合、Ｂは均一濃度の背景上の文字がまとめて矩形領域と取られた場合のサンプルである。

図８〜図１１は左右二列に図を示しており、さらに左列は上下二段に図を示している。左列上段は画像サンプルを示しており、左列下段にはピーク数と最高ピーク度数をリスト表示している。右列には上方にヒストグラムを示しており、下方にピーク数と最高ピークの度数と最終的な評価値を示している。

図８の画像サンプルは１文字がひとつの矩形領域として検出された場合であり、図３〜図６に示す手順で求められたピーク数は、ヒストグラムからも明らかなように、「２」である。また、最高ピークの度数は、現実のヒストグラムから「５．５％」と算出されている。
これらの結果を図７に示すピーク評価に当てはめると、ピーク数は「２」であるから処理（Ｓ２２）の判断により処理（Ｓ２４）にてＥｖ＋１となり、最高ピーク度数が「５．５％」であるから処理（Ｓ２６）の判断により処理（Ｓ２９）にてＥｖ＋５となり、最終的に評価値Ｅｖは「６」と評価される。

図９の画像サンプルは均一濃度の背景上の文字がまとめて一つの矩形領域として検出された場合であり、図３〜図６に示す手順で求められたピーク数は「１」である。また、最高ピークの度数は、現実のヒストグラムから「１１．８％」と算出されている。
これらの結果を図７に示すピーク評価に当てはめると、ピーク数は「１」であるから処理（Ｓ２２）の判断により処理（Ｓ２４）にてＥｖ＋１となり、最高ピーク度数が「１１．８％」であるから処理（Ｓ２６）の判断により処理（Ｓ２９）にてＥｖ＋５となり、最終的に評価値Ｅｖは「６」と評価される。

図１０の画像サンプルは絵柄が一つの矩形領域として検出された場合であり、図３〜図６に示す手順で求められたピーク数は「０」である。また、最高ピークの度数は、現実のヒストグラムから「２．０７％」と算出されている。
これらの結果を図７に示すピーク評価に当てはめると、ピーク数は「０」であるから処理（Ｓ２２）の判断により処理（Ｓ２３）にてＥｖ−３となり、最高ピーク度数が「２．０７％」であるから処理（２６）の判断により処理（Ｓ２７）にてＥｖ−５となり、最終的に評価値Ｅｖは「−９」と評価される。

図１１の画像サンプルは文字絵柄属性の画像が矩形領域として検出された場合であり、図３〜図６に示す手順で求められたピーク数は「５」である。また、最高ピークの度数は、現実のヒストグラムから「４．２９％」と算出されている。
これらの結果を図７に示すピーク評価に当てはめると、ピーク数は「５」であるから処理（Ｓ２２）の判断により処理（Ｓ２５）にて文字絵柄判定とされ、二値化処理へ進む。そして、以降の評価は行わない。

次に、画素情報評価（Ｓ３）について説明する。
矩形領域内のエッジ・網点・平面画素それぞれを検出する。同様の目的の処理が多く存在しているため、方法を限定する必要は無いが、本実施例では以下の方法を用いている。すなわち、注目画素を中心とする周辺の数画素分の正方形の領域内の画素の階調値について分散値を求め、この分散値と、所定の閾値および網点閾値との大小関係を判定する。なお、「それ以外」とあるのは、「それ以外でさらに以下の条件を満足するとき」という意味である。

具体的な検出条件は以下のようにしている。
−−ここから−−
・注目画素の周辺７×７の分散値＜網点閾値のとき
注目画素＝平面画素とする
・エッジ閾値≦注目画素の周辺７×７の分散値のとき
注目画素＝エッジ画素とする
・それ以外
・・注目画素の周辺５×５の分散値＜網点閾値のとき
注目画素＝平面画素とする
・・エッジ閾値≦注目画素の周辺５×５の分散値のとき
注目画素＝エッジ画素とする
・・それ以外
・・・注目画素の周辺３×３の分散値＜網点閾値のとき
注目画素＝平面画素とする
・・・エッジ閾値≦注目画素の周辺３×３の分散値のとき
注目画素＝エッジ画素とする
・・・それ以外
注目画素＝網点画素とする
−−ここまで−−

なお、エッジ閾値、網点閾値は経験的に決めた値である。従って、これらの値に限定されるのではなく、実際の環境下において最適となるような任意の数値を用いて良い。ただし、大小関係は、網点閾値＜エッジ閾値を満たす必要がある。

次に、上の説明の方法あるいは、同様の他の任意の方法で検出されたエッジ・網点・平面画素が全画素数に占める割合を利用して、図１２に示す表のいずれの条件に該当するかを判定することで評価を行ない、引き続き「評価値：Ｅｖ」の値を増減させる。
まず、エッジ画素と平面画素と判定される画素数の割合に基づいて判定および評価値の算出を行う。

平面の割合が低（５０%未満）の場合で、エッジの割合が５%未満ならＥｖ−１、エッジの割合が５〜１０%未満ならＥｖ＋１、エッジの割合が１０%以上ならＥｖ＋３とする。
平面の割合が中（５０〜８０%未満）の場合で、エッジの割合が５%未満ならＥｖ±０、エッジの割合が５〜１０%未満ならＥｖ＋２、エッジの割合が１０%以上ならＥｖ＋５とする。
平面の割合が高（８０%以上）の場合で、エッジの割合が５%未満ならＥｖ＋１、エッジの割合が５〜１０%未満ならＥｖ＋３、エッジの割合が１０%以上ならＥｖ＋７とする。
また、網点の割合については、
網点の割合がほぼなし（１０%未満）ならば、Ｅｖ±０とする。
網点の割合が低（１０〜３０%未満）ならば、Ｅｖ−１とする。
網点の割合が中（３０〜５０%未満）ならば、Ｅｖ−２とする。
網点の割合が高（５０%以上）ならば、Ｅｖ−３とする。

なお、エッジ・網点・平面の割合量を既定するパーセンテージ（低・中・高）、Ｅｖの増減幅は経験的に定めた値である。従って、これらの値に限定されるのではなく、実際の環境下において最適となるような任意の数値を用いて良い。また、ここではエッジ画素と平面画素の割合評価は３段階（９パターン）、網点の割合評価は４段階にしているが、さらに細かく段階を分けて評価を行っても良い。

図１３は、先の説明で示したエッジの割合と、平面の割合に基づく、評価値Ｅｖの算出、および網点の割合に基づく評価値の算出をフローチャート化して示している。
同図は、エッジの割合（Ｓ４１）、平面の割合（Ｓ４２）、Ｅｖ−１（Ｓ４３）、Ｅｖ±０（Ｓ４４）、Ｅｖ＋１（Ｓ４５）、平面の割合（Ｓ４６）、Ｅｖ＋１（Ｓ４７）、Ｅｖ＋２（Ｓ４８）、Ｅｖ＋３（Ｓ４９）、平面の割合（Ｓ５０）、Ｅｖ＋３（Ｓ５１）、Ｅｖ＋５（Ｓ５２）、Ｅｖ＋７（Ｓ５３）、網点の割合（Ｓ５４）、Ｅｖ±０（Ｓ５５）、Ｅｖ−１（Ｓ５６）、Ｅｖ−２（Ｓ５７）、Ｅｖ−３（Ｓ５８）、代表値評価へ（Ｓ５９）の各処理を示している。

次に、これらについて説明する。
画素情報評価は、矩形領域内のエッジ、網点、平面画素を検出し、それぞれの画素数が全画素数に占める割合を求める（Ｓ３）処理である。エッジの割合（Ｓ４１）は、エッジの割合に基づいて処理を分岐させる処理である。平面の割合（Ｓ４２）は、平面の割合に基づいて処理を分岐させる処理である。Ｅｖ−１（Ｓ４３）は、評価値Ｅｖを「１」減らす処理である。Ｅｖ±０（Ｓ４４）は、評価値Ｅｖをそのままとする処理である。Ｅｖ＋１（Ｓ４５）は、評価値Ｅｖを「１」増やす処理である。平面の割合（Ｓ４６）は、平面の割合に基づいて処理を分岐させる処理である。Ｅｖ＋１（Ｓ４７）は、評価値Ｅｖを「１」増やす処理である。Ｅｖ＋２（Ｓ４８）は、評価値Ｅｖを「２」増やす処理である。Ｅｖ＋３（Ｓ４９）は、評価値Ｅｖを「３」増やす処理である。

平面の割合（Ｓ５０）は、平面の割合に基づいて処理を分岐させる処理である。Ｅｖ＋３（Ｓ５１）は、評価値Ｅｖを「３」増やす処理である。Ｅｖ＋５（Ｓ５２）は、評価値Ｅｖを「５」増やす処理である。Ｅｖ＋７（Ｓ５３）は、評価値Ｅｖを「７」増やす処理である。網点の割合（Ｓ５４）は、網点の割合に基づいて処理を分岐させる処理である。Ｅｖ±０（Ｓ５５）は、評価値Ｅｖをそのままとする処理である。Ｅｖ−１（Ｓ５６）は、評価値Ｅｖを「１」減らす処理である。Ｅｖ−２（Ｓ５７）は、評価値Ｅｖを「２」減らす処理である。Ｅｖ−３（Ｓ５８）は、評価値Ｅｖを「３」減らす処理である。代表値評価へ（Ｓ５９）は、画素情報評価を終了して処理を代表値評価へ進める処理である。

次に、これらの関係について説明する。
エッジの割合（Ｓ４１）にてエッジの画素が全画素に占める割合が「５％未満」と判定されると、平面の割合（Ｓ４２）の処理へ進む。
平面の割合（Ｓ４２）にて平面の画素が全画素に占める割合が「５０％未満」と判定されると、Ｅｖ−１（Ｓ４３）にて評価値を文字通り「１」減らす。平面の割合（Ｓ４２）にて平面の画素が全画素に占める割合が「５０〜８０％未満」と判定されると、Ｅｖ±０（Ｓ４４）にて評価値をそのままとする。平面の割合（Ｓ４２）にて平面の画素が全画素に占める割合が「８０％以上」と判定されると、Ｅｖ＋１（Ｓ４５）にて評価値を文字通り「１」増やす。Ｅｖ−１（Ｓ４３）の処理、Ｅｖ±０（Ｓ４４）の処理、Ｅｖ＋１（Ｓ４５）の処理を終えたら、網点の割合（Ｓ５４）へと処理を進める。

エッジの割合（Ｓ４１）にてエッジの画素が全画素に占める割合が「５〜１０％未満」と判定されると、平面の割合（Ｓ４６）の処理へ進む。平面の割合（Ｓ４６）にて平面の画素が全画素に占める割合が「５０％未満」と判定されると、Ｅｖ＋１（Ｓ４７）にて評価値を文字通り「１」増やす。平面の割合（Ｓ４６）にて平面の画素が全画素に占める割合が「５０〜８０％未満」と判定されると、Ｅｖ＋２（Ｓ４８）にて評価値を文字通り「２」増やす。平面の割合（Ｓ４６）にて平面の画素が全画素に占める割合が「８０％以上」と判定されると、Ｅｖ＋３（Ｓ４９）にて評価値を文字通り「３」増やす。Ｅｖ＋１（Ｓ４７）の処理、Ｅｖ＋２（Ｓ４８）の処理、Ｅｖ＋３（Ｓ４９）の処理を終えたら、網点の割合（Ｓ５４）へと処理を進める。

エッジの割合（Ｓ４１）にてエッジの画素が全画素に占める割合が「１０％以上」と判定されると、平面の割合（Ｓ５０）の処理へ進む。平面の割合（Ｓ５０）にて平面の画素が全画素に占める割合が「５０％未満」と判定されると、Ｅｖ＋３（Ｓ５１）にて評価値を文字通り「３」増やす。平面の割合（Ｓ５０）にて平面の画素が全画素に占める割合が「５０〜８０％未満」と判定されると、Ｅｖ＋５（Ｓ５２）にて評価値を文字通り「５」増やす。平面の割合（Ｓ５０）にて平面の画素が全画素に占める割合が「８０％以上」と判定されると、Ｅｖ＋７（Ｓ５３）にて評価値を文字通り「７」増やす。Ｅｖ＋３（Ｓ５１）の処理、Ｅｖ＋５（Ｓ５２）の処理、Ｅｖ＋７（Ｓ５３）の処理を終えたら、網点の割合（Ｓ５４）へと処理を進める。

網点の割合（Ｓ５４）にて網点の画素が全画素に占める割合が「１０％未満」と判定されると、Ｅｖ±０（Ｓ５５）にて評価値をそのままとする。網点の割合（Ｓ５４）にて網点の画素が全画素に占める割合が「１０％未満」と判定されると、Ｅｖ−１（Ｓ５６）にて評価値を文字通り「１」減らす。網点の割合（Ｓ５４）にて網点の画素が全画素に占める割合が「１０％未満」と判定されると、Ｅｖ−２（Ｓ５７）にて評価値を文字通り「２」減らす。網点の割合（Ｓ５４）にて網点の画素が全画素に占める割合が「１０％未満」と判定されると、Ｅｖ−３（Ｓ５８）にて評価値を文字通り「３」減らす。Ｅｖ±０（Ｓ５５）の処理、Ｅｖ−１（Ｓ５６）の処理、Ｅｖ−２（Ｓ５７）の処理、Ｅｖ−３（Ｓ５８）の処理を終えたら、画素情報評価を終了して代表値評価へと処理を進める（Ｓ５９）

図１４〜図１７は、各画像サンプルに対する画素情報評価の結果を示している。各図は上下二段、左右二列に区画されており、上段左列には画像サンプルを示し、上段右列にはエッジ、平面、網点の検出結果について、黒画素で各成分を示している。また、下段左列には矩形内全画素数と、エッジ画素割合と、平面画素割合と、網点画素割合の各値をリスト表示し、下段右列には評価の過程と最終的な評価値を示している。

図１４は、一文字が一つの矩形領域として検出された場合のエッジ、平面、網点検出結果と、その割合と、評価値の算出を示す図である。
同図に示す画像サンプルでは、矩形内全画素数が「５４７８０」、エッジ画素割合が「１２．３％」、平面画素割合が「８０．４％」、網点画素割合が「７．４％」と算出された。各値は図１３に示すフローチャートに従って処理されると、処理（Ｓ４１）でエッジの割合：高と判断され、さらに処理（Ｓ５０）で平面の割合と判断され、処理（Ｓ５３）にて評価値はＥｖ＋７とされる。つづいて、処理（Ｓ５４）では網点割合：ほぼなしと判断され、処理（Ｓ５５）にて評価値はＥｖ±０とされる。この結果、最終的な評価値はＥｖ＝７となる。

図１５は、均一濃度の背景上の文字がまとめて矩形領域として検出された場合のエッジ、平面、網点検出結果と、その割合と、評価値の算出を示す図である。
同図に示す画像サンプルでは、矩形内全画素数が「１８８５０５」、エッジ画素割合が「６．０％」、平面画素割合が「８８．６％」、網点画素割合が「５．４％」と算出された。各値は図１３に示すフローチャートに従って処理されると、処理（Ｓ４１）でエッジの割合：中と判断され、さらに処理（Ｓ４６）で平面の割合と判断され、処理（Ｓ４９）にて評価値はＥｖ＋３とされる。つづいて、処理（Ｓ５４）では網点割合：ほぼなしと判断され、処理（Ｓ５５）にて評価値はＥｖ±０とされる。この結果、最終的な評価値はＥｖ＝３となる。

図１６は、絵柄が矩形領域として検出された場合のエッジ、平面、網点検出結果と、その割合と、評価値の算出を示す図である。
同図に示す画像サンプルでは、矩形内全画素数が「５６５１５０」、エッジ画素割合が「３．８％」、平面画素割合が「２１．０％」、網点画素割合が「７５．２％」と算出された。各値は図１３に示すフローチャートに従って処理されると、処理（Ｓ４１）でエッジの割合：低と判断され、さらに処理（Ｓ４２）で平面の割合と判断され、処理（Ｓ４３）にて評価値はＥｖ−１とされる。つづいて、処理（Ｓ５４）では網点割合：高と判断され、処理（Ｓ５８）にて評価値はＥｖ−３とされる。この結果、最終的な評価値はＥｖ＝−４となる。

図１７は、グラフのような文字絵柄の代表サンプルが矩形領域として検出された場合のエッジ、平面、網点検出結果と、その割合と、評価値の算出を示す図である。
同図に示す画像サンプルでは、矩形内全画素数が「１９５９１０」、エッジ画素割合が「７．０％」、平面画素割合が「８６．０％」、網点画素割合が「７．１％」と算出される。しかし、ピーク評価で文字絵柄と判定されているため、本評価は実行されない。

次に、ヒストグラム代表値評価（Ｓ４）について説明する。
ここでは、ヒストグラムの代表値を下記条件に沿って評価し、引き続き「評価値：Ｅｖ」の値を増減させる。これらの評価の前提として、平均値と、レンジと、中間値と、最頻値との各統計値を演算で求める。また、平均値と中間値との差、および平均値と最頻値との大小関係についても求めておく。

・平均値評価
平均値≧１２０ならば、Ｅｖ＋１とする。
平均値＜１００ならば、Ｅｖ−１とする。
・レンジ評価
レンジ≧１８０、かつ、｜平均値−中央値｜≧４０ならば、Ｅｖ＋５とする。
・｜平均値−中央値｜
｜平均値−中央値｜＜３ならば、Ｅｖ−２とする。
・文字らしさ評価として
平均値＜最頻値ならば、Ｅｖ＋１とする。

なお、各閾値、Ｅｖの増減幅は経験的に定めた値である。従って、これらの値に限定されるのではなく、実際の環境下において最適となるような任意の数値を用いて良い。
図１８は、このような評価をフローチャートにより表している。
同図は、平均値（Ｓ６１）、Ｅｖ−１（Ｓ６２）、Ｅｖ＋１（Ｓ６３）、レンジ（Ｓ６４）、｜平均値−中間値｜（Ｓ６５）、Ｅｖ＋５（Ｓ６６）、｜平均値−中間値｜（Ｓ６７）、Ｅｖ−２（Ｓ６８）、平均値＜最頻値（Ｓ６９）、Ｅｖ＋１（Ｓ７０）、属性判定処理へ（Ｓ７１）の各処理を示している。

次に、これらについて説明する。
代表値評価は、矩形領域に含まれる画素についての階調値のヒストグラムを利用し、統計処理を行った所定の統計値を求め、さらに同統計値を利用して代表値を算出する処理である。平均値（Ｓ６１）は、平均値に基づいて処理を分岐させる処理である。Ｅｖ−１（Ｓ６２）は、評価値Ｅｖを「１」減らす処理である。Ｅｖ＋１（Ｓ６３）は、評価値Ｅｖを「１」増やす処理である。レンジ（Ｓ６４）は、レンジに基づいて処理を分岐させる処理である。

｜平均値−中間値｜（Ｓ６５）は、平均値と中間値との差に基づいて処理を分岐させる処理である。Ｅｖ＋５（Ｓ６６）は、評価値Ｅｖを「５」増やす処理である。｜平均値−中間値｜（Ｓ６７）は、平均値と中間値との差に基づいて処理を分岐させる処理である。Ｅｖ−２（Ｓ６８）は、評価値Ｅｖを「２」減らす処理である。平均値＜最頻値（Ｓ６９）は、平均値が最頻値未満であるか否かに基づいて処理を分岐させる処理である。Ｅｖ＋１（Ｓ７０）は、評価値Ｅｖを「１」減らす処理である。属性判定処理へ（Ｓ７１）は、代表値評価を終了して処理を属性判定処理へ進める処理である。

次に、これらの関係について説明する。
平均値（Ｓ６１）にて平均値が「１００未満」と判定されると、Ｅｖ−１（Ｓ６２）にて評価値を文字通り「１」減らす。平均値（Ｓ６１）にて平均値が「１２０以上」と判定されると、Ｅｖ＋１（Ｓ６３）にて評価値を文字通り「１」増やす。平均値（Ｓ６１）にて平均値が「１００〜１１９」と判定されると、評価値をそのままにしてレンジ（Ｓ６４）の処理へ進む。Ｅｖ−１（Ｓ６２）の処理、Ｅｖ＋１（Ｓ６３）の処理を終えたら、レンジ（Ｓ６４）の分岐へと処理を進める。

レンジ（Ｓ６４）にてヒストグラムのレンジが「１８０以上」と判定されると、｜平均値−中間値｜（Ｓ６５）における平均値と中間値との差に基づく分岐へと処理を進める。｜平均値−中間値｜（Ｓ６５）にて平均値と中間値との差が「４０以上」と判定されると、Ｅｖ＋５（Ｓ６６）にて評価値を文字通り「５」増やす。レンジ（Ｓ６４）にてヒストグラムのレンジが１８０未満と判定されるか、｜平均値−中間値｜（Ｓ６５）にて平均値と中間値との差が「４０未満」と判定されるか、Ｅｖ＋５（Ｓ６６）の処理を終えたら、｜平均値−中間値｜（Ｓ６７）における平均値と中間値との差に基づく分岐へと処理を進める。

｜平均値−中間値｜（Ｓ６７）にて平均値と中間値との差が「３未満」と判定されると、Ｅｖ−２（Ｓ６８）にて評価値を文字通り「２」減らす。｜平均値−中間値｜（Ｓ６７）にて平均値と中間値との差が「３以上」と判定されるか、Ｅｖ−２（Ｓ６８）の処理を終えたら、平均値＜最頻値（Ｓ６９）における平均値と最頻値との比較に基づく分岐へと処理を進める。平均値＜最頻値（Ｓ６９）にて平均値が最頻値より小さいと判定されると、Ｅｖ＋１（Ｓ７０）にて評価値を文字通り「１」増やす。平均値＜最頻値（Ｓ６９）にて平均値が最頻値より小さくないと判定されるか、Ｅｖ＋１（Ｓ７０）の処理を終えたら、代表値評価を終了して属性判定処理へと進む（Ｓ７１）

図１９〜図２２は、画像サンプルを用いた代表値評価結果を示している。各図では、左右二列に図を示しており、さらに左列は上下二段に図を示している。左列上段は画像サンプルを示しており、左列下段には平均値と最頻値と中央値とレンジとリスト表示している。右列には上方にヒストグラムを示しており、下方に平均値による評価と、レンジによる評価と、文字らしさによる評価と、最終的な評価値を示している。なお、中間値と中央値とは同義とする。

図１９は、一文字が一つの矩形領域として検出された場合のヒストグラムと、代表値と、評価値の算出を示す図である。
同図に示す画像サンプルでは、平均値が「１４９」、最頻値が「２３７」、中央値が「２２４」、レンジが「２０７」と算出された。各値は図１８に示すフローチャートに従って処理されると、処理（Ｓ６１）で平均値は１２０以上と判断されて処理（Ｓ６３）にて評価値はＥｖ＋１とされる。続いて、処理（Ｓ６４）でレンジは１８０以上と判断され、さらに処理（Ｓ６５）で平均値と中間値との差が４０以上と判断されて処理（Ｓ６６）にて評価値はＥｖ＋５とされる。
続いて、処理（Ｓ６７）で平均値と中間値との差が３以上と判断され、評価値はそのままで、処理（Ｓ６９）の文字らしさ評価で平均値は最頻値よりも小さいと判断され、処理（Ｓ７０）にてＥｖ＋１とされる。この結果、最終的な評価値はＥｖ＝７となる。

図２０は、均一濃度の背景上の文字がまとめて矩形領域として検出された場合のヒストグラムと、代表値と、評価値の算出を示す図である。
同図に示す画像サンプルでは、平均値が「１７３」、最頻値が「１７８」、中央値が「１７８」、レンジが「１２７」と算出された。各値は図１８に示すフローチャートに従って処理されると、処理（Ｓ６１）で平均値は１２０以上と判断されて処理（Ｓ６３）にて評価値はＥｖ＋１とされる。続いて、処理（Ｓ６４）でレンジは１８０未満と判断されるので評価値はそのままとされる。
続いて、処理（Ｓ６７）で平均値と中間値との差が３以上と判断され、評価値はそのままで、処理（Ｓ６９）で平均値は最頻値よりも小さいと判断され、処理（Ｓ７０）にてＥｖ＋１とされる。この結果、最終的な評価値はＥｖ＝２となる。

図２１は、絵柄が矩形領域として検出された場合のヒストグラムと、代表値と、評価値の算出を示す図である。
同図に示す画像サンプルでは、平均値が「９２」、最頻値が「９０」、中央値が「９３」、レンジが「９２」と算出された。各値は図１８に示すフローチャートに従って処理されると、処理（Ｓ６１）で平均値は１００未満と判断されて処理（Ｓ６２）にて評価値はＥｖ−１とされる。続いて、処理（Ｓ６４）でレンジは１８０未満と判断されるので評価値はそのままとされ、続いて、処理（Ｓ６７）で平均値と中間値との差が３未満と判断され、処理（Ｓ６８）にて評価値はＥｖ−２とされる。
最後に、処理（Ｓ６９）で平均値は最頻値よりも小さくないと判断され、評価値はそのままとされる。この結果、最終的な評価値はＥｖ＝３となる。

図２２は、グラフのような文字絵柄の代表サンプルが矩形領域として検出された場合のヒストグラムと、代表値と、評価値の算出を示す図である。
同図に示す画像サンプルでは、平均値が「１０７」、最頻値が「４９」、中央値が「７８」、レンジが「１８８」と算出された。しかし、既にピーク評価で属性は文字絵柄と判定されているので、図１８に示す代表値評価は行われない。

次に、属性判定（Ｓ５）について説明する。
以上の各評価を行った後、評価値：Ｅｖの合計値を求め、同合計値を参照して矩形領域の属性判定を下記のように行う。
Ｅｖ＝高（５以上）ならば、文字属性とする。
Ｅｖ＝中（１〜４）ならば、文字絵柄属性とする。
Ｅｖ＝低（０以下）ならば、絵柄属性とする。
なお、Ｅｖの閾値は経験的に定めた値である。従って、これらの値に限定されるのではなく、実際の環境下において最適となるような任意の数値を用いて良い。

図２３は、かかる属性判定のフローチャートである。
同図は、評価値：Ｅｖ（Ｓ８１）、絵柄（Ｓ８２）、文字絵柄（Ｓ８３）、文字（Ｓ８４）、二値化処理へ（Ｓ８５）の各処理を示している。
次に、これらについて説明する。
属性判定は、各評価の結果を利用して矩形領域の属性（文字、絵柄、文字絵柄）を判定する処理である。評価値：Ｅｖ（Ｓ８１）は、評価値（Ｅｖ）の値に基づいて処理を分岐させる処理である。絵柄（Ｓ８２）は、属性を絵柄属性とする処理である。文字絵柄（Ｓ８３）は、属性を文字絵柄属性とする処理である。文字（Ｓ８４）は、属性を文字属性とする処理である。二値化処理へ（Ｓ８５）は、属性判定を終了して処理を二値化処理へ進める処理である。

次に、これらの関係について説明する。
評価値：Ｅｖ（Ｓ８１）にて評価値が「０以下」と判定されると、絵柄（Ｓ８２）にて矩形領域の属性を絵柄とする処理を行う。評価値：Ｅｖ（Ｓ８１）にて評価値が「１〜４」と判定されると、文字絵柄（Ｓ８３）にて矩形領域の属性を文字絵柄とする処理を行う。評価値：Ｅｖ（Ｓ８１）にて評価値が「５以上」と判定されると、文字（Ｓ８４）にて矩形領域の属性を文字とする処理を行う。絵柄（Ｓ８２）の処理、文字絵柄（Ｓ８３）の処理、文字（Ｓ８４）の処理を終えたら、二値化処理へ処理を進める（Ｓ８５）
なお、特許請求の範囲に示す属性判定手段と属性判定工程は、広義に把握している。すなわち、これらにおいては、上述した画素情報評価（Ｓ３）や代表値評価（Ｓ４）を含めるものとして把握しており、本属性判定（Ｓ５）単独を意味するものではない。しかし、適用の態様に依存して、広義に理解すべき場合と、狭義（Ｓ５）に理解すべき場合とを含んでいる。

画像サンプルを用いた最終判定結果（属性判定）
図２４は、図２３に示すフローチャートに従って属性判定した結果を示している。図において、各画像サンプル毎に、左列は上述した三つの評価におけるそれぞれの最終的な評価値を示しており、右列は画像サンプルを示している。

最上段の画像サンプル（画像Ａ）の場合、ピーク評価では、Ｅｖ＝６と判定され、画素情報評価では、Ｅｖ＝７と判定され、代表値評価では、Ｅｖ＝７と判定された。各評価値の合計値は２０となるから、処理（Ｓ８１）にて５以上と判断され、処理（Ｓ８４）にて属性を文字とする処理（文字属性）が行われた後、処理（Ｓ８５）にて二値化処理へ進む。

二段目の画像サンプル（画像Ｂ）の場合、ピーク評価では、Ｅｖ＝６と判定され、画素情報評価では、Ｅｖ＝３と判定され、代表値評価では、Ｅｖ＝２と判定された。各評価値の合計値は１１となるから、画像Ａの場合と同様、処理（Ｓ８１）にて５以上と判断され、処理（Ｓ８４）にて属性を文字とする処理（文字属性）が行われた後、処理（Ｓ８５）にて二値化処理へ進む。

三段目の画像サンプル（画像Ｃ）の場合、ピーク評価では、Ｅｖ＝−９と判定され、画素情報評価では、Ｅｖ＝−４と判定され、代表値評価では、Ｅｖ＝−３と判定された。各評価値の合計値は−１６となるから、処理（Ｓ８１）にて０以下と判断され、処理（Ｓ８２）にて属性を絵柄とする処理（絵柄属性）が行われた後、処理（Ｓ８５）にて二値化処理へ進む。

四段目の画像サンプル（画像Ｄ）の場合、ピーク評価で文字絵柄属性と判定されており、画素情報評価と代表値評価は判定されていない。この結果、属性判定を経ることなく、二値化処理へ進む。
最後に、二値化（Ｓ６）について説明する。
上記の属性判定結果を受けて、各領域について最適な処理を行う。本実施例では以下の方法を用いて、高品位な二値画像を得ている。
文字属性とされた領域については、単純二値による二値化を行う。
文字絵柄属性とされた領域については、ソーベルフィルタ等によるエッジ検出結果に加えて誤差拡散による二値化を行う。
絵柄属性とされた領域については、誤差拡散による二値化を行う。

図２５は、各画像サンプルの二値化処理後の画像を示す図である。
同図においては、紙面の上段の左方と右方に文字属性とされる矩形領域があり、これらについては単純二値による二値化が行われ、文字がハッキリと明確に表れている。
中段には絵柄属性とされる矩形領域があり、誤差拡散による二値化で絵柄らしさを残した二値化が行われている。
下段には文字絵柄属性とされる矩形領域があり、ソーベルフィルタ等によるエッジ検出結果に加えて誤差拡散による二値化により、グラフがハッキリと明確に表れている。

なお、本実施例では、二値化を行っているが、領域の属性に応じた最適な手法を用いて多階調の画像の階調数を落とす場合の一例にすぎない。従って、最終的な階調値が二値であることに限定されず、４階調であるなど、様々な階調数に落とし込む場合に適用可能である。すなわち、本発明における二値化とは広義の意味で階調変換を表している。

上述した評価を経て二値化を選択することにより、以下の効果が得られている。
背景のある文字領域や極めて大きな文字等といった条件においても、正確に文字属性であることを判別できる。
文字間スペースやエッジ情報による空間的特徴だけでなく、ヒストグラムのピークや代表値等の統計的特徴も用いるため、精度良く属性を判定することができる。
文字・絵柄だけでなく、文字絵柄属性の判定も設けているため、より細かい属性判定が可能となり、文字・絵柄のどちらの判定もつかない領域（主にグラフ等）に対しては中間的な処理を適用することができる。

応用・その他について
上述した実施例に加え低下の応用および変形も可能である。
・検出された矩形領域のサイズが極端に小さい場合は、１文字ごとに矩形が検出されていることが多いため、例えば、ある閾値サイズ以下の矩形は各評価を行わずに文字領域と判定する等の処理を加え、処理の効率化を図っても良い。
・場合によっては、「文字」「文字絵柄」「絵柄」のうちの１属性を削り、２属性のみの判定にしても良い。

上述した実施例について、その特徴を整理すると、以下のようになる。
１．入力画像の文字や絵柄部分を矩形領域として検出し、検出した矩形領域内の統計的特徴や空間的特徴を基に、各矩形領域の属性（文字・文字絵柄・絵柄）を判定している。

２. １において、矩形領域内のヒストグラムの最高ピークの度数及びピークの数を検出し、属性判定に用いている。
３. １において、矩形領域内のエッジ・網点・平面の画素を検出し、それぞれの矩形全体の画素数に対する割合を属性判定に用いている。
４. １において、矩形領域内のヒストグラムの代表値（平均値・中間値・レンジ・最頻値）を属性判定に用いている。

１〜４によれば、ヒストグラムのピークや代表値といった統計的特徴と、エッジ・網点・平面画素の割合といった空間的特徴を併せて評価することにより、精度良く属性判定を行うことが可能となる。
５. ２において、ヒストグラムの最高ピークの度数が高い場合は文字属性、低い場合は絵柄属性が強いと判断する。
文字領域は、均一濃度の背景（紙の下地）が領域内の大部分を占めることが多く、ヒストグラムのピークが高くなり易い。絵柄の場合は文字のような均一濃度の背景が少ないため、ヒストグラムのピークが低くなり易い。従って、この条件を用いることで属性判定がし易くなる。

６. ２において、ヒストグラムのピークが検出されなかった場合または少ない場合は絵柄属性、ピーク数が絵柄属性判定より多い場合は文字属性、ピーク数が文字属性判定より多い場合は文字絵柄属性が強いと判断する。
絵柄領域は全体的に滑らか階調を持つため、ピークが検出されなかったり、検出されたとしてもピーク数が少ない。文字領域は背景成分が１つの大きなピークとなり易いため、１つ以上はピークがある。また、多くのピークが検出された場合は、均一濃度の領域が多数存在しているということになり、グラフ等が考えられる。よって、そのときは文字と絵柄の両者の特徴を併せ持つ、文字絵柄属性と判断する。

７. ３において、エッジ及び平面の割合が高い場合は文字属性、低い場合は絵柄属性が強いと判断する。
文字領域は、背景（紙の下地）と文字との境にはっきりとした輝度差があり、かつ均一濃度の部分も多いため、エッジ及び平面の割合が高くなり易い。絵柄領域は、文字のようなはっきりとした輝度差が少なく均一濃度の部分も少ないため、エッジ及び平面の割合は低くなり易い。従って、この条件を用いることで属性判定がし易くなる。

８. ３において、網点の割合が高い場合は絵柄属性が強いと判断する。
絵柄領域は、文字領域に比べて網点の割合が高くなり易い。従って、この条件を用いることで属性判定がし易くなる。
９. ４において、ヒストグラムの平均値が高い場合は文字属性、低い場合は絵柄属性が強いと判断する。
文字領域は背景（紙の下地）成分が多いため、ヒストグラムの平均値が高くなり易い。絵柄領域は背景（紙の下地）が含まれにくいため、ヒストグラムの平均値が低くなり易い。従って、この条件を用いることで属性判定がし易くなる。

１０. ４において、ヒストグラムのレンジが広く平均値と中間値の差が大きい場合は文字属性、平均値と中間値の差が小さい場合は絵柄属性が強いと判断する。
ヒストグラムのレンジが広く平均値と中間値の差が大きい場合、つまりヒストグラム形状が正規分布から遠い場合は文字属性が強いと判断する。これは、文字領域は背景（紙の下地）と文字の輝度差が大きいため、ヒストグラムのレンジが広くなり易く、ヒストグラム形状は正規分布からは遠い、双峰型になり易いためである。また、それとは逆にヒストグラムの形状が正規分布に近い場合は絵柄属性が強いと判断する。従って、この条件を用いることで属性判定がし易くなる。

１１. ４において、ヒストグラムの平均値より最頻値が高い場合は文字属性が強いと判断する。
文字領域は、背景（紙の下地）部分が最頻値となり、それより暗い部分に文字成分が存在することが多く、平均値＜最頻値の場合が多い。従って、この条件を用いることで属性判定がし易くなる。
１２. １において、文字属性と絵柄属性の両者の特徴を併せ持つ場合、及び両者の特徴が強く表れない場合は、文字絵柄属性と判断する。

両者の特徴を併せ持った矩形領域や、はっきりと特徴が表れない矩形領域については文字絵柄属性と判定し、例えば二値化の際、濃淡情報を再現しつつエッジも鮮明にする等の処理を適用し、見栄えを良くすることが可能となっている。
このように、入力画像の文字や絵柄部分を矩形領域として検出し、検出した矩形領域内の輝度分布（以降、ヒストグラムと記す）の最高ピークの度数（矩形全体の画素数に対するヒストグラム中の最大画素数の割合）、ピーク数、代表値、及び矩形領域内のエッジ・網点・平面画素の割合等の複数の情報から、矩形領域の属性（文字・文字絵柄・絵柄）を判定する。

この発明による判定結果を用いることにより、領域ごとに最適な画像処理を適用することが可能になり、例えば、文字領域には単純二値処理、絵柄領域には中間調（誤差拡散等）処理、文字絵柄領域にはエッジ検出結果＋中間調処理等を適用することで、高品位な二値画像を得ることが可能になる。

次に、特許請求の範囲の記載と実施例の各構成部品との対応を示す。
特許請求の範囲に記載した処理対象設定手段は、矩形領域の検出（Ｓ１）によって構成されている。
特許請求の範囲に記載したピーク評価手段は、ヒストグラムのピーク評価（Ｓ２）によって構成されている。
特許請求の範囲に記載した属性判定手段は、画素情報評価（Ｓ３）と、ヒストグラムの代表値評価（Ｓ４）と、属性判定（Ｓ５）とによって構成されている。
特許請求の範囲に記載した階調変換手段は、二値化（Ｓ６）によって構成されている。

特許請求の範囲に記載した処理対象設定工程は、矩形領域の検出（Ｓ１）によって構成されている。
特許請求の範囲に記載したピーク評価工程は、ヒストグラムのピーク評価（Ｓ２）とによって構成されている。
特許請求の範囲に記載した属性判定工程は、画素情報評価（Ｓ３）と、ヒストグラムの代表値評価（Ｓ４）と、属性判定（Ｓ５）とによって構成されている。
特許請求の範囲に記載した階調変換工程は、二値化（Ｓ６）とによって構成されている。

なお、本発明はソフトウェアを利用して各構成手段を実現しているが、ハードウェア、例えばアナログ回路やデジタル回路で実現することもできるし、ＡＳＩＣのような論理的作用をなすＩＣなどで実現することも可能である。

なお、本発明は上記実施例に限られるものでないことは言うまでもない。当業者であれば言うまでもないことであるが、
・上記実施例の中で開示した相互に置換可能な部材および構成等を適宜その組み合わせを変更して適用すること
・上記実施例の中で開示されていないが、公知技術であって上記実施例の中で開示した部材および構成等と相互に置換可能な部材および構成等を適宜置換し、またその組み合わせを変更して適用すること
・上記実施例の中で開示されていないが、公知技術等に基づいて当業者が上記実施例の中で開示した部材および構成等の代用として想定し得る部材および構成等と適宜置換し、またその組み合わせを変更して適用すること
は本発明の一実施例として開示されるものである。

本発明は、、階調数低減方法に利用することができる。

Ｓ１…矩形領域の検出、Ｓ２…ヒストグラムのピーク評価、Ｓ３…画素情報評価、Ｓ４…ヒストグラムの代表値評価、Ｓ５…属性判定、Ｓ６…二値化、Ｓ２１…Ｅｖ＝０、Ｓ２２…ピーク数、Ｓ２３…Ｅｖ−３、Ｓ２４…Ｅｖ＋１、Ｓ２５…文字絵柄判定で二値化処理へ、Ｓ２６…最高ピーク度数、Ｓ２７…Ｅｖ−５、Ｓ２８…Ｅｖ−１、Ｓ２９…Ｅｖ＋５、Ｓ３０…画素情報評価へ、Ｓ４１…エッジの割合、Ｓ４２…平面の割合、Ｓ４３…Ｅｖ−１、Ｓ４４…Ｅｖ±０、Ｓ４５…Ｅｖ＋１、Ｓ４６…平面の割合、Ｓ４７…Ｅｖ＋１、Ｓ４８…Ｅｖ＋２、Ｓ４９…Ｅｖ＋３、Ｓ５０…平面の割合、Ｓ５１…Ｅｖ＋３、Ｓ５２…Ｅｖ＋５、Ｓ５３…Ｅｖ＋７、Ｓ５４…網点の割合、Ｓ５５…Ｅｖ±０、Ｓ５６…Ｅｖ−１、Ｓ５７…Ｅｖ−２、Ｓ５８…Ｅｖ−３、Ｓ５９…代表値評価へ、Ｓ６１…平均値、Ｓ６２…Ｅｖ−１、Ｓ６３…Ｅｖ＋１、Ｓ６４…レンジ、Ｓ６５…｜平均値−中間値｜、Ｓ６６…Ｅｖ＋５、Ｓ６７…｜平均値−中間値｜、Ｓ６８…Ｅｖ−２、Ｓ６９…平均値＜最頻値、Ｓ７０…Ｅｖ＋１、Ｓ７１…属性判定処理へ、Ｓ８１…評価値：Ｅｖ、Ｓ８２…絵柄、Ｓ８３…文字絵柄、Ｓ８４…文字、Ｓ８５…二値化処理へ

Claims

多数の画素からなる画像における多値の画像データを入力し、所定の手法で階調数を減少させる階調数低減装置において、
上記画像データにおける所定の領域を処理対象として設定する処理対象設定手段と、
上記領域の画像データを処理対象として所定の階調範囲毎の度数分布を求めるとともに、同度数分布の度数分布状況からピーク形状の分布状況を求めるピーク評価手段と、
求められたピーク形状の分布状況に基づいて上記領域に含まれる画像の種類である属性を判定する属性判定手段と、
判定された属性に対応づけられた手法で上記画像データの階調数を減らす階調変換手段とを具備することを特徴とする階調数低減装置。
上記ピーク評価手段は、上記ピーク形状の分布状況として最高ピークの度数を求め、
上記属性判定手段は、上記最高ピークの度数が高い場合は文字属性と判定し、低い場合は上記領域に絵柄が含まれるとする絵柄属性と判定することを特徴とする請求項１に記載の階調数低減装置。
上記ピーク評価手段は、上記ピーク形状の分布状況としてピーク形状の数を求める
上記属性判定手段は、上記ピーク形状の数が０または第一の所定値よりも小さい場合には絵柄属性と判定し、上記ピーク形状の数が上記第一の所定値よりも大きく第二の所定値よりも小さい場合には文字属性と判定し、上記ピーク形状の数が上記第二の所定値よりも大きい場合には上記領域に絵柄と文字の画像を含むとする文字絵柄属性と判定することを特徴とする請求項１または請求項２に記載の階調数低減装置。
上記属性判定手段は、上記領域内の画素を対象として、エッジと網点と平面の画素を検出し、検出された画素数と同領域全体の画素数との割合に基づいて、上記属性を判定することを特徴とする請求項１〜請求項３のいずれかに記載の階調数低減装置。
上記属性判定手段は、エッジと平面の割合が高い場合は文字属性と判定し、低い場合は絵柄属性と判定することを特徴とする請求項４に記載の階調数低減装置。
上記属性判定手段は、網点の割合が高い場合は絵柄属性と判定することを特徴とする請求項４または請求項５に記載の階調数低減装置。
上記属性判定手段は、上記領域内の画素の階調値を対象として、所定の統計的演算を行い、得られた統計値を利用して、上記属性を判定することを特徴とする請求項１〜請求項６のいずれかに記載の階調数低減装置。
上記属性判定手段は、上記統計値として、平均値を求め、同平均値が高い場合は文字属性と判定し、同平均値が低い場合は絵柄属性と判定することを特徴とする請求項７に記載の階調数低減装置。
上記属性判定手段は、上記統計値として、上記ヒストグラムのレンジと中間値とを求め、上記レンジが広く上記平均値と上記中間値との差が大きい場合には文字属性と判定し、上記平均値と上記中間値との差が小さい場合には絵柄属性と判定することを特徴とする請求項７または請求項８に記載の階調数低減装置。
上記属性判定手段は、上記統計値として、上記統計値として最頻値を求め、上記平均値より最頻値が大きい場合には文字属性と判定することを特徴とする請求項８または請求項９に記載の階調数低減装置。
上記属性判定手段は、一つの領域について文字属性と絵柄属性と判定する場合、および、一つの領域について文字属性でも絵柄属性でもないと判定する場合、文字絵柄属性と判定することを特徴とする請求項１ないし請求項１０に記載の階調数低減装置。
多数の画素からなる画像における多値の画像データを入力し、所定の手法で階調数を減少させる階調数低減方法において、
上記画像データにおける所定の領域を処理対象として設定する処理対象設定工程と、
上記領域の画像データを処理対象として所定の階調範囲毎の度数分布を求めるとともに、同度数分布の度数分布状況からピーク形状の分布状況を求めるピーク評価工程と、
求められたピーク形状の分布状況に基づいて上記領域に含まれる画像の種類である属性を判定する属性判定工程と、
判定された属性に対応づけられた手法で上記画像データの階調数を減らす階調変換工程とを具備することを特徴とする階調数低減方法。