(実施の形態1)
以下、本発明を実施の形態を示す図面に基づいて説明する。図1及び図2は実施の形態1の画像形成装置100の構成の一例を示すブロック図である。図1は読み込まれたカラー画像データをカラー画像出力装置2から出力する場合の信号処理を示し、図2は読み込まれたカラー画像データを送信装置3より送信する場合の信号処理を示している。以下の説明では、画像処理システムとしての画像形成装置100について説明する。
画像形成装置100は、カラーコピー機能及びカラースキャナ機能等を有するデジタル複合機である。画像形成装置100は、原稿からカラー画像を光学的に読み取る画像入力装置としてのカラー画像入力装置1を備えている。
カラー画像入力装置1には、読み取ったカラー画像の画像データ、及び圧縮ファイルを生成する画像処理装置としてのカラー画像処理装置50が接続されている。
カラー画像処理装置50には、カラー画像処理装置50が生成した画像データに基づいてカラー画像を出力する画像出力装置としてのカラー画像出力装置2、及びカラー画像処理装置50が生成した圧縮ファイルを外部へ送信する画像出力装置としての送信装置3が接続されている。
すなわち、画像形成装置100は、カラー画像入力装置1、カラー画像処理装置50、カラー画像出力装置2、送信装置3などを備える。また、カラー画像入力装置1、カラー画像処理装置50、カラー画像出力装置2及び送信装置3には、操作パネル4が接続されている。
操作パネル4は、ユーザが画像形成装置100の動作モードを設定するための設定ボタン及びテンキー等の操作部、及び液晶ディスプレイ等で構成される表示部など(いずれも不図示)を備える。画像形成装置100で実行される各種処理は、図示しないCPU(Central Processing Unit)が制御する。画像形成装置100のCPUは、図示しないネットワークカード及びLANケーブルを介して、ネットワークに接続されたコンピュータ及び他のデジタル複合機等とデータ通信を行なう。
以下、画像形成装置100の各部について詳述する。
カラー画像入力装置1は、例えば、CCD(Charge Coupled Device )を有するカラースキャナで構成される。カラー画像入力装置1は、CCDを用いて原稿からの反射光像をRGB(R:赤、G:緑、B:青)のアナログ信号として読み取りカラー画像処理装置50へ出力する。
カラー画像処理装置50は、カラー画像入力装置1から入力されたRGBのアナログ信号に対して、A/D変換部11、シェーディング補正部12、原稿種別判別部13、入力階調補正部14、及び領域分離処理部15にて各後述する画像処理を実行することによって、RGBのデジタル信号(以下、RGB信号という)からなる画像データを生成する。
また、カラー画像処理装置50は、領域分離処理部15が出力したRGB信号に対して色補正部16、黒生成下色除去部18、空間フィルタ処理部19、出力階調補正部21、及び階調再現処理部22にて各後述する画像処理を実行することによって、CMYK(C:シアン、M:マゼンタ、Y:イエロー、K:ブラック)のデジタル信号からなる画像データを生成して、ストリームとしてカラー画像出力装置2へ出力する。なお、カラー画像出力装置2へ出力される前に、画像データを記憶部(不図示)に一旦記憶するようにしてもよい。該記憶部は、不揮発性の記憶装置(例えばハードディスク)である。
カラー画像出力装置2は、カラー画像処理装置50から入力された画像データに基づいて、熱転写、電子写真、又はインクジェット等の方式により、記録シート(例えば記録用紙等)上にカラー画像を形成して出力する。
なお、画像形成装置100は、カラー画像出力装置2の代わりに、記録シート上にモノクローム画像を形成して出力するモノクロ画像出力装置を備えていてもよい。この場合、カラー画像処理装置50にて、カラー画像の画像データがモノクローム画像の画像データに変換されてからモノクロ画像出力装置へ出力される。
また、カラー画像処理装置50は、領域分離処理部15が出力したRGB信号に対して色補正部16、空間フィルタ処理部19、解像度変換処理部20、出力階調補正部21、及び圧縮処理部23にて各後述する画像処理を実行することによって、RGBのデジタル信号からなる出力画像データ、グレースケール又はモノクロ出力画像データを圧縮処理した圧縮データを生成して送信装置3へ出力する。
また、本実施の形態において、解像度変換処理部20で解像度変換処理を行う際には、必要に応じて、処理パラメータ決定部17は変換すべき出力解像度(解像度)を決定し、決定した解像度を解像度変換処理部20へ出力することにより、入力された画像(画像データ)を所望の出力解像度に変換処理することが可能である。
なお、出力画像データ、又は出力画像データを圧縮した圧縮データを送信装置へ出力する前に、一旦記憶部に記憶するようにしてもよい。
また、図1に示すように、カラー画像入力装置1で読み込まれたカラー画像データをカラー画像出力装置2から出力する場合には、解像度変換処理部20、圧縮処理部23は動作しない。また、図2に示すように、カラー画像入力装置1で読み込まれたカラー画像データを送信装置3より送信する場合、黒生成下色除去部18、階調再現処理部22は動作しない。
送信装置3は、図示しない公衆回線網、LAN(Local Area Network)又はインターネット等の通信ネットワークに接続可能であり、ファクシミリ又は電子メール等の通信方法により、通信ネットワークを介して外部へ圧縮ファイルを送信する。例えば、操作パネル4においてscan to e-mailモードが選択されている場合、圧縮ファイルは、ネットワークカード、モデム等を用いてなる送信装置によってe-mailに添付され、設定された送信先へ送信される。
なお、ファクシミリの送信を行なう場合は、画像形成装置100のCPUが、モデムを用いてなる送信装置3にて、相手先との通信手続きを行ない、送信可能な状態が確保されたときに、圧縮ファイルに対して圧縮形式の変更等の必要な処理を施してから、相手先に通信回線を介して順次送信する。また、ファクシミリを受信する場合、画像形成装置100のCPUは、送信装置3にて通信手続きを行いながら、相手先から送信されてくる圧縮ファイルを受信して、カラー画像処理装置50へ出力する。
カラー画像処理装置50では、受信した圧縮ファイルに対し、不図示の伸張処理部で伸張処理が施される。圧縮ファイルを伸張することによって得られた画像データには、必要に応じて、不図示の処理部で回転処理及び/又は解像度変換処理等が施され、また、出力階調補正部21で出力階調補正が施され、階調再現処理部22で階調再現処理が施される。各種画像処理が施された画像データは、カラー画像出力装置2へ出力され、カラー画像出力装置2にて、記録シート上に出力画像が形成される。
以下、カラー画像処理装置50における画像処理を詳述する。最初に、カラー画像入力装置1から入力された画像データをカラー画像出力装置2に出力する場合の処理について説明する。
A/D変換部11は、カラー画像入力装置1から入力されたRGBのアナログ信号を受け付け、RGBのアナログ信号をRGBのデジタル信号(即ちRGB信号)へ変換し、変換したRGB信号をシェーディング補正部12へ出力する。
シェーディング補正部12は、A/D変換部11から入力されたRGB信号に対して、カラー画像入力装置1の照明系、結像系及び撮像系で生じる各種の歪みを取り除く処理を行なう。そして、シェーディング補正部12は、歪みを取り除いたRGB信号を原稿種別判別部13へ出力する。
原稿種別判別部13は、シェーディング補正部12から入力されたRGBの反射率信号をRGB各色の濃度を示す濃度信号に変換し、文字、印刷写真、又は印画紙写真等の原稿のモードを判別する原稿種別判別処理が実行される。原稿種別判別処理を、ユーザが操作パネル4を用いてマニュアル設定する場合、原稿種別判別部13はシェーディング補正部12から入力されたRGB信号をそのまま後段の入力階調補正部14へ出力する。原稿種別判別処理の処理結果は、後段の画像処理に反映される。
入力階調補正部14は、RGB信号に対して、カラーバランスの調整、下地濃度の除去、及びコントラストの調整等の画質調整処理を行う。入力階調補正部14は、次に、処理を行ったRGB信号を領域分離処理部15へ出力する。
領域分離処理部15は、入力階調補正部14から入力されたRGB信号が表す画像中の各画素を、文字領域、網点領域、又は写真領域のいずれかに分離する。また、領域分離処理部15は、分離結果に基づき、各画素がいずれの領域に属しているかを示す領域識別信号を、黒生成下色除去部18、空間フィルタ処理部19、階調再現処理部22、及び処理パラメータ決定部17へ出力する。
色補正部16は、領域分離処理部15から入力されたRGB信号をCMYのデジタル信号(以下、CMY信号という)へ変換し、色再現の忠実化実現のために、不要吸収成分を含むCMY色材の分光特性に基づいた色濁りをCMY信号から取り除く処理を行なう。そして、色補正部16は、色補正後のCMY信号を黒生成下色除去部18へ出力する。
黒生成下色除去部18は、色補正部16から入力されたCMY信号に基づき、CMY信号から黒(K)信号を生成する黒生成処理と、CMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理とを行なう。この結果、CMY3色のデジタル信号は、CMYK4色のデジタル信号(以下、CMYK信号という)に変換される。そして、黒生成下色除去部18は、CMY信号を変換したCMYK信号を空間フィルタ処理部19へ出力する。
黒生成処理の一例としては、一般に、スケルトン・ブラックによる黒生成を行なう方法が用いられる。この方法では、スケルトン・カーブの入出力特性をy=f(x)、入力されるデータをC、M、Y、出力されるデータをC'、M'、Y'、K'、UCR(Under Color Removal )率をα(0<α<1)とすると、黒生成下色除去処理は、下記の式(1)〜式(4)で表わされる。
式(1):K'=f(min(C、M、Y))
式(2):C'=C−αK'
式(3):M'=M−αK'
式(4):Y'=Y−αK'
ここで、UCR率α(0<α<1)とは、CMYが重なっている部分をKに置き換えてCMYをどの程度削減するかを示すものである。式(1)は、CMYの各信号強度の内の最も小さい信号強度に応じてK信号が生成されることを示している。
空間フィルタ処理部19は、黒生成下色除去部18から入力されたCMYK信号の画像データに対して、領域分離処理部15から入力された領域識別信号に基づいてデジタルフィルタによる空間フィルタ処理を行ない、空間周波数特性を補正することによって、画像のぼやけ又は粒状性劣化を改善する。
例えば、領域分離処理部15にて文字に分離された領域に対しては、空間フィルタ処理部19は、文字の再現性を高めるために、高周波成分の強調量が大きいフィルタを用いて空間フィルタ処理を行なう。また、領域分離処理部15にて網点に分離された領域に対しては、空間フィルタ処理部19は、入力網点成分を除去するためのローパス・フィルタ処理を行なう。
空間フィルタ処理部19は、処理後のCMYK信号を出力階調補正部21へ出力する。
出力階調補正部21は、空間フィルタ処理部19から入力されたCMYK信号に対して、カラー画像出力装置2の特性である網点面積率に基づく出力階調補正処理を行ない、出力階調補正処理後のCMYK信号を階調再現処理部22へ出力する。
階調再現処理部22は、出力階調補正部21から入力されたCMYK信号に対して、領域分離処理部15から入力された領域識別信号に基づいて、領域に応じた中間調処理を行なう。例えば、領域分離処理部15にて文字に分離された領域に対しては、階調再現処理部22は、高域周波成分の再現に適した高解像度のスクリーンによる二値化又は多値化の処理を行なう。また、領域分離処理部15にて網点に分離された領域に対しては、階調再現処理部22は、階調再現性を重視したスクリーンでの二値化又は多値化の処理を行なう。
また、階調再現処理部22は、処理後の画像データをカラー画像出力装置2へ出力する。カラー画像入力装置1から入力された画像データをカラー画像出力装置2に出力する場合、処理パラメータ決定部17、解像度変換処理部20、圧縮処理部23は動作しない。解像度変換処理部20、圧縮処理部23は、入力されたCMYK信号をそのまま後段の処理部に出力する。
次に、カラー画像入力装置1から入力された画像データを送信装置3に出力する場合の処理について説明する。A/D変換部11から領域分離処理部15までの処理は、カラー画像入力装置1から入力された画像データをカラー画像出力装置2に出力する場合の処理と同じであるので説明を省略する。
領域分離処理部15は、入力階調補正部14から入力されたRGB信号を、そのまま後段の色補正部16及び処理パラメータ決定部17へ出力する。
処理パラメータ決定部17は、操作パネル4において自動設定モードでスキャン機能が選択された場合に、解像度変換処理部20で画像データを最適な出力解像度に変換するための出力解像度を決定する。
色補正部16は、領域分離処理部15から入力されたRGB信号を、例えば、一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)へ変換する。
空間フィルタ処理部19は、色補正部16から入力されたR’G’B’信号に対して同様に、領域分離処理部15から入力された領域識別信号に基づいてデジタルフィルタによる空間フィルタ処理を行い、空間周波数特性を補正することによって、画像のぼやけ又は粒状性劣化を改善する。空間フィルタ処理部19は、処理後のR’G’B’信号を解像度変換処理部20へ出力する。
解像度変換処理部20は、処理パラメータ決定部17で決定された所望の出力解像度の画像データになるように解像度変換処理を行う。例えば、単純な例で示すと、スキャナの入力解像度が600×300dpiの画像データで処理パラメータ決定部17が決定する出力解像度が300×300dpiである場合、解像度変換処理部20は、主走査方向の2画素毎に平均値を求め、それを出力値とすることで、600×300dpiから300×300dpiへの解像度変換を行なう。
出力階調補正部21は、解像度変換処理部20から入力されたR’G’B’信号に対して、必要に応じてかぶり又はハイライトの下地が消えるように、あるいは薄くなるように出力階調補正を行い、出力階調補正処理後のR’G’B’信号を圧縮処理部23へ出力する。
圧縮処理部23は、R’G’B’信号からなる画像データに対して、操作パネル4のファイルフォーマットの設定に従い、必要に応じてJPEGなどの圧縮処理を行い、圧縮データを生成し、送信装置3へ出力する。なお、圧縮処理が施された画像データを送信装置3へ送信する構成に代えて、USBメモリ等の記憶媒体やハードディスクに格納するようにしてもよい。
カラー画像入力装置1から入力された画像データを送信装置3に出力する場合、黒生成下色除去部18、階調再現処理部22は動作しない。黒生成下色除去部18、階調再現処理部22は、入力されたR’G’B’信号をそのまま後段の処理部に出力する。
次に、処理パラメータ決定部17について詳述する。図3は実施の形態1の処理パラメータ決定部17の構成の一例を示すブロック図である。処理パラメータ決定部17は、エッジ検出部171、文字矩形抽出部172、文字列抽出部173、解像度決定部174などを備える。処理パラメータ決定部17は、入力されたRGB信号に対してエッジ検出部171でエッジ検出を行い、検出された文字エッジをベースに文字矩形抽出部172で文字矩形を抽出し、文字列抽出部173では抽出された文字矩形をベースに文字列を抽出し、解像度決定部174で文字列又は文字矩形から出力解像度を決定する。また、解像度決定部174は、決定された出力解像度が非文字領域の影響を受けているかを判定し、影響を受けている場合は、決定された出力解像度を予め設定された解像度に置き換える。
図4はエッジ検出部171の処理手順の一例を示すフローチャートである。図4に示すように、エッジ検出部171は、入力されたRGB信号に対してSobel又はLaplacianなどのエッジ検出フィルタを用いてエッジ検出を行う(ステップS11)。エッジ検出部171は、検出されたエッジに対して文字エッジ膨張処理(膨張処理)を行い(ステップS12)、文字エッジ候補を抽出し、処理を終了する。
図5(図5A乃至図5E)はエッジ検出部171によるエッジ検出処理の一例を示す模式図である。図5AはRGB画像データのG信号の一部分(10×10画素)を示している。各枠内の数値は、画素値である。ここではG信号に対する処理のみ説明するが、R信号又はB信号に対しても同様の処理を行う。図5Bはエッジ検出のためのフィルタを示す。該エッジ検出のフィルタとしては、図5Bに示すように、例えば、Laplacianフィルタを用いることができる。なお、エッジ検出のフィルタが図5Bの例に限定されるものではない。
図5Aの太枠で囲まれた、8×8画素に対して、図5Bに示すフィルタによりフィルタ処理した結果を図5Cに示す。図5Cの例に対して、画素値が100以上の画素のみをエッジ画素(値を1とする)として抽出し、画素値が100未満の画素を0としたものを図5Dに示す。すなわち、図5Aの太枠(8×8画素)に対して、斯かる処理を施した場合、図5Dに示す結果が得られる。
図5Dの例(太枠の部分)に対して、文字エッジ膨張処理(膨張処理)を施した結果を図5Eに示す。膨張処理は、注目画素が0であって、その近傍8画素のうち、2画素以上にエッジ画素(値が1の画素)が存在する場合、その注目画素の値を1とすることにより行われる。図5Eの例を文字エッジ候補とする。
上述のように、エッジ検出の後に膨張処理を行うことにより、図5に示すように、フィルタ処理結果を閾値処理している結果、本来エッジであるにも関わらずエッジであると判定されない画素がある場合、かかる画素を訂正し、精度良くエッジを検出することができる。また、文字を構成する画素のつながりを良くすることができる。
図6は文字矩形抽出部172の処理手順の一例を示すフローチャートである。文字矩形抽出部172は、画像を構成する複数の画素の画素値に基づいて画像に含まれる文字候補(文字矩形とも称する)を特定する文字特定情報(文字矩形情報とも称する)を生成する。文字候補は、1つの文字毎に特定することができる。文字特定情報(文字矩形情報)は、文字候補(文字矩形)を特定するための位置情報であり、例えば、文字矩形の左上及び右下の座標情報、文字矩形の水平方向の寸法(幅)及び垂直方向の寸法(高さ)などを含む。
より具体的には、図6に示すように、文字矩形抽出部172は、エッジ検出部171で出力された文字エッジ候補(例えば、図5Eの例)に対してラベリング処理を行い(ステップS21)、文字矩形(文字候補、文字矩形領域とも称する)を抽出する。
文字矩形抽出部172は、文字矩形を抽出した後、抽出した文字矩形それぞれに対し、近傍の文字矩形サイズと比較する。その結果、サイズの差異が所定値よりも大きく、かつ、近傍に似たような文字矩形が存在しない文字矩形については、文字矩形抽出部172が非文字矩形として除去し(ステップS22)、残った文字矩形を文字矩形情報として、処理を終了する。
図7(図7A乃至図7E)は文字矩形抽出部172による文字矩形抽出処理の一例を示す模式図である。図7Aはエッジ検出部171で抽出されたエッジ検出結果(文字エッジ候補)の例である。なお、図7A及び図5Eは、文字エッジ候補を表すが、図7Aの例と図5Eの例とは便宜上異なっている。
まず、文字矩形抽出部172は、エッジ検出部171で抽出されたエッジ検出結果(文字エッジ候補)に対してラベリング処理を行う。図7Bはラベリング処理を行う際の注目画素と参照画素を示す。図7Bの*で示す画素を注目画素とすると、当該注目画素の近傍の4つの参照画素(符号a、b、c、dで示す)のラベリング値を参照して注目画素の初期ラベルを決定する。具体的には、4つの参照画素にラベル付けした画素が存在しない場合には、注目画素に新たなラベル値を付与する。また、4つの参照画素に複数のラベル値が存在する場合には、その中での最小ラベル値を注目画素に付与する。図7Cは図7Aに例示したエッジ検出結果(文字エッジ候補)に対して初期ラベルを付与した結果を示す。
また、ラベル値を付与した注目画素の周辺の8画素に複数のラベル値が存在する場合には、注目画素の付与した初期ラベルと、注目画素の周辺の8画素のラベル値のうち最小ラベル値を補正ラベルとして関連付けを行う。図7Dが初期ラベルと補正ラベルとの関連付けを示す例である。すなわち、図7Dは注目画素に初期ラベルを付与した際、注目画素の周辺の8画素に複数のラベルが存在した場合に、その中で最小ラベル値(注目画素に付与した初期ラベル)以外のものと最小ラベル値(初期ラベル)との関連付けを行ったものである。
図7Dによれば、例えば、ラベル3(初期ラベル3)はラベル1(補正ラベル1)と関連があることを示している。また、ラベル6(初期ラベル6)は最初の関連付けの段階ではラベル5(補正ラベル5)と関連があるということになるが、ラベル5はラベル4と関連があるということがわかっているので、最終的にラベル6(初期ラベル6)はラベル4(補正ラベル4)と関連があるということになる。図7Dは、初期ラベルと最終的な最小ラベル値(補正ラベル)との関連を表す。
図7Dに示す初期ラベルと補正ラベルとの対応関係を用いて、図7Cに示す各画素のラベルを参照しつつ、ラベル値が最小ラベル値になるように補正処理を行った結果を図7Eに示す。
また、最小ラベル値になるように補正処理を行う際に同一ラベル値の画素を囲む文字矩形領域の座標の最小値(文字矩形領域の左上の位置)と最大値(文字矩形領域の右下の位置)を求めることにより、同一ラベル値を包含する文字矩形領域の矩形サイズを求める。図7Eの太線が文字矩形領域を示す。図7Eでは、ラベル値が、1、2、4、7の4つの文字矩形領域が例示されている。それぞれの文字矩形領域の最小値(文字矩形領域の左上の位置)と最大値(文字矩形領域の右下の位置)が、各ラベル(図7Eの例では、1、2、4、7)の矩形サイズとなる。
次に、各ラベルに対して文字矩形と判定できないものを排除する。具体的には、水平方向又は垂直方向に長いラベル、例えば、図7Eのラベル4のように水平方向に16画素あり、垂直方向に2画素ある矩形領域は、垂直方向の長さに比べて水平方向の長さが長いため、水平方向の線分の可能性がある。そこで、ラベル4の矩形領域は、文字矩形ではないと判定して排除する。この場合、矩形領域が線分であるか否かを判定するためには、例えば、水平方向の画素数と垂直方向の画素数との差分を算出し、算出した差分が所定の閾値以上(例えば、12画素以上)である場合に線分と判定することができる。
また、求めた矩形領域のうち、サイズが小さすぎる矩形領域、例えば、図7Eのラベル7のように水平方向及び垂直方向それぞれに2画素ずつ合計で4画素しかないものは文字ではなく、汚れなどのノイズ画素(以下、小矩形とも言う)である可能性がある。そこで、ラベル7の矩形領域は文字矩形ではないと判定して排除する。この場合、矩形領域のサイズが小さいものを判定するためには、例えば、水平方向の画素数と垂直方向の画素数とを加算し、加算した値が所定の閾値以下(例えば6画素以下)である場合にノイズ画素と判定することができる。
また、図7Eには例示していないが、矩形領域のサイズがあまりにも大きすぎるラベル、例えば、入力画像のサイズの1/4程度の大きさの矩形領域などは、文字ではなく画像などの可能性があるため排除することができる。この場合、矩形領域のサイズが大きなものを判定する際には、入力画像の画素数に対する矩形領域の画素数の比率を求め、その比率が所定の閾値以上(例えば、0.25以上)である場合には、当該矩形領域は大きすぎるラベルであると、すなわち文字矩形でないと判定することができる。上述のような非文字矩形除去処理を行うことにより、最終的に図7Eのラベル1とラベル2だけが文字矩形として抽出される。
図8は文字列抽出部173の処理手順の一例を示すフローチャートである。すなわち、文字列抽出部173は、文字矩形抽出部172で生成した文字特定情報(文字矩形情報)に基づいて複数の文字で構成される文字列候補(文字列とも称する)を特定する文字列特定情報(文字列情報とも称する)を生成する。文字列特定情報(文字列情報)は、文字列候補(文字列)を特定するための位置情報であり、例えば、文字列候補の左上及び右下の座標情報、文字列候補の水平方向の寸法(幅)及び垂直方向の寸法(高さ)などを含む。また、文字列特定情報は、文字列の方向(水平方向、垂直方向)を含む。
より具体的には、図8に示すように、文字列抽出部173は、文字矩形抽出部172で出力された文字矩形情報に対して近傍の文字矩形同士の距離を算出し(ステップS31)、近い文字矩形同士を同じ文字列のグループとして統合し、文字列情報を生成する。
文字列抽出部173は、文字矩形が統合された文字列情報に対し、文字列の長さから文字列の方向を推定する(ステップS32)。文字列抽出部173は、さらに、部分的に異なる方向であると判定された文字列、あるいは方向が不定の文字矩形について、異なる方向であると判定された文字列に属する文字矩形又は方向不定の文字矩形を正しい文字列方向に補正できる場合には文字列方向を補正する(ステップS33)。
文字列抽出部173は、補正された文字列の情報から文字列領域を抽出し(ステップS34)、抽出した文字列領域に属さないと判定された文字列については非文字列領域の文字列であるとして除去し(ステップS35)、残ったものを最終的な文字列情報として、処理を終了する。
図9(図9A乃至図9D)は文字列抽出部173による文字列抽出処理の一例を示す模式図である。図9Aは文字矩形抽出部172で抽出された文字矩形抽出結果の一例を示す。図9Aの例では、21個の文字矩形(文字候補)が抽出されている。
図9Aの文字矩形抽出結果に対し、近傍の文字矩形同士の距離を算出する。まず、任意の注目文字矩形に対し、文字列情報として注目文字矩形と同じサイズの文字列サイズを設定する。近傍文字矩形の距離の求め方としては、水平方向に対し、注目文字矩形の右上の頂点座標と近い(例えば、垂直方向に±5画素以内、水平方向に10画素以内の位置にある)左上の頂点座標を持つ文字矩形が存在するかの判定、もしくは、注目文字矩形の右下の頂点座標と近い左下の頂点座標を持つ文字矩形が存在するかの判定をすべての文字矩形の座標情報から探索し、近い位置にある文字矩形を近傍文字矩形として抽出する。
さらに、垂直方向に対し、注目文字矩形の左下の頂点座標と近い(例えば、水平方向に±5画素以内、垂直方向に10画素以内の位置にある)左上の頂点座標を持つ文字矩形が存在するかの判定、もしくは、注目文字矩形の右下の頂点座標と近い右上の頂点座標を持つ文字矩形が存在するかの判定をすべての文字矩形の座標情報から探索し、近い位置にある文字矩形を近傍文字矩形として抽出する。
水平方向及び垂直方向の両方向に近接文字矩形が存在する場合、より近い方の文字矩形を近傍文字矩形として選択する。そして、最終的に抽出された近傍文字矩形をその注目文字矩形と同じグループの文字矩形として統合(同じ文字列であるというラベルを付ける)し、注目文字矩形の文字列サイズに近傍文字矩形を接続した際のサイズを新しい文字列サイズとして文字列情報を更新する。
仮に、近傍文字矩形が存在しない場合には、文字列情報の文字列サイズは文字矩形サイズのままとし、次の注目文字矩形の処理に移る。なお、次の注目文字矩形は、まだ、どの文字列グループにも属していない文字矩形を選択するようにし、最終的に、一度も文字列抽出処理を行っておらず、どの文字列グループにも属していない文字矩形が存在しなくなるまで繰り返し文字列抽出処理を行う。
図9Aに例示した文字矩形に対して、上述の処理を行った結果を図9Bに例示する。図9Bにおいて、太枠で囲まれた部分が抽出された文字列を示す。図9Bの例では、符号1〜6が付された6個のグループの文字列が抽出されている。
文字列抽出処理が完了すると、各グループの文字列の水平方向及び垂直方向のサイズを算出し、サイズが長い方の方向を文字列の方向として設定する。例えば、水平方向に100画素あり、垂直方向に10画素ある文字列の場合、水平方向の文字列と設定する。
また、文字列の水平方向のサイズ及び垂直方向のサイズが同程度である場合(例えば、水平方向が15画素であり、垂直方向が10画素である場合など)、文字列の方向を判定することができないので、当該文字列については文字列方向不定として設定しておく。図9Bの例では、符号1、2、3の文字列の方向は水平方向(水平方向文字列とも称する)であり、符号4、5、6の文字列(文字矩形を含む)は方向不定文字列となる。
すべてのグループの文字列に対して文字列方向を設定した後、文字列方向不定のものに対して、近傍の文字列に係る文字列情報に基づいて、正しい文字列方向に補正する。図9Bの例では、符号4の方向不定文字列は、上側近傍に位置する符号3が付されたグループの文字列とほぼ同じ横位置(例えば、水平位置が±5画素以内)にあり、また、垂直方向の距離も比較的近い(例えば、8画素以下)ので、符号3のグループの文字列と同じ方向の文字列と判定する。これにより、符号4の方向不定文字列は、水平方向の文字列であると補正される。
また、符号5、6の方向不定文字列は、近傍に文字列が存在しないので、方向不定文字列のままとする。
図9Cは図9Bに例示した文字列に対して文字列方向を補正した結果の一例を示す。図9Cにおいて、太枠で囲まれた文字列(符号1、2、3、4)が、文字列方向が定まったものである。
次に、近傍に位置する文字列(近傍文字列とも称する)であってサイズが近いもの、あるいは文字列の開始位置(文字列の左端位置)又は終了位置(文字列の右端位置)が近い(例えば、8画素以内)もの同士でグループ分けを行う。これにより文字列領域を抽出する。図9Cの場合、符号1〜4の文字列が水平方向の文字列であり、文字列の開始位置又は終了位置が近いので、符号1〜4の文字列を同じグループの文字列である文字列領域として抽出する。文字列領域は、方向が同一の1又は複数の文字列を纏めたものである。そして、文字列領域に属していない符号5、6の方向不定文字列を非文字列領域として文字列情報から除去する。文字列領域を抽出し、非文字列領域を除去した結果を図9Dに例示する。すなわち、図9Dに例示する文字列領域には、文字列の方向が定まった文字列(符号1〜4で示す矩形領域)が含まれる。なお、文字列領域が1つも存在しない場合には、文字列が存在しないと判定し、文字列情報をクリアすればよい。
図10は解像度決定部174の処理手順の一例を示すフローチャートである。解像度決定部174は、解像度決定部としての機能を有する。すなわち、解像度決定部174は、文字列生成部(文字列抽出部173)で生成した文字列特定情報(文字列情報)に基づいて画像の出力解像度を決定する。また、解像度決定部174は、文字生成部(文字矩形抽出部172)で生成した文字特定情報(文字矩形情報)に基づいて画像の出力解像度を決定する。
また、解像度決定部174は、生成した文字列特定情報又は文字特定情報に基づいて1又は複数の文字サイズを決定する。例えば、文字列候補の高さ又は幅、あるいは文字候補の高さ又は幅に応じて文字サイズ(例えば、8ポイント、10ポイント、12ポイントなど)を決定する。解像度決定部174は、決定した文字サイズに基づいて出力解像度を決定する。例えば、文字サイズが大きいほど出力解像度を低くくし、文字サイズが小さいほど出力解像度を高くする。これにより、最適な出力解像度を自動設定し、ユーザが複雑な設定をすることなく、所望の出力データ(解像度の変換後の出力画像)を出力することができる。
また、解像度決定部174は、文字列抽出部173での文字列特定情報(文字列情報)の生成の可否を判定する。
より具体的には、図10に示すように、解像度決定部174は、条件1を充足するか否かを判定する(ステップS41)。条件1は、文字列が存在するという条件、あるいは文字列情報が存在するという条件である。
条件1を充足する場合(ステップS41:YES)、解像度決定部174は、文字列情報を用いて各グループの文字列の矩形サイズに基づいて、同程度の矩形サイズ毎に分類してカウントを行い、サイズ別の文字列情報をカウントする(ステップS42)。解像度決定部174は、カウントした値から文字列サイズに基づいて最適出力解像度を決定し(ステップS43)、文字列サイズに基づく最適出力解像度決定結果を出力し(ステップS44)、処理を終了する。
条件1を充足しない場合(ステップS41:NO)、解像度決定部174は、条件2を充足するか否かを判定する(ステップS45)。条件2は、文字矩形が存在するという条件、あるいは文字矩形情報が存在するという条件である。
条件2を充足する場合(ステップS45:YES)、解像度決定部174は、文字矩形情報を用いて文字矩形サイズに基づいて、同程度の矩形サイズ毎に分類してカウントを行い、サイズ別の文字矩形情報をカウントする(ステップS46)。解像度決定部174は、カウントした値から文字矩形サイズに基づいて最適出力解像度を決定し(ステップS47)、文字矩形サイズに基づく最適出力解像度決定結果を出力し(ステップS48)、処理を終了する。
条件2を充足しない場合(ステップS45:NO)、解像度決定部174は、原稿種別情報に基づいて最適出力解像度を決定する(ステップS49)。原稿種別情報は、例えば、原稿が印刷写真原稿であるか、あるいは印画紙写真原稿であるか等の情報を含む。解像度決定部174は、文字なしの場合の最適出力解像度決定結果を出力し(ステップS50)、処理を終了する。なお、出力された最適出力解像度情報は、解像度変換処理部20へ出力され、解像度変換処理部20は、入力された画像データ(画像)を所望の出力解像度に変換処理する。
図11(図11A及び図11B)は解像度決定部174による解像度決定処理の一例を示す模式図である。図11Aは文字列抽出部173で抽出した文字列情報の一例を示す。図11Aに例示する文字列情報が存在する場合には、前述の条件1を充足する(図10のステップS41)。条件1を充足する場合、文字列情報に基づいて最適出力解像度を決定するためにサイズ別の文字列情報のカウントを行う。
図11Aに示すように、文字列情報は、文字列抽出部173で抽出された文字列のラベル番号(文字列ラベル)、文字列の左上の座標情報(sx、sy)、文字列の右下の座標情報(ex、ey)、文字列方向(例えば、符号1を水平方向とし、符号2を垂直方向とする)などの情報を含む。なお、文字列は、例えば、図9C、図9Dに例示したように、符号1〜4が付された矩形領域である。
そして、文字列方向が水平方向である場合には文字列の高さ(ey−sy)を矩形サイズとして算出し、文字列方向が垂直方向である場合には文字列の幅(ex−sx)を矩形サイズとして算出する。
図12は文字列又は文字の矩形サイズと出力解像度との関係の一例を示す説明図である。図12には、文字列又は文字の矩形サイズ、文字サイズ、出力解像度及び画像の圧縮率の対応関係を例示している。なお、矩形サイズ、文字サイズ、出力解像度などは、一例であって、図12に示す値に限定されるものではない。例えば、存在するすべての文字サイズに対して矩形サイズを設定しておくことができる。また、矩形サイズと文字サイズとの関係は、スキャナ等の読取解像度等にも依存するので、常に図12に例示したサイズに固定されるものではない。
文字列の高さ又は幅に基づいて算出した矩形サイズが、いずれの文字サイズに相当するかを判定し、文字サイズ別にカウントする。例えば、図11Aにおいて、文字列ラベルが1の文字列のみ、文字列の高さ(ey−sy)が50であり、図12の矩形サイズ52±4に該当する。また、他の文字列ラベル(2〜9)の文字列の高さは30であり、図12の矩形サイズ30±2に該当する。この場合、文字サイズ別にカンウトした値は、矩形サイズ52±4に対応する14ポイントの文字列が1個、矩形サイズ30±2に対応する8ポイントの文字列が8個という結果になる。
なお、図11Aでは、便宜上、同じサイズの文字列高さの例を示しているが、実際には、スキャナで読み取られた画像に対する文字列抽出結果においては、必ずしも文字サイズ毎の矩形サイズが図11Aのように全く同じ値になる可能性は高くない。このため、図12に例示するように、矩形サイズに対しては数画素の許容範囲を設けている。また、隣り合う文字サイズに対応する矩形サイズの許容範囲は重なるようにしてある。このため、仮に文字列の高さが32である場合、文字サイズが9ポイントである可能性と8ポイントである可能性があるので、両方の文字サイズで重複してカウントする。これにより、多少、文字列抽出で曖昧なサイズの文字列が抽出された場合でも、その影響を少なくして出力解像度を決定し易くすることができる。
そして、出力解像度の決定方法としては、閾値を設定し、設定した閾値以上のカウント値がある文字サイズを対象とする。例えば、カウント値が前記閾値以上である、対象となる文字サイズの中で一番小さな文字サイズを基準に出力解像度を決定することができる。これは一番小さな文字が判読しやすい解像度で出力することを目的とした場合の決定方法である。これ以外にも、対象となる文字サイズの中で最大頻度の文字サイズを基準に出力解像度を決定する方法もある。これは一番多く存在する文字が判読しやすい解像度で出力することを目的にし、文字の判読性を維持しつつファイルサイズの抑制を目的とした場合の決定方法である。
例えば、対象となる文字サイズの中で一番小さな文字サイズを基準に出力解像度を決定する場合、図11Aの例で、閾値を5とし、カウント値が5以上の文字サイズだけを対象とする。この場合、最小の文字サイズとして8ポイントの文字列が8個存在するので、図12から文字サイズが8ポイントに対応する300×300dpiを出力解像度(最適出力解像度)と決定する。
上述のように、文字列の方向が水平方向である場合、文字列候補(文字列)の垂直方向の寸法(高さ)に応じて出力解像度を決定する。例えば、高さが大きいほど出力解像度を低くくし、高さが小さいほど出力解像度を高くする。また、文字列の方向が垂直方向である場合、文字列候補(文字列)の水平方向の寸法(幅)に応じて出力解像度を決定する。例えば、幅が大きいほど出力解像度を低くくし、幅が小さいほど出力解像度を高くする。これにより、最適な出力解像度を自動設定し、ユーザが複雑な設定をすることなく、所望の出力データ(解像度の変換後の出力画像)を出力することができる。
図11Bは文字矩形抽出部172で抽出した文字矩形情報の一例を示す。図11Aに例示する文字列情報が存在しない場合には、前述の条件1を充足しない(図10のステップステップS41)。そして、条件2を充足する場合(図10のステップS45)、文字矩形情報に基づいて最適な出力解像度を決定するためにサイズ別の文字矩形情報のカウントを行う。
図11Bに示すように、文字矩形情報は、文字矩形抽出部172で抽出された文字矩形のラベル番号(文字矩形ラベル)、文字矩形の左上の座標情報(sx、sy)、文字矩形の右下の座標情報(ex、ey)、文字矩形が属する文字列(−1の場合はどの文字列にも属さない文字矩形を表す)などの情報を含む。なお、便宜上、図11Bの例では、すべての文字矩形がいずれの文字列にも属さない場合を示すが、実際には、文字列に属する文字矩形と文字列に属さない文字矩形とが混在する。
そして、文字矩形の高さ(ey−sy)と幅(ex−sx)とを算出し、算出した高さ又は幅の何れか長い方を文字の矩形サイズとして算出する。算出した矩形サイズが図12に例示する、いずれの文字サイズに対応するかを判定することにより、文字サイズ別にカウントを行う。次に、文字列の場合と同様に、閾値以上のカウント値の文字サイズに対して一番小さな文字サイズを基準に出力解像度を決定する。
上述のように、文字候補(文字矩形)の垂直方向の寸法(高さ)又は水平方向の寸法(幅)に応じて出力解像度を決定する。文字候補の高さと幅とが異なる場合には、長い方(大きい方)を用いることができる。そして、文字候補の高さ又は幅が大きいほど出力解像度を低くくし、高さ又は幅が小さいほど出力解像度を高くする。これにより、最適な出力解像度を自動設定し、ユーザが複雑な設定をすることなく、所望の出力データ(解像度の変換後の出力画像)を出力することができる。
また、条件1、2の両方とも充足しない場合には、印刷写真原稿であるか、あるいは印画紙写真原稿であるかなどの原稿種別情報に基づいて最適出力解像度を決定して出力する。印刷写真原稿である場合、例えば、出力解像度を200×200dpiであると決定し、印画紙写真原稿である場合、出力解像度を300×300dpiとして決定することができる。これらの原稿種別情報による出力解像度は常に固定値でもよく、あるいは目的に応じて予めデフォルト値を設定できるようにしてもよい。
上述の例で、条件2よりも条件1を先に判定する理由、すなわち出力解像度を決定(判定)する際に文字矩形情報よりも文字列情報を優先する理由は、文字列は複数の文字矩形を含むので、安定した文字サイズを決定することができるからである。
なお、出力解像度の変換は、読み取った画像データを格納しておき、以下の2通りの方法で行うことができる。第1の方法は、1パススキャンを用いる方法であり、出力解像度を推定し、補間演算により主走査方向及び副走査方向の出力解像度を設定する。第2の方法は、2パススキャンを用いる方法であり、出力解像度を推定し、スキャナの読み取り速度を変更して再度原稿の読み取りを行う。この場合、副走査方向の出力解像度は光学的に変更し、主走査方向の出力解像度は補間演算により設定する。
次に、出力する画像の画質と画像サイズ(ファイルサイズ)のいずれを優先するかを設定する場合について説明する。操作パネル4は、画質又は画像サイズのいずれを優先するかを設定する。操作パネル4により、ユーザが画質を優先するか画像サイズを優先するかを選択することができる。
例えば、画像サイズよりも画質を優先する場合、閾値を低めに設定し、対象となる文字サイズが多く含まれるようにした上で、その中で一番小さな文字サイズを基準に出力解像度を決定する。例えば、12ポイントの文字列が100個存在し、9ポイントの文字列が10個存在する場合、予め閾値を3と設定しておき、カウント値が3以上の文字サイズだけを対象とする。このとき、最小の文字サイズとして9ポイントの文字列が10個存在することになるので、図12に基づき、最適出力解像度は200×200dpiであると判定することができる。
すなわち、解像度決定部174は、画質を優先すべく設定された場合、文字列情報又は文字情報に基づく1又は複数の文字サイズのうち最小の文字サイズを決定する。なお、最小の文字サイズを決定する場合には、予め閾値を設定しておき、閾値の数だけ存在する文字サイズの中で最小の文字サイズを決定することができる。最小の文字サイズに基づいて出力解像度を決定することにより、一番小さな文字が十分に認識することができる出力結果(出力画像)を得ることができる。
また、画質よりも画像サイズを優先する場合、閾値を高めに設定し、対象の文字サイズが少なく含まれるようにした上で、最大頻度の文字サイズを基準に出力解像度を決定する。例えば、12ポイントの文字列が100個存在し、9ポイントの文字列が10個存在する場合、予め閾値を20と設定しておき、カウント値が20以上の文字サイズだけを対象とする。このとき、閾値以上の文字サイズとして12ポイントの文字列が100個存在することになるので、図12に基づき、最適出力解像度は150×150dpiであると決定することができる。
すなわち、解像度決定部174は、画像サイズを優先すべく設定された場合、文字列情報又は文字情報に基づく1又は複数の文字サイズのうち最大頻度の文字サイズを決定する。なお、最大頻度の文字サイズを決定する場合にも、予め閾値を設定しておき、閾値の数だけ存在する文字サイズの中で最大頻度の文字サイズを決定することができる。最大頻度の文字サイズに基づいて出力解像度を決定することにより、画像の中で最も多い文字が十分に認識することができ、また、比較的低い出力解像度となるため、画像全体の文字の視認性を落とすことなくファイルサイズを小さくすることができる。
なお、管理者設定などで画像形成装置100のデフォルト値として設定しておくようなオプション設定を設けることもできる。
上述の処理により、最適な出力解像度を最終決定し、決定した最適な出力解像度情報を解像度変換処理部20へ出力することにより、自動的に原稿に応じた最適な出力解像度で変換されたスキャンデータが入手可能となる。
また、出力解像度の決定方法は、以上の記載に限るものでない。例えば、出力解像度の高解像度側のカウント値を順次加算していき、この加算値が全カウント値に占める比率が、あらかじめ設定された閾値(例えば0.5)を超えた場合に、その際の出力解像度を最適出力解像度として決定しても良い。
このような出力解像度の決定方法では、斯かる閾値を大きくすれば、文字の判読性よりもファイルサイズの抑制を優先した判定になり、小さくすれば、文字の判読性を優先した判定にすることが出来る。
一方、解像度決定部174は、所定の条件を満たす場合、以上のように判定された出力解像度を無効化する処理を行う。すなわち、解像度決定部174は、写真領域等から発生する非文字情報の影響を受けていないかの判定を行い、影響を受けていると判定した場合、決定された出力解像度を無効化し、予め設定された出力解像度を最適出力解像度として出力する。換言すれば、解像度決定部174は、決定された出力解像度が適切であるか否かの判定を行う適否判定部としての機能をなす。
図13は実施の形態1において、解像度決定部174の要部構成を示す機能ブロック図である。解像度決定部174は、特徴量生成部174aと、条件判定部174bと、無効化部174cとを有している。特徴量生成部174aによって生成された後述の特徴量を用いて、条件判定部174bが後述の条件の判定を行うことにより、決定された出力解像度の適否が判定される。以下、詳しく説明する。
特徴量生成部174aは、文字矩形抽出部172による文字矩形抽出処理、及び、文字列抽出部173による文字列抽出処理の後、全抽出文字矩形数(全文字候補数)、第1有効文字矩形数(第1有効文字候補数)及び第2有効文字矩形数(第2有効文字候補数)という特徴量を生成する処理を行う。
前記特徴量は以下の通りである。
「全抽出文字矩形数」:ノイズ矩形として判定された矩形も含めた全抽出矩形数
「第1有効文字矩形数」:全抽出矩形数からノイズ矩形及びサイズ小矩形を除いた文字矩形数
「第2有効文字矩形数」:抽出された文字列矩形内に含まれる文字矩形数(ノイズ矩形は含まれていないが、サイズ小矩形は含まれている。)
ここで、サイズ小矩形(小文字候補)とは、斯かる矩形領域のサイズが、例えば、水平方向の画素数と垂直方向の画素数とを加算し、加算した値が5以下であるものを言う。また、ノイズ矩形(ノイズ文字候補)は、文字列を構成しないと判断された文字矩形であって、文字列抽出部173において、文字列(文字列領域)として判定されていない文字矩形である。
また、条件判定部174bは、特徴量生成部174aによって生成された特徴量が前記記憶部に記憶されている条件A〜Dを満たすか否かについて判定を行う。以下、条件A〜Dについて詳しく説明する。
条件A(第1条件)は、第1有効文字矩形数/全抽出文字矩形数の比率と、第2有効文字矩形数/全抽出文字矩形数の比率とが、共に設定値(第1閾値)、例えば6%、以下であるか否かである。該条件Aの判定により、非文字領域が文字矩形情報及び文字列情報に含まれる等、非文字領域の影響が大きい可能性が高いかを判定できる。
また、条件B(第2条件)は、第1有効文字矩形数/全抽出文字矩形数の比率が設定値(第2閾値)、例えば8%、以下であるか否かである。ここで、抽出文字矩形数は、文字矩形抽出部172によって抽出された文字矩形の数である。
更に、条件C(第3条件)は、下記条件(i)〜(iii)を全て満たすか否かである。
(i)第1有効文字矩形数が設定値(第3閾値)、例えば10、よりも多い。
(ii)第1有効文字矩形数/全抽出文字矩形数の比率が、設定値(第4閾値)、例えば2.5%、より高い。
(iii)第2有効文字矩形数/第1有効文字矩形数の比率が設定値(第5閾値)、例えば4.5、より低い。
なお、条件D(第4条件〜第6条件)は、下記条件(I)〜(III)のいずれか一つを満たすか否かである。
(I)第1有効文字矩形数/第2有効文字矩形数が設定値(第6閾値)、例えば50%、未満である。(第4条件)
(II)第1有効文字矩形数が、例えば25(第7閾値)より少なく、かつ、第2有効文字矩形数に対するサイズ小矩形数の比率が設定値(第8閾値)、例えば40%、以上である。(第5条件)
(III)文字矩形サイズに基づき、出力解像度毎に分類して斯かる文字矩形をカウントしたカウント値が、各出力解像度(本実施例では、150dpi、200dpi、300dpi)で、常に、文字列矩形サイズ(文字列サイズ)に基づき、出力解像度毎に分類して斯かる文字列をカウントしたカウント値よりも大きい。(第6条件)
ここで、文字列矩形サイズは、例えば、斯かる文字列矩形の高さである。
無効化部174cは、特徴量生成部174aによって生成された前記特徴量に対する条件判定部174bの判定結果に基づいて、既に決定された最適出力解像度を無効化する。
図14は実施の形態1において、解像度決定部174による無効化処理の処理手順の一例を示すフローチャートである。
先ず、特徴量生成部174aは前記特徴量(全抽出文字矩形数、第1有効文字矩形数、第2有効文字矩形数)を生成する(ステップS51)。これら特徴量の生成については既に説明しており、詳しい説明を省略する。
次いで、条件判定部174bは、生成された特徴量を用いて、上述した条件Aが満たされているか否かを判定する(ステップS52)。すなわち、条件判定部174bは第1有効文字矩形数/全抽出文字矩形数の比率と、第2有効文字矩形数/全抽出文字矩形数の比率とを求め、これらが共に、例えば、6%以下であるか否かを判定する。
条件判定部174bによって条件Aが満たされていると判定された場合(ステップS52:YES)、無効化部174cは既に決定された出力解像度を無効化する(ステップS53)。以降、解像度決定部174は、決定した最適出力解像度ではなく、予め設定されている解像度を解像度変換処理部20に出力する。
一方、条件判定部174bは条件Aが満たされていないと判定した場合(ステップS52:NO)、条件Bが満たされているか否かを更に判定する(ステップS54)。すなわち、条件判定部174bは第1有効文字矩形数/抽出文字矩形数の比率が、例えば、8%以下であるか否かの判定を行う。
条件判定部174bは条件Bが満たされていると判定した場合(ステップS54:YES)、条件Cが満たされているか否かを更に判定する(ステップS55)。すなわち、条件判定部174bは上述した条件(i)〜(iii)を全て満たしているか否かを判定する。
条件判定部174bによって条件Cが満たされていないと判定された場合(ステップS55:NO)、処理はステップS53に移り、既に決定された出力解像度が無効化される。
一方、条件判定部174bは、条件Cが満たされていると判定した場合(ステップS55:YES)、又は、条件Bが満たされていないと判定した場合(ステップS54:NO)、条件Dが満たされているか否かを更に判定する(ステップS56)。すなわち、条件判定部174bは上述した条件(I)〜(III)のいずれか一つを満たすか否かの判定を更に行う。
条件判定部174bによって条件Dが満たされていると判定された場合(ステップS56:YES)、処理はステップS53に移り、既に決定された出力解像度が無効化される。一方、条件判定部174bによって条件Dが満たされていないと判定された場合(ステップS56:NO)、解像度決定部174によって決定された最適出力解像度がそのまま解像度変換処理部20に出力される。
上述したように、条件A(第1条件)のみでは、既に決定された出力解像度が無効化されない画像が存在するため、条件B(第2条件)、条件C(第3条件)及び条件D(第4条件〜第6条件)を設けている。条件A、条件B、条件Dは、既に決定された出力解像度が無効化される画像を抽出する条件であり、条件Cは既に決定された出力解像度が誤って無効化されるのを防ぐ条件である。
以上のように、解像度決定部174において、最適出力解像度が決定された場合であっても、写真領域等から発生する非文字情報の影響が大きい場合、文字情報が存在しないような原稿の場合は、決定された最適出力解像度を無効化し、予め設定された出力解像度を最適出力解像度として出力する。
また、写真領域等から発生する非文字情報の影響が大きい、文字情報が存在しないような原稿の場合は、出力解像度を高くする必要がない。従って、決定された最適出力解像度を無効化し、予め設定された解像度を最適出力解像度として出力する場合、予め設定された出力解像度は、決定された最適出力解像度より低い解像度であることが好ましい。
(実施の形態2)
以上の実施の形態1の記載においては、ステップS56にて、条件判定部174bが前記第4条件〜第6条件のいずれか一つを満たすか否かの判定を行う場合を例として説明したが、本発明はこれに限るものでない。
例えば、ステップS56において、条件判定部174bは、前記第4条件のみを判定し、又は、第5条件のみを判定し、若しくは第6条件のみを判定するように構成しても良い。
(実施の形態3)
実施の形態1において解像度決定部174は、先ず、出力解像度を決定した後、特徴量生成部174aによって生成された特徴量を用いて、条件判定部174bが条件A〜Dに係る判定を行い、斯かる条件判定部174bの判定結果に基づいて、無効化部174cが既に決定された出力解像度を無効にし、代わりに予め設定された出力解像度を解像度変換処理部20に出力することについて説明した。しかし、本発明はこれに限るものでない。
例えば、先に、特徴量生成部174aによって生成された特徴量を用いて、条件判定部174bが条件A〜Dに係る判定を行い、条件判定部174bの判定結果に基づいて、出力解像度の決定が行われるように構成しても良い。以下、詳しく説明する。
図15は実施の形態3において、解像度決定部174の要部構成を示す機能ブロック図である。解像度決定部174は、特徴量生成部174aと、条件判定部174bと、特定解像度出力部174dとを有している。
特定解像度出力部174dは、特徴量生成部174aによって生成された前記特徴量に対する条件判定部174bの判定結果に基づいて、予め設定されている特定出力解像度を解像度変換処理部20に出力する。
また、特徴量生成部174a及び条件判定部174bについては、実施の形態1にて既に説明しており、詳しい説明を省略する。
図16は実施の形態3において、解像度決定部174による無効化処理の処理手順の一例を示すフローチャートである。
先ず、特徴量生成部174aは前記特徴量(全抽出文字矩形数、第1有効文字矩形数、第2有効文字矩形数)を生成する(ステップS61)。次いで、条件判定部174bは、生成された特徴量を用いて、上述した条件Aが満たされているか否かを判定する(ステップS62)。
条件判定部174bによって条件Aが満たされていると判定された場合(ステップS62:YES)、出力解像度の決定はされず、特定解像度出力部174dは予め設定されている特定出力解像度を、最適出力解像度として解像度変換処理部20に出力する(ステップS63)。
一方、条件判定部174bは条件Aが満たされていないと判定した場合(ステップS62:NO)、条件Bが満たされているか否かを更に判定する(ステップS64)。
条件判定部174bは条件Bが満たされていると判定した場合(ステップS64:YES)、条件Cが満たされているか否かを更に判定する(ステップS65)。条件判定部174bによって条件Cが満たされていないと判定された場合(ステップS65:NO)、処理はステップS63に移り、予め設定されている特定出力解像度が解像度変換処理部20に出力される。
一方、条件判定部174bは、条件Cが満たされていると判定した場合(ステップS65:YES)、又は、条件Bが満たされていないと判定した場合(ステップS64:NO)、条件Dが満たされているか否かを更に判定する(ステップS66)。
条件判定部174bによって条件Dが満たされていると判定された場合(ステップS66:YES)、処理はステップS63に移り、予め設定されている特定出力解像度が解像度変換処理部20に出力される。
一方、条件判定部174bによって条件Dが満たされていないと判定された場合(ステップS66:NO)、解像度決定部174による最適出力解像度の決定が行われる(ステップS67)。解像度決定部174による最適出力解像度の決定については、実施の形態1にて既に説明しており、詳しい説明を省略する。
以降、解像度決定部174によって決定された最適出力解像度が解像度変換処理部20に出力される。
以上のように、写真領域等から発生する非文字情報の影響が大きい場合、文字情報が存在しないような原稿の場合は、予め設定された特定出力解像度を最適出力解像度として出力し、解像度決定部174による最適出力解像度の決定は行われない。写真領域等から発生する非文字情報の影響が大きくない場合のみ、解像度決定部174による最適出力解像度の決定が行われる。従って、処理全体における効率性を図ることが出来る。
(実施の形態4)
図17は実施の形態4の画像読取装置120の構成の一例を示すブロック図である。図17は画像処理システムとしての画像読取装置120の構成を示す。図16に示すように、画像読取装置120は、カラー画像入力装置1、カラー画像処理装置50、送信装置3などを備える。
カラー画像処理装置50は、A/D変換部11、シェーディング補正部12、原稿種別判別部13、入力階調補正部14、領域分離処理部15、色補正部16、空間フィルタ処理部19、解像度変換処理部20、出力階調補正部21、圧縮処理部23、記憶部24、処理パラメータ決定部17などを備える。
カラー画像入力装置1は、例えば、CCD(Charge Coupled Device )を有するカラースキャナで構成される。カラー画像入力装置1は、CCDを用いて原稿からの反射光像をRGB(R:赤、G:緑、B:青)のアナログ信号として読み取りカラー画像処理装置50へ出力する。
カラー画像入力装置1にて読み取られたアナログ信号は、カラー画像処理装置50内を、A/D変換部11、シェーディング補正部12、原稿種別判別部13、入力階調補正部14、領域分離処理部15、色補正部16、処理パラメータ決定部17、空間フィルタ処理部19、解像度変換処理部20、出力階調補正部21、圧縮処理部23の順で送られる。なお、各部の処理は実施の形態1の場合と同様なので説明は省略する。
また、図示はしないが、圧縮処理部23で最適な圧縮処理を行うため、図12と同様の圧縮率を判定することができる。なお、画像読取装置としてデジタルカメラを用いることもできる。
図18は実施の形態1乃至実施の形態4での解像度の設定方法の一例を示す模式図である。実施の形態1乃至実施の形態4の画像形成装置100、画像読取装置120において、スキャン機能における手動の設定モードでは、例えば、図18Aのように解像度をユーザが設定する必要がある。その他にも、カラー設定、原稿モード設定、ファイルフォーマット設定、圧縮率設定などの種々の設定項目が存在する。
本実施の形態の自動設定モードでは、図18Bのような操作パネルを用意し、スキャン開始ボタンを押すだけで、図18Aの解像度の設定を含む他の設定(例えば、天地方向、白紙スキップなどの処理設定)を自動的に行い、最適なスキャンデータが取得できる。自動的に行われる設定には、例えば、カラーについてはACS(Auto Color Select)という機能が既に一般的に使われており、当該機能を用いることで自動的にカラー設定を行うことができる。また、原稿モードについては、原稿種別判別部13の判別結果を用いることで自動的に原稿モードを設定することができる。圧縮率の設定は、前述したように出力解像度と共に自動設定可能である。ファイルフォーマットについては頻繁に使用するファイルフォーマット(例えば、PDFなど)をデフォルトとして予め設定しておくことができる。
なお、本実施の形態においては、上述したように、写真領域等から発生する非文字情報の影響が大きい場合、文字情報が存在しないような原稿の場合は、予め設定された出力解像度(又は特定出力解像度)を解像度変換処理部20に出力するときは、図18Aの操作画面がインアクティブ状態になるように構成されている。
図19は実施の形態4においてデフォルト設定の表示例を示す模式図である。図18Bに示すように、デフォルト設定ボタンがある場合には、ユーザがデフォルト設定ボタンを押すことにより、図19に示すような、デフォルト設定できる項目のみ表示され、ユーザが任意に選択できるようになる。ここで、ファイルフォーマット、優先項目又は圧縮率など、予め指定しておきたい場合には設定することができる。また、デフォルト設定ボタンがない場合には、予め、管理者設定などで、デフォルト設定しておくべき項目のみ設定できるようにしておくことができる。このように、本実施の形態によれば、ユーザが複雑な設定をすることなく、ワンプッシュで最適なスキャンデータを取得することができる機能を提供することができる。
上述の各実施の形態は、ネットワークを介してダウンロードした画像データ(画像)に対しても適用することができる。なお、ダウンロードした画像データの解像度が不明であっても、文字サイズを決定して出力解像度を決定することができる。また、クラウド等のサーバから画像データをダウンロードする際、サーバ側で解像度を判定し、圧縮処理された画像データをダウンロードすることもできる。この場合、サーバが本実施の形態の画像処理装置に該当する。また、この場合には、ダウンロードする画像データのデータ量を削減することができる。
上述の各実施の形態は、コンピュータに実行させるためのプログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録したコンピュータ読み取り可能な記録媒体Mに、前述した出力解像度決定処理を行う画像処理を記録することもできる。その結果、前述した出力解像度決定処理を行うプログラムコードを記録した記録媒体Mを持ち運び自在に提供することができる。
なお、本実施の形態では、記録媒体Mとしては、マイクロコンピュータで処理が行われるためにメモリ、例えば、ROMのようなプログラムメディアでもよく、また、図示していないが外部記憶装置としてプログラムコードの読取装置が設けられ、該読取装置に記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。
いずれの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であってもよく、あるいは、いずれの場合もプログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムコードが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
ここで、プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープ又はカセットテープ等のテープ系、フレキシブルディスク又はハードディスク等の磁気ディスク、CD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory:登録商標)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体であってもよい。
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムコードをダウンロードする場合には、ダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであってもよい。なお、本実施の形態は、前述のプログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。また、前述の記録媒体は、デジタルカラー画像形成装置又はコンピュータシステムに備えられるプログラム読取装置により読み取られることで上述した画像処理方法が実行される。
コンピュータシステムは、フラットベッドスキャナ・フィルムスキャナ・デジタルカメラなどの画像入力装置、所定のプログラムがロードされることにより前記画像処理方法など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するCRTディスプレイ・液晶ディスプレイなどの画像表示装置及びコンピュータの処理結果を紙などに出力するプリンタなどにより構成される。さらには、ネットワークを介してサーバなどに接続するための通信手段としてのネットワークカード又はモデムなどを具備する。
本発明の上述の各実施の形態で記載されている技術特徴は、お互いに組み合わせて新しい技術方案を形成することができる。
実施の形態1と同様の部分については、同一の符号を付して詳細な説明を省略する。
本発明の実施態様1においては、画像を構成する文字候補を特定し、該文字候補を用いて文字列を特定し、前記文字候補又は前記文字列に基づいて前記画像の出力に係る出力解像度を決定する画像処理装置において、前記文字候補には、前記文字列を構成しないノイズ文字候補、及び、サイズが所定値以下である小文字候補が含まれ、特定された全ての文字候補の数である全文字候補数、該全文字候補数から前記ノイズ文字候補及び前記小文字候補の数を除く第1有効文字候補数、及び、特定された文字列内に含まれる文字候補の数である第2有効文字候補数を生成する生成部174aと、前記全文字候補数、前記第1有効文字候補数、及び、前記第2有効文字候補数に基づいて、前記出力解像度の適否を判定する適否判定部174とを備えることを特徴とする。
本発明によれば、前記生成部が前記全文字候補数、前記第1有効文字候補数、及び、前記第2有効文字候補数を生成する。前記適否判定部は、前記生成部によって生成された全文字候補数、第1有効文字候補数、及び、第2有効文字候補数に基づいて、前記出力解像度の適否を判定する。
本発明の実施態様2においては、前記適否判定部174は、前記全文字候補数に対する前記第1有効文字候補数の比率と、前記全文字候補数に対する前記第2有効文字候補数の比率とが、共に第1閾値以下であるか否かの第1条件の判定を行い、前記第1条件が充足されていると判定した場合、既に決定された出力解像度を無効化する無効化部174cを備えることを特徴とする。
本発明によれば、前記適否判定部は前記第1条件の判定を行い、前記第1条件が充足されていると判定した場合、前記無効化部は前記既に決定された出力解像度を無効化する。
本発明の実施態様3においては、前記適否判定部174は、前記第1条件が充足されていないと判定した場合、前記全文字候補数に対する前記第1有効文字候補数の比率が第2閾値以下であるか否かの第2条件の判定を行い、前記第2条件が充足されている場合、前記第1有効文字候補数が第3閾値より多く、前記全文字候補数に対する前記第1有効文字候補数の比率が第4閾値より高く、前記第1有効文字候補数に対する前記第2有効文字候補数の比率が第5閾値より低いか否かの第3条件の判定を行い、前記第3条件が充足されていないと判定された場合、前記無効化部174cが前記既に決定された出力解像度を無効化する。
本発明によれば、前記適否判定部は、前記第1条件が充足されていないと判定した場合、前記第2条件の判定を行う。第2条件が充足されている場合、前記第3条件の判定を更に行う。前記第3条件が充足されていないと判定された場合、前記無効化部が前記既に決定された出力解像度を無効化する。
本発明の実施態様4においては、前記適否判定部174は、前記第2条件が充足されていないと判定した場合、前記第2有効文字候補数に対する前記第1有効文字候補数の比率が第6閾値未満であるか否かの第4条件の判定を行い、前記第4条件が充足されていると判定された場合、前記無効化部174cが前記既に決定された出力解像度を無効化することを特徴とする。
本発明によれば、前記適否判定部は、前記第1条件、第2条件が充足されていないと判定した場合、前記第4条件の判定を行う。前記第4条件が充足されていると判定された場合、前記無効化部が前記既に決定された出力解像度を無効化する。
本発明の実施態様5においては、前記適否判定部174は、前記第2条件が充足されていないと判定した場合、前記第1有効文字候補数が第7閾値以下であり、前記第2有効文字候補数における前記小文字候補の比率が第8閾値以上であるか否かの第5条件の判定を行い、前記第5条件が充足されていると判定された場合、前記無効化部174cが前記既に決定された出力解像度を無効化することを特徴とする。
本発明によれば、前記適否判定部は、前記第1条件,第2条件が充足されていないと判定した場合、前記第5条件の判定を更に行う。前記第5条件が充足されていると判定された場合、前記無効化部が前記既に決定された出力解像度を無効化する。
本発明の実施態様6においては、前記適否判定部174は、前記全文字候補数に対する前記第1有効文字候補数の比率と、前記全文字候補数に対する前記第2有効文字候補数の比率とが、共に第1閾値以下であるか否かの第1条件の判定を行い、前記第1条件が充足されていると判定した場合、前記出力解像度を特定解像度に置き換える処理を行うことを特徴とする。
本発明によれば、前記適否判定部は、前記第1条件の判定を行い、前記第1条件が充足されていると判定した場合、特定解像度と前記出力解像度との置き換えを行う。
本発明の実施態様7においては、前記適否判定部174は、前記第1条件が充足されていないと判定した場合、前記全文字候補数に対する前記第1有効文字候補数の比率が第2閾値以下であるか否かの第2条件の判定を行い、前記第2条件が充足されている場合、前記第1有効文字候補数が第3閾値より多く、前記全文字候補数に対する前記第1有効文字候補数の比率が第4閾値より高く、前記第1有効文字候補数に対する前記第2有効文字候補数の比率が第5閾値より低いか否かの第3条件の判定を行い、前記第3条件が充足されていないと判定された場合、前記置き換える処理を行うことを特徴とする。
本発明によれば、前記適否判定部は、前記第1条件が充足されていないと判定した場合、前記第2条件の判定を行い、前記第2条件が充足されている場合、前記第3条件の判定を更に行う。前記第3条件が充足されていないと判定された場合、前記適否判定部は前記置き換えを行う。
本発明の実施態様8においては、前記適否判定部174は、前記第2条件が充足されていないと判定した場合、前記第2有効文字候補数に対する前記第1有効文字候補数の比率が第6閾値未満であるか否かの第4条件の判定を行い、前記第4条件が充足されていると判定された場合、前記置き換える処理を行うことを特徴とする。
本発明によれば、前記適否判定部は、前記第1条件、第2条件が充足されていないと判定した場合、前記第4条件の判定を行い、前記第4条件が充足されていると判定された場合、前記置き換えを行う。
本発明の実施態様9においては、前記適否判定部174は、前記第2条件が充足されていないと判定した場合、前記第1有効文字候補数が第7閾値以下であり、前記第2有効文字候補数における前記小文字候補の比率が第8閾値以上であるか否かの第5条件の判定を行い、前記第5条件が充足されていると判定された場合、前記置き換える処理を行うことを特徴とする。
本発明によれば、前記適否判定部は、前記第1条件、第2条件が充足されていないと判定した場合、前記第5条件の判定を行い、前記第5条件が充足されていると判定された場合、前記置き換えを行う。
本発明の実施態様10においては、前記適否判定部174は、前記第2条件が充足されていないと判定した場合、前記文字候補のサイズに基づいて前記出力解像度毎に該文字候補をカウントしたカウント値が、各出力解像度にて、前記文字列のサイズに基づいて前記出力解像度毎に該文字列をカウントしたカウント値よりも大きいか否かの第6条件の判定を行い、前記第6条件が充足されていると判定された場合、前記置き換える処理を行うことを特徴とする。
本発明によれば、前記適否判定部は、前記第1条件、第2条件が充足されていないと判定した場合、前記第6条件の判定を行い、前記第6条件が充足されていると判定された場合、前記置き換えを行う。
本発明の実施態様11においては、前記適否判定部は、前記第2条件が充足されていないと判定した場合、(I)前記第2有効文字候補数に対する前記第1有効文字候補数の比率が第6閾値未満であるか否かの第4条件の判定、(II)前記第1有効文字候補数が第7閾値以下であり、前記第2有効文字候補数における前記小文字候補の比率が第8閾値以上であるか否かの第5条件の判定、及び(III)前記文字候補のサイズに基づいて前記出力解像度毎に該文字候補をカウントしたカウント値が、各出力解像度にて、前記文字列のサイズに基づいて前記出力解像度毎に該文字列をカウントしたカウント値よりも大きいか否かの第6条件の判定を行い、前記第4条件、前記第5条件及び前記第6条件の全てが充足されていないと判定された場合、前記適否判定部は前記出力解像度の決定を行うことを特徴とする。
本発明によれば、前記適否判定部は、前記第4条件、前記第5条件及び前記第6条件の全てが充足されていないと判定された場合、すなわち、第1条件、第2条件、第4条件、第5条件及び第6条件を充足していない場合、前記出力解像度の決定を行う。
本発明の実施態様12においては、前記無効化部174cが前記既に決定された出力解像度を無効化した場合、前記適否判定部174が前記既に決定された出力解像度より低い解像度を前記出力解像度として決定することを特徴とする。
本発明によれば、前記無効化部によって前記既に決定された出力解像度が無効化された場合には、前記適否判定部は前記既に決定された出力解像度より低い解像度を前記出力解像度として決定する。
本発明の実施態様13においては、上述した発明の何れかに記載の画像処理装置50と、該画像処理装置50によって処理された画像に基づいて、シート状の記録媒体に画像形成を行うことを特徴とする。
本発明によれば、前記画像処理装置によって処理された画像に基づいて、例えば、紙、OHPフィルム等の記録媒体に、該画像に係る画像の形成を行う。
本発明の実施態様14においては、画像を構成する文字候補を特定し、該文字候補を用いて文字列を特定し、前記文字候補又は前記文字列に基づいて前記画像の出力に係る出力解像度を決定する画像処理方法において、前記文字候補には、前記文字列を構成しないノイズ文字候補、及び、サイズが所定値以下である小文字候補が含まれ、特定された全ての文字候補の数である全文字候補数、該全文字候補数から前記ノイズ文字候補及び前記小文字候補の数を除く第1有効文字候補数、及び、特定された文字列内に含まれる文字候補の数である第2有効文字候補数を生成するステップと、前記全文字候補数、前記第1有効文字候補数、及び、前記第2有効文字候補数に基づいて、前記出力解像度の適否を判定するステップとを含むことを特徴とする。
本発明によれば、前記全文字候補数、前記第1有効文字候補数、及び、前記第2有効文字候補数が生成され、前記全文字候補数、前記第1有効文字候補数、及び、前記第2有効文字候補数に基づいて、前記出力解像度の適否の判定が行われる。