(実施の形態1)
以下、本発明を実施の形態を示す図面に基づいて説明する。図1及び図2は実施の形態1の画像形成装置100の構成の一例を示すブロック図である。図1は読み込まれたカラー画像データをカラー画像出力装置2から出力する場合の信号処理を示し、図2は読み込まれたカラー画像データを送信装置3より送信する場合の信号処理を示している。以下の説明では、画像処理システムとしての画像形成装置100について説明する。
画像形成装置100は、カラーコピー機能及びカラースキャナ機能等を有するデジタル複合機である。画像形成装置100は、原稿からカラー画像を光学的に読み取る画像入力装置としてのカラー画像入力装置1を備えている。
カラー画像入力装置1には、読み取ったカラー画像の画像データ、及び圧縮ファイルを生成する画像処理装置としてのカラー画像処理装置50が接続されている。
カラー画像処理装置50には、カラー画像処理装置50が生成した画像データに基づいてカラー画像を出力する画像出力装置としてのカラー画像出力装置2、及びカラー画像処理装置50が生成した圧縮ファイルを外部へ送信する画像出力装置としての送信装置3が接続されている。
すなわち、画像形成装置100は、カラー画像入力装置1、カラー画像処理装置50、カラー画像出力装置2、送信装置3などを備える。また、カラー画像入力装置1、カラー画像処理装置50、カラー画像出力装置2及び送信装置3には、操作パネル4が接続されている。
操作パネル4は、ユーザが画像形成装置100の動作モードを設定するための設定ボタン及びテンキー等の操作部、及び液晶ディスプレイ等で構成される表示部など(いずれも不図示)を備える。画像形成装置100で実行される各種処理は、図示しないCPU(Central Processing Unit)が制御する。画像形成装置100のCPUは、図示しないネットワークカード及びLANケーブルを介して、ネットワークに接続されたコンピュータ及び他のデジタル複合機等とデータ通信を行なう。
以下、画像形成装置100の各部について詳述する。
カラー画像入力装置1は、例えば、CCD(Charge Coupled Device )を有するカラースキャナで構成される。カラー画像入力装置1は、CCDを用いて原稿からの反射光像を8ビット、10ビット等のRGB(R:赤、G:緑、B:青)のアナログ信号として読み取りカラー画像処理装置50へ出力する。すなわち、カラー画像入力装置1で原稿から読み取られる画像データは多値である。以下においては、多値の入力画像データを多値(カラー又はグレースケール)の画像データとして出力する場合の処理について説明する。
カラー画像処理装置50は、カラー画像入力装置1から入力されたRGBのアナログ信号に対して、A/D変換部11、シェーディング補正部12、原稿種別判別部13、入力階調補正部14、及び領域分離処理部15にて各後述する画像処理を実行することによって、RGBのデジタル信号(以下、RGB信号という)からなる画像データを生成する。
また、カラー画像処理装置50は、領域分離処理部15が出力したRGB信号に対して色補正部16、黒生成下色除去部18、空間フィルタ処理部19、出力階調補正部21、及び階調再現処理部22にて各後述する画像処理を実行することによって、CMYK(C:シアン、M:マゼンタ、Y:イエロー、K:ブラック)のデジタル信号からなる画像データを生成して、ストリームとしてカラー画像出力装置2へ出力する。なお、カラー画像出力装置2へ出力される前に、画像データを記憶部24に一旦記憶するようにしてもよい。
記憶部24は、不揮発性の記憶装置(例えばハードディスク)である。また、記憶部24には、後述する出力解像度テーブルが記憶されている。
カラー画像出力装置2は、カラー画像処理装置50から入力された画像データに基づいて、熱転写、電子写真、又はインクジェット等の方式により、記録シート(例えば記録用紙等)上にカラー画像を形成して出力する。
また、カラー画像処理装置50は、領域分離処理部15が出力したRGB信号に対して色補正部16、空間フィルタ処理部19、解像度変換処理部20、出力階調補正部21、及び圧縮処理部23にて各後述する画像処理を実行することによって、RGBのデジタル信号からなる出力画像データ又はグレースケールの画像データを圧縮処理した圧縮データを生成して送信装置3へ出力する。
また、本実施の形態において、解像度変換処理部20で解像度変換処理を行う際には、必要に応じて、処理パラメータ決定部17は変換すべき出力解像度(解像度)を決定し、決定した解像度を解像度変換処理部20へ出力することにより、入力された画像(画像データ)を所望の出力解像度に変換処理することが可能である。
なお、出力画像データ、又は出力画像データを圧縮した圧縮データを送信装置へ出力する前に、一旦記憶部24に記憶するようにしてもよい。
また、図1に示すように、カラー画像入力装置1で読み込まれたカラー画像データをカラー画像出力装置2から出力する場合には、解像度変換処理部20、圧縮処理部23は動作しない。また、図2に示すように、カラー画像入力装置1で読み込まれたカラー画像データを送信装置3より送信する場合、黒生成下色除去部18、階調再現処理部22は動作しない。
送信装置3は、図示しない公衆回線網、LAN(Local Area Network)又はインターネット等の通信ネットワークに接続可能であり、ファクシミリ又は電子メール等の通信方法により、通信ネットワークを介して外部へ圧縮ファイルを送信する。例えば、操作パネル4においてscan to e-mailモードが選択されている場合、圧縮ファイルは、ネットワークカード、モデム等を用いてなる送信装置によってe-mailに添付され、設定された送信先へ送信される。
なお、ファクシミリの送信を行なう場合は、画像形成装置100のCPUが、モデムを用いてなる送信装置3にて、相手先との通信手続きを行ない、送信可能な状態が確保されたときに、圧縮ファイルに対して圧縮形式の変更等の必要な処理を施してから、相手先に通信回線を介して順次送信する。また、ファクシミリを受信する場合、画像形成装置100のCPUは、送信装置3にて通信手続きを行いながら、相手先から送信されてくる圧縮ファイルを受信して、カラー画像処理装置50へ出力する。
カラー画像処理装置50では、受信した圧縮ファイルに対し、不図示の伸張処理部で伸張処理が施される。圧縮ファイルを伸張することによって得られた画像データには、必要に応じて、不図示の処理部で回転処理及び/又は解像度変換処理等が施され、また、出力階調補正部21で出力階調補正が施され、階調再現処理部22で階調再現処理が施される。各種画像処理が施された画像データは、カラー画像出力装置2へ出力され、カラー画像出力装置2にて、記録シート上に出力画像が形成される。
以下、カラー画像処理装置50における画像処理を詳述する。最初に、カラー画像入力装置1から入力された画像データをカラー画像出力装置2に出力する場合の処理について説明する。
A/D変換部11は、カラー画像入力装置1から入力されたRGBのアナログ信号を受け付け、RGBのアナログ信号をRGBのデジタル信号(即ちRGB信号)へ変換し、変換したRGB信号をシェーディング補正部12へ出力する。
シェーディング補正部12は、A/D変換部11から入力されたRGB信号に対して、カラー画像入力装置1の照明系、結像系及び撮像系で生じる各種の歪みを取り除く処理を行なう。そして、シェーディング補正部12は、歪みを取り除いたRGB信号を原稿種別判別部13へ出力する。
原稿種別判別部13は、シェーディング補正部12から入力されたRGBの反射率信号をRGB各色の濃度を示す濃度信号に変換し、文字、印刷写真、又は印画紙写真等の原稿のモードを判別する原稿種別判別処理が実行される。原稿種別判別処理を、ユーザが操作パネル4を用いてマニュアル設定する場合、原稿種別判別部13はシェーディング補正部12から入力されたRGB信号をそのまま後段の入力階調補正部14へ出力する。原稿種別判別処理の処理結果は、後段の画像処理に反映される。
入力階調補正部14は、RGB信号に対して、カラーバランスの調整、下地濃度の除去、及びコントラストの調整等の画質調整処理を行う。入力階調補正部14は、次に、処理を行ったRGB信号を領域分離処理部15へ出力する。
領域分離処理部15は、入力階調補正部14から入力されたRGB信号が表す画像中の各画素を、文字領域、網点領域、又は写真領域のいずれかに分離する。また、領域分離処理部15は、分離結果に基づき、各画素がいずれの領域に属しているかを示す領域識別信号を、黒生成下色除去部18、空間フィルタ処理部19、階調再現処理部22、及び処理パラメータ決定部17へ出力する。
色補正部16は、領域分離処理部15から入力されたRGB信号をCMYのデジタル信号(以下、CMY信号という)へ変換し、色再現の忠実化実現のために、不要吸収成分を含むCMY色材の分光特性に基づいた色濁りをCMY信号から取り除く処理を行なう。そして、色補正部16は、色補正後のCMY信号を黒生成下色除去部18へ出力する。
黒生成下色除去部18は、色補正部16から入力されたCMY信号に基づき、CMY信号から黒(K)信号を生成する黒生成処理と、CMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理とを行なう。この結果、CMY3色のデジタル信号は、CMYK4色のデジタル信号(以下、CMYK信号という)に変換される。そして、黒生成下色除去部18は、CMY信号を変換したCMYK信号を空間フィルタ処理部19へ出力する。
黒生成処理の一例としては、一般に、スケルトン・ブラックによる黒生成を行なう方法が用いられる。この方法では、スケルトン・カーブの入出力特性をy=f(x)、入力されるデータをC、M、Y、出力されるデータをC'、M'、Y'、K'、UCR(Under Color Removal )率をα(0<α<1)とすると、黒生成下色除去処理は、下記の式(1)〜式(4)で表わされる。
式(1):K'=f(min(C、M、Y))
式(2):C'=C−αK'
式(3):M'=M−αK'
式(4):Y'=Y−αK'
ここで、UCR率α(0<α<1)とは、CMYが重なっている部分をKに置き換えてCMYをどの程度削減するかを示すものである。式(1)は、CMYの各信号強度の内の最も小さい信号強度に応じてK信号が生成されることを示している。
空間フィルタ処理部19は、黒生成下色除去部18から入力されたCMYK信号の画像データに対して、領域分離処理部15から入力された領域識別信号に基づいてデジタルフィルタによる空間フィルタ処理を行ない、空間周波数特性を補正することによって、画像のぼやけ又は粒状性劣化を改善する。
例えば、領域分離処理部15にて文字に分離された領域に対しては、空間フィルタ処理部19は、文字の再現性を高めるために、高周波成分の強調量が大きいフィルタを用いて空間フィルタ処理を行なう。また、領域分離処理部15にて網点に分離された領域に対しては、空間フィルタ処理部19は、入力網点成分を除去するためのローパス・フィルタ処理を行なう。
空間フィルタ処理部19は、処理後のCMYK信号を出力階調補正部21へ出力する。
出力階調補正部21は、空間フィルタ処理部19から入力されたCMYK信号に対して、カラー画像出力装置2の特性である網点面積率に基づく出力階調補正処理を行ない、出力階調補正処理後のCMYK信号を階調再現処理部22へ出力する。
階調再現処理部22は、出力階調補正部21から入力されたCMYK信号に対して、領域分離処理部15から入力された領域識別信号に基づいて、領域に応じた中間調処理を行なう。例えば、領域分離処理部15にて文字に分離された領域に対しては、階調再現処理部22は、高域周波成分の再現に適した高解像度のスクリーンによる2値化又は多値化の処理を行なう。また、領域分離処理部15にて網点に分離された領域に対しては、階調再現処理部22は、階調再現性を重視したスクリーンでの2値化又は多値化の処理を行なう。
また、階調再現処理部22は、処理後の画像データをカラー画像出力装置2へ出力する。カラー画像入力装置1から入力された画像データをカラー画像出力装置2に出力する場合、処理パラメータ決定部17、解像度変換処理部20、圧縮処理部23は動作しない。解像度変換処理部20、圧縮処理部23は、入力されたCMYK信号をそのまま後段の処理部に出力する。
次に、カラー画像入力装置1から入力された画像データを送信装置3に出力する場合の処理について説明する。A/D変換部11から領域分離処理部15までの処理は、カラー画像入力装置1から入力された画像データをカラー画像出力装置2に出力する場合の処理と同じであるので説明を省略する。
領域分離処理部15は、入力階調補正部14から入力されたRGB信号を、そのまま後段の色補正部16及び処理パラメータ決定部17へ出力する。
処理パラメータ決定部17は、操作パネル4において自動設定モードでスキャン機能が選択された場合に、解像度変換処理部20で画像データを最適な出力解像度に変換するための出力解像度を決定する。
色補正部16は、領域分離処理部15から入力されたRGB信号を、例えば、一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)へ変換する。
空間フィルタ処理部19は、色補正部16から入力されたR’G’B’信号に対して同様に、領域分離処理部15から入力された領域識別信号に基づいてデジタルフィルタによる空間フィルタ処理を行い、空間周波数特性を補正することによって、画像のぼやけ又は粒状性劣化を改善する。空間フィルタ処理部19は、処理後のR’G’B’信号を解像度変換処理部20へ出力する。
解像度変換処理部20は、処理パラメータ決定部17で決定された所望の出力解像度の画像データになるように解像度変換処理を行う。例えば、単純な例で示すと、スキャナの入力解像度が600×300dpiの画像データで処理パラメータ決定部17が決定する出力解像度が300×300dpiである場合、解像度変換処理部20は、主走査方向の2画素毎に平均値を求め、それを出力値とすることで、600×300dpiから300×300dpiへの解像度変換を行なう。
出力階調補正部21は、解像度変換処理部20から入力されたR’G’B’信号に対して、必要に応じてかぶり又はハイライトの下地が消えるように、あるいは薄くなるように出力階調補正を行い、出力階調補正処理後のR’G’B’信号を圧縮処理部23へ出力する。
圧縮処理部23は、圧縮部としての機能を有し、R’G’B’信号からなる画像データに対して、操作パネル4のファイルフォーマットの設定に従い、必要に応じてJPEGなどの圧縮処理を行い、圧縮データを生成し、送信装置3へ出力する。なお、圧縮処理が施された画像データを送信装置3へ送信する構成に代えて、USBメモリ等の記憶媒体やハードディスクに格納するようにしてもよい。
カラー画像入力装置1から入力された画像データを送信装置3に出力する場合、黒生成下色除去部18、階調再現処理部22は動作しない。黒生成下色除去部18、階調再現処理部22は、入力されたR’G’B’信号をそのまま後段の処理部に出力する。
次に、多値の入力画像データを2値で出力する場合の処理を、図3を用いて説明する。図3は実施の形態1の画像形成装置100の構成の他の例を示すブロック図である。A/D変換部11から解像度変換処理部20までの処理は、多値の入力画像データを多値で出力する場合の処理と同じであるので説明を省略する。
出力階調補正部21は、解像度変換処理部20から入力されたR’G’B’信号に対して、Kの画像データ(グレーの濃淡を示す値)に変換する。なお、この変換は、所定のマトリクス係数、又は、下記の式を用いることによって行われる。
輝度値(Kの画像データの値)=0.299r+0.587g+0.114b
ここで、rは赤の画像データの値(画素値)であり、gは緑の画像データの値であり、bは青の画像データの値である。
出力階調補正部21は、また、Kの画像データに対して2値化処理を施し、中間調生成部25を介して圧縮処理部23へ出力する。2値化を行う閾値としては、画像データが8ビットの場合、128に設定する。あるいは、複数の画素よりなる画素ブロック(例えば、3×3画素)の平均値を求めて閾値とし、ブロックの注目画素を2値化するようにしても良い。しかし、この際、中間調生成部25は何ら動作を行わず、入力されたK信号をそのまま後段の処理部に出力する。
圧縮処理部23は、Kの画像データに対して、MMRなど方式で圧縮処理を行い、圧縮データを生成し、送信装置3へ出力する。
次に、処理パラメータ決定部17について詳述する。図4は実施の形態1の処理パラメータ決定部17の構成の一例を示すブロック図である。処理パラメータ決定部17は、エッジ検出部171、文字矩形抽出部172、文字列抽出部173、解像度決定部174などを備える。処理パラメータ決定部17は、入力されたRGB信号に対してエッジ検出部171でエッジ検出を行い、検出された文字エッジをベースに文字矩形抽出部172で文字矩形を抽出し、文字列抽出部173では抽出された文字矩形をベースに文字列を抽出し、解像度決定部174で文字列又は文字矩形から出力解像度を決定する。また、文字矩形抽出部172は特定情報生成部172aを有している。
図5はエッジ検出部171の処理手順の一例を示すフローチャートである。図5に示すように、エッジ検出部171は、入力されたRGB信号に対してSobel又はLaplacianなどのエッジ検出フィルタを用いてエッジ検出を行う(ステップS11)。エッジ検出部171は、検出されたエッジに対して文字エッジ膨張処理(膨張処理)を行い(ステップS12)、文字エッジ候補を抽出し、処理を終了する。
図6(図6A乃至図6E)はエッジ検出部171によるエッジ検出処理の一例を示す模式図である。図6AはRGB画像データのG信号の一部分(10×10画素)を示している。各枠内の数値は、画素値である。ここではG信号に対する処理のみ説明するが、R信号又はB信号に対しても同様の処理を行う。図6Bはエッジ検出のためのフィルタを示す。該エッジ検出のフィルタとしては、図6Bに示すように、例えば、Laplacianフィルタを用いることができる。なお、エッジ検出のフィルタが図6Bの例に限定されるものではない。
図6Aの太枠で囲まれた、8×8画素に対して、図6Bに示すフィルタによりフィルタ処理した結果を図6Cに示す。図6Cの例に対して、画素値が100以上の画素のみをエッジ画素(値を1とする)として抽出し、画素値が100未満の画素を0としたものを図6Dに示す。すなわち、図6Aの太枠(8×8画素)に対して、斯かる処理を施した場合、図6Dに示す結果が得られる。
図6Dの例(太枠の部分)に対して、文字エッジ膨張(膨張処理)を施した結果を図6Eに示す。膨張処理は、注目画素が0であって、その近傍8画素のうち、2画素以上にエッジ画素(値が1の画素)が存在する場合、その注目画素の値を1とすることにより行われる。図6Eの例を文字エッジ候補とする。
上述のように、エッジ検出の後に膨張処理を行うことにより、図6に示すように、フィルタ処理結果を閾値処理している結果、本来エッジであるにも関わらずエッジであると判定されない画素がある場合、かかる画素を訂正し、精度良くエッジを検出することができる。また、文字を構成する画素のつながりを良くすることができる。
図7は文字矩形抽出部172の処理手順の一例を示すフローチャートである。文字矩形抽出部172(特定情報生成部172a)は、画像に含まれる文字候補(文字矩形とも称する)を特定する文字特定情報(文字矩形情報とも称する)を生成する。文字候補は、1つの文字毎に特定することができる。文字特定情報(文字矩形情報)は、文字候補(文字矩形)を特定するための位置情報であり、例えば、文字矩形の左上及び右下の座標情報、文字矩形の水平方向の寸法(幅)及び垂直方向の寸法(高さ)などを含む。
より具体的には、図7に示すように、文字矩形抽出部172は、エッジ検出部171で出力された文字エッジ候補(例えば、図6Eの例)に対してラベリング処理を行い(ステップS21)、文字矩形(文字候補、文字矩形領域とも称する)を抽出する。
文字矩形抽出部172は、文字矩形を抽出した後、抽出した文字矩形それぞれに対し、近傍の文字矩形サイズと比較する。その結果、サイズの差異が所定値よりも大きく、かつ、近傍に似たような文字矩形が存在しない文字矩形については、文字矩形抽出部172が非文字矩形として除去し(ステップS22)、残った文字矩形を文字矩形情報として、処理を終了する。
図8(図8A乃至図8E)は文字矩形抽出部172による文字矩形抽出処理の一例を示す模式図である。図8Aはエッジ検出部171で抽出されたエッジ検出結果(文字エッジ候補)の例である。なお、図8A及び図6Eは、文字エッジ候補を表すが、図8Aの例と図6Eの例とは便宜上異なっている。
まず、文字矩形抽出部172は、エッジ検出部171で抽出されたエッジ検出結果(文字エッジ候補)に対してラベリング処理を行う。図8Bはラベリング処理を行う際の注目画素と参照画素を示す。図8Bの*で示す画素を注目画素とすると、当該注目画素の近傍の4つの参照画素(符号a、b、c、dで示す)のラベリング値を参照して注目画素の初期ラベルを決定する。具体的には、4つの参照画素にラベル付けした画素が存在しない場合には、注目画素に新たなラベル値を付与する。また、4つの参照画素に複数のラベル値が存在する場合には、その中での最小ラベル値を注目画素に付与する。図8Cは、図8Aに例示したエッジ検出結果(文字エッジ候補)に対して初期ラベルを付与した結果を示す。
また、ラベル値を付与した注目画素の周辺の8画素に複数のラベル値が存在する場合には、注目画素の付与した初期ラベルと、注目画素の周辺の8画素のラベル値のうち最小ラベル値を補正ラベルとして関連付けを行う。図8Dが初期ラベルと補正ラベルとの関連付けを示す例である。すなわち、図8Dは注目画素に初期ラベルを付与した際、注目画素の周辺の8画素に複数のラベルが存在した場合に、その中で最小ラベル値(注目画素に付与した初期ラベル)以外のものと最小ラベル値(初期ラベル)との関連付けを行ったものである。
図8Dによれば、例えば、ラベル3(初期ラベル3)はラベル1(補正ラベル1)と関連があることを示している。また、ラベル6(初期ラベル6)は最初の関連付けの段階ではラベル5(補正ラベル5)と関連があるということになるが、ラベル5はラベル4と関係があるということがわかっているので、最終的にラベル6(初期ラベル6)はラベル4(補正ラベル4)と関連があるということになる。図8Dは、初期ラベルと最終的な最小ラベル値(補正ラベル)との関連を表す。
図8Dに示す初期ラベルと補正ラベルとの対応関係を用いて、図8Cに示す各画素のラベルを参照しつつ、ラベル値が最小ラベル値になるように補正処理を行った結果を図8Eに示す。
また、最小ラベル値になるように補正処理を行う際に同一ラベル値の画素を囲む文字矩形領域の座標の最小値(文字矩形領域の左上の位置)と最大値(文字矩形領域の右下の位置)を求めることにより、同一ラベル値を包含する文字矩形領域の矩形サイズを求める。図8Eの太線が文字矩形領域を示す。図8Eでは、ラベル値が、1、2、4、7の4つの文字矩形領域が例示されている。それぞれの文字矩形領域の最小値(文字矩形領域の左上の位置)と最大値(文字矩形領域の右下の位置)が、各ラベル(図8Eの例では、1、2、4、7)の矩形サイズとなる。
次に、各ラベルに対して文字矩形と判定できないものを排除する。具体的には、水平方向又は垂直方向に長いラベル、例えば、図8Eのラベル4のように水平方向に16画素あり、垂直方向に2画素ある矩形領域は、垂直方向の長さに比べて水平方向の長さが長いため、水平方向の線分の可能性がある。そこで、ラベル4の矩形領域は、文字矩形ではないと判定して排除する。この場合、矩形領域が線分であるか否かを判定するためには、例えば、水平方向の画素数と垂直方向の画素数との差分を算出し、算出した差分が所定の閾値以上(例えば、12画素以上)である場合に線分と判定することができる。
また、求めた矩形領域のうち、サイズが小さすぎる矩形領域、例えば、図8Eのラベル7のように水平方向及び垂直方向それぞれに2画素ずつ合計で4画素しかないものは文字ではなく、汚れなどのノイズ画素(以下、ノイズ矩形とも言う)である可能性がある。そこで、ラベル7の矩形領域は文字矩形ではないと判定して排除する。この場合、矩形領域のサイズが小さいものを判定するためには、例えば、水平方向の画素数と垂直方向の画素数とを加算し、加算した値が所定の閾値以下(例えば6画素以下)である場合にノイズ画素と判定することができる。
また、図8Eには例示していないが、矩形領域のサイズがあまりにも大きすぎるラベル、例えば、入力画像のサイズの1/4程度の大きさの矩形領域などは、文字ではなく画像などの可能性があるため排除することができる。この場合、矩形領域のサイズが大きなものを判定する際には、入力画像の画素数に対する矩形領域の画素数の比率を求め、その比率が所定の閾値以上(例えば、0.25以上)である場合には、当該矩形領域は大きすぎるラベルであると、すなわち文字矩形でないと判定することができる。上述のような非文字矩形除去処理を行うことにより、最終的に図8Eのラベル1とラベル2だけが文字矩形として抽出される。
図9は文字列抽出部173の処理手順の一例を示すフローチャートである。文字列抽出部173は、文字矩形抽出部172(特定情報生成部172a)で生成した文字特定情報(文字矩形情報)に基づいて複数の文字で構成される文字列候補(文字列とも称する)を特定する文字列特定情報(文字列情報とも称する)を生成する。文字列特定情報(文字列情報)は、文字列候補(文字列)を特定するための位置情報であり、例えば、文字列候補の左上及び右下の座標情報、文字列候補の水平方向の寸法(幅)及び垂直方向の寸法(高さ)などを含む。また、文字列特定情報は、文字列の方向(水平方向、垂直方向)を含む。
より具体的には、図9に示すように、文字列抽出部173は、文字矩形抽出部172で出力された文字矩形情報に対して近傍の文字矩形同士の距離を算出し(ステップS31)、近い文字矩形同士を同じ文字列のグループとして統合し、文字列情報を生成する。
文字列抽出部173は、文字矩形が統合された文字列情報に対し、文字列の長さから文字列の方向を推定する(ステップS32)。文字列抽出部173は、さらに、部分的に異なる方向であると判定された文字列、あるいは方向が不定の文字矩形について、異なる方向であると判定された文字列に属する文字矩形又は方向不定の文字矩形を正しい文字列方向に補正できる場合には文字列方向を補正する(ステップS33)。
文字列抽出部173は、補正された文字列の情報から文字列領域を抽出し(ステップS34)、抽出した文字列領域に属さないと判定された文字列については非文字列領域の文字列であるとして除去し(ステップS35)、残ったものを最終的な文字列情報として、処理を終了する。
図10(図10A乃至図10D)は文字列抽出部173による文字列抽出処理の一例を示す模式図である。図10Aは文字矩形抽出部172で抽出された文字矩形抽出結果の一例を示す。図10Aの例では、21個の文字矩形(文字候補)が抽出されている。
図10Aの文字矩形抽出結果に対し、近傍の文字矩形同士の距離を算出する。まず、任意の注目文字矩形に対し、文字列情報として注目文字矩形と同じサイズの文字列サイズを設定する。近傍文字矩形の距離の求め方としては、水平方向に対し、注目文字矩形の右上の頂点座標と近い(例えば、垂直方向に±5画素以内、水平方向に10画素以内の位置にある)左上の頂点座標を持つ文字矩形が存在するかの判定、もしくは、注目文字矩形の右下の頂点座標と近い左下の頂点座標を持つ文字矩形が存在するかの判定をすべての文字矩形の座標情報から探索し、近い位置にある文字矩形を近傍文字矩形として抽出する。
さらに、垂直方向に対し、注目文字矩形の左下の頂点座標と近い(例えば、水平方向に±5画素以内、垂直方向に10画素以内の位置にある)左上の頂点座標を持つ文字矩形が存在するかの判定、もしくは、注目文字矩形の右下の頂点座標と近い右上の頂点座標を持つ文字矩形が存在するかの判定をすべての文字矩形の座標情報から探索し、近い位置にある文字矩形を近傍文字矩形として抽出する。
水平方向及び垂直方向の両方向に近接文字矩形が存在する場合、より近い方の文字矩形を近傍文字矩形として選択する。そして、最終的に抽出された近傍文字矩形をその注目文字矩形と同じグループの文字矩形として統合(同じ文字列であるというラベルを付ける)し、注目文字矩形の文字列サイズに近傍文字矩形を接続した際のサイズを新しい文字列サイズとして文字列情報を更新する。
仮に、近傍文字矩形が存在しない場合には、文字列情報の文字列サイズは文字矩形サイズのままとし、次の注目文字矩形の処理に移る。なお、次の注目文字矩形は、まだ、どの文字列グループにも属していない文字矩形を選択するようにし、最終的に、一度も文字列抽出処理を行っておらず、どの文字列グループにも属していない文字矩形が存在しなくなるまで繰り返し文字列抽出処理を行う。
図10Aに例示した文字矩形に対して、上述の処理を行った結果を図10Bに例示する。図10Bにおいて、太枠で囲まれた部分が抽出された文字列を示す。図10Bの例では、符号1〜6が付された6個のグループの文字列が抽出されている。
文字列抽出処理が完了すると、各グループの文字列の水平方向及び垂直方向のサイズを算出し、サイズが長い方の方向を文字列の方向として設定する。例えば、水平方向に100画素あり、垂直方向に10画素ある文字列の場合、水平方向の文字列と設定する。
また、文字列の水平方向のサイズ及び垂直方向のサイズが同程度である場合(例えば、水平方向が15画素であり、垂直方向が10画素である場合など)、文字列の方向を判定することができないので、当該文字列については文字列方向不定として設定しておく。図10Bの例では、符号1、2、3の文字列の方向は水平方向(水平方向文字列とも称する)であり、符号4、5、6の文字列(文字矩形を含む)は方向不定文字列となる。
すべてのグループの文字列に対して文字列方向を設定した後、文字列方向不定のものに対して、近傍の文字列に係る文字列情報に基づいて、正しい文字列方向に補正する。図10Bの例では、符号4の方向不定文字列は、上側近傍に位置する符号3が付されたグループの文字列とほぼ同じ横位置(例えば、水平位置が±5画素以内)にあり、また、垂直方向の距離も比較的近い(例えば、8画素以下)ので、符号3のグループの文字列と同じ方向の文字列と判定する。これにより、符号4の方向不定文字列は、水平方向の文字列であると補正される。
また、符号5、6の方向不定文字列は、近傍に文字列が存在しないので、方向不定文字列のままとする。
図10Cは図10Bに例示した文字列に対して文字列方向を補正した結果の一例を示す。図10Cにおいて、太枠で囲まれた文字列(符号1、2、3、4)が、文字列方向が定まったものである。
次に、近傍に位置する文字列(近傍文字列とも称する)であってサイズが近いもの、あるいは文字列の開始位置(文字列の左端位置)又は終了位置(文字列の右端位置)が近い(例えば、8画素以内)もの同士でグループ分けを行う。これにより文字列領域を抽出する。図10Cの場合、符号1〜4の文字列が水平方向の文字列であり、文字列の開始位置又は終了位置が近いので、符号1〜4の文字列を同じグループの文字列である文字列領域として抽出する。文字列領域は、方向が同一の1又は複数の文字列を纏めたものである。そして、文字列領域に属していない符号5、6の方向不定文字列を非文字列領域として文字列情報から除去する。文字列領域を抽出し、非文字列領域を除去した結果を図10Dに例示する。すなわち、図10Dに例示する文字列領域には、文字列の方向が定まった文字列(符号1〜4で示す矩形領域)が含まれる。なお、文字列領域が1つも存在しない場合には、文字列が存在しないと判定し、文字列情報をクリアすればよい。
図11は実施の形態1において、解像度決定部174の要部構成を示す機能ブロック図である。解像度決定部174は、取得部174aと、検索部174bと、選択部174cとを有している。
取得部174aは前記画像データの出力に係る出力設定、又は、前記原稿に係る原稿情報を取得する。
前記出力設定は、前記画像データの出力における設定であり、例えば、2値での出力又は多値での出力の何れかの設定、出力するデータ容量の大きさ(ファイルサイズ)を優先又は出力する画質を優先の何れかの設定、又は出力に係る圧縮率の設定等が含まれる。また、前記原稿情報は、斯かる原稿に関する情報であり、例えば、原稿に使われた言語(以下、使用言語と言う。)に係る情報等を含む。
取得部174aは、表示パネル4を介してユーザから受け付けられて、例えば、記憶部24に記憶されている出力設定又は原稿情報を、記憶部24から取得する。また、これに限るものでなく、ACS(自動カラー選択)機能による処理結果を用いるように構成しても良い。
例えば、ユーザによる所定の操作によりACS機能が動作した場合、表示部(図示せず)にて白黒モードの選択を促す表示が行われるので、ユーザがグレースケール(多値)又は2値の何れかを選択することにより、取得部174aが出力設定を取得しても良い。また、画像形成装置100としてグレースケールで出力するか2値で出力するかが予め設定されている場合、取得部174aが上記設定情報を参照して何れか一方を取得するように構成しても良い。
更に、斯かる画像データに対してOCR処理を施すことにより、斯かる原稿の使用言語を判定し、該判定結果を用いて取得部174aが前記原稿情報を取得するように構成しても良い。
また、検索部174bは、記憶部24に記憶されている前記出力解像度テーブルから前記画像データの文字候補に係る文字特定情報に対応する出力解像度を検索する。前記出力解像度テーブルには、取得部174aによって取得される出力設定又は前記原稿情報に応じて、前記文字特定情報及び前記出力解像度が対応付けて記憶されている。
検索部174bは、特定情報生成部172aが生成した文字列特定情報又は文字特定情報に基づいて1又は複数の文字サイズを決定する。例えば、水平方向の文字列候補の高さ又は垂直方向の文字列候補の幅、あるいは文字候補の高さ又は幅の長い方の値に応じて文字サイズ(画素数)を決定する。検索部174bは、決定した文字サイズに基づいて、前記出力解像度テーブルから出力解像度を検索する。
図12は記憶部24に記憶されている出力解像度テーブルの一例を概念的に説明する表である。前記出力解像度テーブルにおいては、前記文字特定情報としての矩形サイズと、前記出力解像度又は前記原稿情報とが対応付けされている。ここで、矩形サイズは、前記文字候補(文字矩形)の幅又は高さの何れか長い方の値である。
図12Aは、出力設定が2値での出力である場合、又は、多値での出力である場合に対する出力解像度テーブルである。また、図12Bは、出力設定として出力に係る圧縮率が異なる場合に対する出力解像度テーブルである。更に、図12Cは、出力設定が、出力するデータ容量の大きさを優先する場合、又は、出力する画質を優先する場合、又は、その中間(通常)の場合に対する出力解像度テーブルである。なお、図12Dは、原稿情報として、使用言語が日本語である場合又は英語である場合に対する出力解像度テーブルである。
図12Aにおいては、多値での出力の場合、2値での出力の場合より、前記出力解像度が低くなるように重み付けされている。すなわち、同一の出力解像度に対して、多値で出力する場合に比べ、2値で出力する場合の方が、より大きい矩形サイズが設定されている。
図12Bにおいては、前記圧縮率が低いほど、前記出力解像度が低くなるように重み付けされている。すなわち、同一の出力解像度に対して、前記圧縮率が高いほど大きい矩形サイズが設定されている。
図12Cにおいては、出力するデータ容量の大きさを優先する場合、すなわち、出力するファイルサイズを小さくすることを優先する場合(ファイルサイズ優先の場合)、出力する画質を優先する場合より、前記出力解像度が低くなるように重み付けされている。すなわち、同一の出力解像度に対して、ファイルサイズ優先の場合に比べ、画質優先の場合に、大きい矩形サイズが設定されている。
図12Dにおいては、視認性の高い使用言語ほど前記出力解像度が低くなるように重み付けされている。上述した、日本語及び英語の例においては、漢字等を含む日本語の方が英語より視認性が低い。従って、同一の出力解像度に対して、使用言語が英語である場合に比べ、使用言語が日本語である場合に、大きい矩形サイズが設定されている。
検索部174bは、取得部174aによって取得された出力設定又は原稿情報、及び、前記出力解像度テーブルに基づいて、前記画像データの文字候補に係る文字特定情報に対応する出力解像度を検索する。
検索部174bによって前記出力解像度テーブルから検索された出力解像度が1つである場合は、該出力解像度が最適出力解像度として取り扱われる。
しかし、検索部174bによって複数の出力解像度が検索された場合、選択部174cは検索された出力解像度夫々に対応する文字候補の数に基づき、いずれかの検索された出力解像度を選択し、最適出力解像度として選択する。斯かる選択の方法についての詳細は後で詳しく説明する。
図13は解像度決定部174の処理手順の一例を示すフローチャートである。以下、読み取った画像データに対して解像度決定部174が最適出力解像度を決定する場合の処理について説明する。解像度決定部174の取得部174aが上述したように出力設定又は原稿情報を取得し、該出力設定又は該原稿情報に応じて、文字矩形抽出部172(特定情報生成部172a)で生成した文字特定情報(文字矩形情報)に基づき、検索部174bが出力解像度を前記出力解像度テーブルから検索し、選択部174cが最適出力解像度を決定する。
まず、取得部174aは出力設定又は原稿情報を取得する(ステップS41)。取得部174aによる出力設定又は原稿情報の取得処理については既に説明しており、詳しい説明は省略する。
次いで、解像度決定部174は、条件1の判定を行う(ステップS42)。条件1は、文字列が存在するという条件、あるいは文字列情報が存在するという条件である。
条件1を充足すると判定した場合(ステップS42:YES)、検索部174bは、文字列情報を用いて各グループの文字列の矩形サイズを決定し、決定された矩形サイズに対応する出力解像度を検索する(ステップS43)。該検索は前記出力解像度テーブルに基づいて行われる。
以下、ステップS43での処理について詳しく説明する。
図14(図14A及び図14B)は前記文字列特定情報及び前記文字特定情報の一例を示す例示図である。図14Aは文字列抽出部173で抽出した文字列特定情報の一例であり、図14Bは文字矩形抽出部172で抽出した文字特定情報の一例である。
説明の便宜上、以下においては、当該画像データの文字列特定情報及び文字特定情報が図14と同様であり、多値での出力という出力設定が取得部174aによって取得された場合を例に挙げて説明する。
図14Aに例示する文字列情報が存在する場合には、前述の条件1を充足する(ステップS42:YES)。条件1を充足する場合、検索部174bは、水平方向の文字列の高さ又は垂直方向の文字列の幅に基づいて決定した矩形サイズが、いずれの出力解像度テーブルの文字サイズに相当するかを判定し、当該出力解像度テーブルから該矩形サイズに対応する出力解像度を検索する。
例えば、図14Aにおいて、文字列ラベル1の文字列の場合、文字列の高さ(ey−sy)、すなわち、文字列に含まれた文字候補(文字矩形)の高さが50であり、文字列ラベル1の文字列の矩形サイズは50となる。
また、本実施例においては、多値にて出力されるので(出力設定)、検索部174bは、図12Aの出力解像度テーブルから、「多値」での出力であり、かつ、矩形サイズ「50」に対応する出力解像度を検索する。結果として「150×150dpi」の出力解像度が検索される。
この際、選択部174cは、文字列ラベル1の文字列に含まれる前記ノイズ矩形を除いた文字候補(文字矩形)の数をカウントして150×150dpiに対応付けて、例えば、記憶部24に一時的に記憶する。
他の文字列ラベル2〜9に対しても同様の処理が施される。文字列ラベル2〜9においては文字列の高さ(矩形サイズ)が30であるので、図12Aの出力解像度テーブルから、「200×200dpi」の出力解像度が検索される。
また、選択部174cは、文字列ラベル2〜9の文字列に含まれる前記ノイズ矩形を除いた文字候補(文字矩形)の数をカウントして200×200dpiに対応付けて、例えば、記憶部24に一時的に記憶する。
次いで、選択部174cは前記検索された出力解像度から何れかの検索された出力解像度を選択し、最適出力解像度として決定する(ステップS44)。以下、選択部174cによる最適出力解像度の決定について詳しく説明する。
図15は検出された出力解像度と、カウントされた文字候補(文字矩形)の数との関係を示すグラフである。以下、カウントされた文字候補(文字矩形)の数をカウント値と称す。説明の便宜上図15の場合を例に説明する。
図15は、出力解像度が150×150dpi、200×200dpi及び300×300dpiである場合における、カウント値を示している。また、出力解像度が150×150dpiである場合のカウント値は150であり、出力解像度が200×200dpiである場合のカウント値は550であり、かつ出力解像度が300×300dpiである場合のカウント値は300であるものとし、全てのカウント値の和は1000であるとする。
選択部174cは、最適出力解像度を決定する際、例えば、検出された最も高い出力解像度から、各出力解像度に対応する文字候補の数を順次加算し、斯かるカウント値と前記文字候補の全ての数との比率が所定の閾値以上になる場合、最後に加算した文字候補に係る検索された出力解像度を、最適出力解像度として選択する。
例えば、前記閾値が0.5である場合、最も高い出力解像度の300×300dpiの場合の前記比率は0.3である。一方、最も高い出力解像度に対応する文字候補の数を、次に高い出力解像度(200×200dpi)に対応する文字候補の数に加算した場合のカウント値に係る前記比率は0.85であり閾値0.5を超える。従って、この際において最後に加算されたカウント値(文字候補)に係る出力解像度の「200×200dpi」が、選択部174cによって最適出力解像度として選択される。
また、本発明において、最適出力解像度を決定する方法はこれに限るものでなく、最も高いカウント値に係る出力解像度が最適出力解像度として選択されるように構成しても良い。
このように、最適出力解像度が決定された場合、解像度決定部174は、最適出力解像度の決定の結果を出力し(ステップS45)、処理を終了する。
一方、条件1を充足しない場合(ステップS42:NO)、解像度決定部174は、条件2の判定を行う(ステップS46)。条件2は、文字候補(文字矩形)が存在するという条件、あるいは文字矩形情報(文字特定情報)が存在するという条件である。
条件2を充足すると判定した場合(ステップS46:YES)、検索部174bは、文字特定情報(文字矩形情報)を用いて文字候補(文字矩形)の矩形サイズを決定し、決定された矩形サイズに対応する出力解像度を検索する(ステップS47)。該検索は前記出力解像度テーブルに基づいて行われる。
以下、ステップS47での処理について詳しく説明する。
例えば、図14Bに例示する文字特定情報が存在する場合には、前述の条件2を充足すると判定される(ステップS46:YES)。図14Bの文字矩形情報は、文字矩形(文字候補)のラベル番号、文字矩形の左上の座標情報(sx、sy)、文字矩形の右下の座標情報(ex,ey)、その文字矩形が属する文字列のラベル番号(0の場合はどの文字列にも属さない文字矩形)から構成されている。なお、文字列が存在せず、文字矩形のみの場合には、文字列番号は全て0となる。
検索部174bは、文字矩形の高さ(ey−sy)と幅(ex−sx)とを求め、高さと幅との何れか長い方を文字の矩形サイズとして選択し、ノイズ矩形および、サイズ小矩形(例えば、5以下)で無い場合に、文字矩形サイズが、いずれの出力解像度テーブルの文字サイズに相当するかを判定し、矩形サイズ別に当該出力解像度テーブルから出力解像度を検索する。検索部174bによる出力解像度の検索については、ステップS43にて既に説明しており、詳しい説明を省略する。
次いで、選択部174cは前記検索された出力解像度から何れかの検索された出力解像度を選択し、最適出力解像度として決定する(ステップS48)。以下、選択部174cによる最適出力解像度の決定については、ステップS44にて既に説明しており、詳しい説明を省略する。
このように、最適出力解像度が決定された場合、解像度決定部174は、最適出力解像度の決定の結果を出力し(ステップS49)、処理を終了する。
文字特定情報が存在しない場合には、前述の条件2を充足しないと判定され(ステップS46:NO)、解像度決定部174は予め設定されている出力解像度を出力する(ステップS50)。すなわち、記憶部24には解像度判定不可時のための出力解像度が予め記憶されており、この際、選択部174cは、該解像度判定不可時のための出力解像度を最も高い出力解像度として選択する。この時の出力解像度は常に固定値でも良いし、目的に応じて予めデフォルト値を設定できるようにしても良い。
また、出力解像度の変換は、読み取った画像データを格納しておき、以下の2通りの方法で行うことができる。第1の方法は、1パススキャンを用いる方法であり、出力解像度を推定し、補間演算により主走査方向及び副走査方向の出力解像度を設定する。第2の方法は、2パススキャンを用いる方法であり、出力解像度を推定し、スキャナの読み取り速度を変更して再度原稿の読み取りを行う。この場合、副走査方向の出力解像度は光学的に変更し、主走査方向の出力解像度は補間演算により設定する。
本実施の形態においては、視認性が高い使用言語として英語を、視認性が低い使用原稿として日本語を例にあげて説明したが、本発明はこれに限るものでない。他に、視認性が低い使用原稿として韓国語、中国語等を追加することができ、視認性が高い使用言語としてはフランス語、ドイツ語等を追加することが出来る。従って、これら使用言語に対しても、上述したように、使用言語が日本語又は英語である場合と同様に取り扱われるように構成しても良い。
(実施の形態2)
また、本発明は以上の記載に限るものでない。例えば、斯かる原稿に日本語と英語とが混在している場合を想定し、このような場合に対応できるように画像形成装置100を構成しても良い。
例えば、英語と日本語とが混在している原稿(以下、日英混在原稿)において、該日英混在原稿を日本語に設定した場合は、高解像度よりの判定がされる為に、出力画像への視認性への影響度は少ない。しかし、該日英混在原稿を英語に設定した場合は、低解像度よりの判定がされる為に、出力画像において、漢字等の視認性が低下し読めなくなる場合が発生する可能性がある。従って、入力原稿の言語設定で、英語が選択された場合は、斯かる原稿が日英混在原稿であるときは、日本語への設定を選択するよう、ユーザに注意を促す表示を行う構成であってもよい。
また、以上の記載に限るものでなく、例えば、OCR処理の結果を用いて、前記日英混在原稿に対応できるように画像形成装置100を構成しても良い。
詳しくは、英語辞書データと、入力原稿より1文字単位で抽出した文字特徴量とをマッチングし、最も高い一致度を示した値を文字信頼度として、文字毎に設定する。次に、各文字に対する信頼度が、所定の値よりも大きい文字の数をカウントし、そのカウント数が、全文字数に対して占める割合が、所定の割合よりも高い場合は、英語原稿として以降の処理を行い、所定の割合よりも低い場合は、日本語原稿として以降の処理を行うように構成すれば良い。
(実施の形態3)
また、以上においては、何れかの出力設定を取得した場合、又は原稿情報を受け付けた場合を例に挙げて本発明を説明したが本発明はこれに限るものでない。以上においては、出力設定として3つの設定が挙げられており、原稿情報として1つの例が開示されている。しかし、原稿に係る設定が、これら4つの設定からなる組み合わせの場合も想定できる。斯かる例としては、出力設定と原稿情報との組み合わせの場合が想定できる。そこで、実施の形態3に係る画像形成装置100においては、このような設定の組み合わせにも対応できるように構成されている。
図16は記憶部24に記憶されている出力解像度テーブルの他の例を概念的に説明する表である。図16の出力解像度テーブルにおいては、前記出力設定及び前記原稿情報の組み合わせと、前記出力解像度とが対応付けされている。図16Aは、使用言語が日本語であるとの原稿情報と出力設定との組み合わせを示しており、図16Bは、使用言語が英語であるとの原稿情報と出力設定との組み合わせを示している。
例えば、検索部174b及び選択部174cは、図16A及び図16Bの何れかの出力解像度テーブルに基づいて、斯かる画像データの文字候補に係る文字特定情報に対応する出力解像度を適宜検索し、最適出力解像度を決定する。
(実施の形態4)
図17は実施の形態4の画像読取装置120の構成の一例を示すブロック図である。画像読取装置120は、多値の画像データを出力する。画像形成装置100は、カラー画像入力装置1、カラー画像処理装置50、送信装置3などを備える。
カラー画像処理装置50は、A/D変換部11、シェーディング補正部12、原稿種別判別部13、入力階調補正部14、領域分離処理部15、色補正部16、空間フィルタ処理部19、解像度変換処理部20、出力階調補正部21、圧縮処理部23、記憶部24、処理パラメータ決定部17などを備える。
カラー画像入力装置1は、例えば、CCD(Charge Coupled Device )を有するカラースキャナで構成される。カラー画像入力装置1は、CCDを用いて原稿からの反射光像を8ビット又は10ビットのRGB(R:赤、G:緑、B:青)のアナログ信号として読み取りカラー画像処理装置50へ出力する。
カラー画像入力装置1にて読み取られたアナログ信号は、カラー画像処理装置50内を、A/D変換部11、シェーディング補正部12、原稿種別判別部13、入力階調補正部14、領域分離処理部15、色補正部16、処理パラメータ決定部17、空間フィルタ処理部19、解像度変換処理部20、出力階調補正部21、圧縮処理部23の順で送られる。なお、各部の処理は実施の形態1の場合と同様なので説明は省略する。また、画像読取装置としてデジタルカメラを用いることもできる。
次に、多値の入力画像データを2値で出力する場合の処理を、図18に示す。図18は実施の形態4の画像読取装置120の構成の一例を示すブロック図である。なお、各部の処理は実施の形態1の場合と同様なので説明は省略する。
図19は実施の形態1乃至実施の形態4での解像度の設定方法の一例を示す模式図である。実施の形態1乃至実施の形態4の画像形成装置100、画像読取装置120において、スキャン機能における手動の設定モードでは、例えば、図19Aのように、前記表示部を介して解像度をユーザが適宜設定する必要がある。その他にも、カラー設定、原稿モード設定、ファイルフォーマット設定、圧縮率設定などの種々の設定項目が存在する。
本実施の形態の画像形成装置100は、例えば、前記自動設定モードでは、図19Bのような操作画面を用意し、スキャン開始ボタンを押すだけで、図19Aの解像度の設定を含む他の設定(例えば、天地方向、白紙スキップなどの処理設定)を自動的に行い、最適なスキャンデータが取得できる。自動的に行われる設定には、例えば、カラーについてはACS(Auto Color Select)という機能が既に一般的に使われており、当該機能を用いることで自動的にカラー設定を行うことができる。
図20は実施の形態1に係る画像形成装置100及び実施の形態4に係る画像読取装置120において、前記出力設定又は前記原稿情報の入力をユーザから受け付ける入力画面を示す模式図である。例えば、図19Bに示すように、「設定入力」ボタンがある場合には、ユーザが「設定入力」ボタンを押すことにより、図20に示すような、設定入力画面が表示される。ユーザは該設定入力画面を適宜操作することにより前記出力設定(図20中、モード、圧縮率、出力形式)又は前記原稿情報(図20中、原稿言語)を入力できる。なお、出力形式として、カラー又はグレースケールを選択すると、画像データは多値で出力され、白黒2値を選択すると画像データは2値で出力される。
上述の各実施の形態は、ネットワークを介してダウンロードした画像データ(画像)に対しても適用することができる。なお、ダウンロードした画像データの解像度が不明であっても、文字サイズを決定して出力解像度を決定することができる。また、クラウド等のサーバから画像データをダウンロードする際、サーバ側で解像度を判定し、圧縮処理された画像データをダウンロードすることもできる。この場合、サーバが本実施の形態の画像処理装置に該当する。また、この場合には、ダウンロードする画像データのデータ量を削減することができる。
上述の各実施の形態は、コンピュータに実行させるためのプログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録したコンピュータ読み取り可能な記録媒体Mに、前述した最適出力解像度の決定処理を行う画像処理を記録することもできる。その結果、前述した最適出力解像度の決定処理を行うプログラムコードを記録した記録媒体Mを持ち運び自在に提供することができる。
なお、本実施の形態では、記録媒体Mとしては、マイクロコンピュータで処理が行われるためにメモリ、例えば、ROMのようなプログラムメディアでもよく、また、図示していないが外部記憶装置としてプログラムコードの読取装置が設けられ、該読取装置に記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。
いずれの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であってもよく、あるいは、いずれの場合もプログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムコードが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
ここで、プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープ又はカセットテープ等のテープ系、フレキシブルディスク又はハードディスク等の磁気ディスク、CD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory:登録商標)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体であってもよい。
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムコードをダウンロードする場合には、ダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであってもよい。なお、本実施の形態は、前述のプログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。また、前述の記録媒体は、デジタルカラー画像形成装置又はコンピュータシステムに備えられるプログラム読取装置により読み取られることで上述した画像処理方法が実行される。
コンピュータシステムは、フラットベッドスキャナ・フィルムスキャナ・デジタルカメラなどの画像入力装置、所定のプログラムがロードされることにより前記画像処理方法など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するCRTディスプレイ・液晶ディスプレイなどの画像表示装置及びコンピュータの処理結果を紙などに出力するプリンタなどにより構成される。さらには、ネットワークを介してサーバなどに接続するための通信手段としてのネットワークカード又はモデムなどを具備する。
本発明の上述の各実施の形態で記載されている技術特徴は、お互いに組み合わせて新しい技術方案を形成することができる。
実施の形態1と同様の部分については、同一の符号を付して詳細な説明を省略する。
本発明の実施態様1においては、原稿の画像データの出力処理に係る出力解像度を定める画像処理装置において、前記画像データに含まれる文字候補を特定する文字特定情報を生成する特定情報生成部と、出力に係る出力設定、又は、前記原稿に係る原稿情報を取得する取得部と、前記出力設定又は前記原稿情報に応じて前記文字特定情報及び前記出力解像度を対応付けたテーブルを記憶している記憶部と、前記取得部によって取得された出力設定又は原稿情報に応じて、前記特定情報生成部によって生成される文字特定情報に対応する出力解像度を前記テーブルから検索する検索部とを備えることを特徴とする。
本発明によれば、前記特定情報生成部が前記画像データに含まれる文字候補を特定する文字特定情報を生成し、前記取得部が前記出力設定又は前記原稿情報を取得し、前記記憶部のテーブルに基づき、前記検索部が前記取得部によって取得された出力設定又は原稿情報に応じて、前記特定情報生成部によって生成された文字特定情報に対応する出力解像度を検索する。
本発明の実施態様2においては、複数の出力解像度が検索された場合、検索された出力解像度夫々に対応する文字特定情報に係る文字候補の数に基づいて、いずれかの検索された出力解像度を選択する選択部を備えることを特徴とする。
本発明によれば、複数の出力解像度が検索された場合、前記選択部は検索された出力解像度夫々に対応する文字特定情報に係る文字候補の数に基づいて、いずれかの検索された出力解像度を最適出力解像度として選択する。
本発明の実施態様3においては、前記出力設定は、2値での出力又は多値での出力の何れかの設定を含み、前記テーブルは、多値での出力の場合、2値での出力の場合より、前記出力解像度が低くなるように設定されていることを特徴とする。
本発明によれば、前記出力設定は、例えば、2値での出力又は多値での出力の何れかの設定であり、前記テーブルは、多値での出力の場合、2値での出力の場合より、前記出力解像度が低くなるように設定され、文字の視認性を確保しつつ、データ容量の大きさを抑える。
本発明の実施態様4においては、前記出力設定は、出力するデータ容量の大きさを優先又は出力する画質を優先の何れかの設定を含み、前記テーブルは、出力するデータ容量の大きさを優先する場合、出力する画質を優先する場合より、前記出力解像度が低くなるように設定されていることを特徴とする。
本発明によれば、前記出力設定は、例えば、出力するデータ容量の大きさを優先又は出力する画質を優先の何れかの設定であり、前記テーブルは、出力するデータ容量の大きさを優先する場合、出力する画質を優先する場合より、前記出力解像度が低くなるように設定され、ユーザの指示に応じてデータ容量の大きさを抑えることができる。
本発明の実施態様5においては、前記出力設定は、出力に係る圧縮率の設定を含み、前記テーブルは、前記圧縮率が低いほど、前記出力解像度が低くなるように設定されていることを特徴とする。
本発明によれば、前記出力設定は、例えば、出力に係る圧縮率の設定であり、前記テーブルは、前記圧縮率が低いほど、前記出力解像度が低くなるように設定され、文字の視認性の確保と圧縮率との釣り合いを図る。
本発明の実施態様6においては、前記原稿情報は、使用言語に係る情報を含み、前記テーブルは、視認性の高い使用言語ほど前記出力解像度が低くなるように設定されていることを特徴とする。
本発明によれば、前記原稿情報は、例えば、使用言語に係る情報であり、前記テーブルは、視認性の高い使用言語ほど前記出力解像度が低くなるように設定され、文字の視認性を確保している。
本発明の実施態様7においては、前記選択部は、検索された最も高い出力解像度から、それぞれ検索された出力解像度に対応する文字候補の数を順次加算し、加算値と前記文字候補の全ての数との比率が所定の閾値以上になる場合、最後に加算した文字候補に係る検索された出力解像度を選択することを特徴とする。
本発明によれば、前記選択部は、検索された最も高い出力解像度から、それぞれ検索された出力解像度に対応する文字候補の数を順次加算していき、加算値と前記文字候補の全ての数との比率が所定の閾値以上になる場合、最後に加算した文字候補に係る検索された出力解像度を最適出力解像度として選択する。
本発明の実施態様8においては、前記画像データは前記文字候補を含む文字列を有しており、前記検索部は前記文字列の文字候補に係る文字特定情報に基づいて前記出力解像度を検索することを特定する。
本発明によれば、前記文字列に係る出力解像度を検索する場合、前記検索部は前記文字列の文字候補に係る文字特定情報に基づいて前記出力解像度を検索する。
本発明の実施態様9においては、前記実施態様の何れかに記載の画像処理装置を備え、該画像処理装置によって処理された画像データに基づいて、シート状の記録媒体に画像形成を行うことを特徴とする。
本発明によれば、前記画像処理装置によって定められた最適出力解像度を用いて出力に係る処理が施された画像データに基づいて、例えば、シート状の記録用紙に画像形成が行われる。
本発明の実施態様10においては、原稿の画像データの出力処理を行う画像処理装置にて該出力処理に係る出力解像度を定める解像度決定方法において、前記画像データに含まれる文字候補を特定する文字特定情報を生成し、出力に係る出力設定、又は、前記原稿に係る原稿情報を取得し、前記出力設定又は前記原稿情報に応じて前記文字特定情報及び出力解像度を対応付けたテーブルに基づき、取得された出力設定又は原稿情報に応じて、生成された文字特定情報に対応する出力解像度を検索することを特徴とする。
本発明によれば、前記文字特定情報が生成され、前記出力設定又は前記原稿情報が取得され、前記テーブルに基づき、取得された出力設定又は原稿情報に応じて、生成された文字特定情報に対応する出力解像度が検索される。