JP3820751B2 - 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 - Google Patents
画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP3820751B2 JP3820751B2 JP17177298A JP17177298A JP3820751B2 JP 3820751 B2 JP3820751 B2 JP 3820751B2 JP 17177298 A JP17177298 A JP 17177298A JP 17177298 A JP17177298 A JP 17177298A JP 3820751 B2 JP3820751 B2 JP 3820751B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- region
- line drawing
- gradation
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Image Input (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
Description
【発明の属する技術分野】
この発明は画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体に関し、特に入力された画像データの領域判別を行ない、領域ごとにデータの圧縮を行なった後に出力する画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
特開平8−123958号公報は、人間の知覚に基づき、画像データから領域を抽出し、領域の一部または全部を色変換することで画質劣化を抑えながらデータ量の削減を行なう技術を開示する。また、撮像された画像の圧縮を行なう画像処理装置が知られている。
【0003】
【発明が解決しようとする課題】
この発明は、そのような従来の技術を改良するためになされたものであり、画像の圧縮率と画質の向上を図ることができる画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体を提供することを目的としている。
【0004】
【課題を解決するための手段】
上記目的を達成するため、この発明のある局面に従うと、画像処理装置は、入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別する第1の判別手段と、線画領域と、写真領域のそれぞれについて階調領域を判別する第2の判別手段と、線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくする平滑化手段とを備える。
【0005】
好ましくは、画像処理装置は、入力された画像から第1の判別手段により判別される線画領域および写真領域について単色領域を判別する第3の判別手段と、判別された単色領域において単色化を行なう単色化手段とをさらに備える。
【0006】
さらに好ましくは、画像処理装置は、平滑化または単色化が行なわれた領域の圧縮を行なう圧縮手段をさらに備える。
【0008】
この発明のさらに他の局面に従うと画像処理方法は、入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別するステップと、線画領域と、写真領域のそれぞれについて階調領域を判別するステップと、線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくするステップとを備える。
【0010】
この発明のさらに他の局面に従うと画像処理プログラムを記録した記録媒体は、入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別するステップと、線画領域と、写真領域のそれぞれについて階調領域を判別するステップと、線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくするステップとをコンピュータに実行させることを特徴とする。
【0012】
これらの発明によると、階調領域の平滑化、単色領域の単色化が行なわれるため、画像の圧縮率と画質の向上とを図ることができる。
【0013】
すなわち、ノイズや印刷上の網点などに起因する高周波成分によって画像の画質や圧縮率が低下するが、本願発明では画像のむらや小さな孤立点を消去することができるため、画像の圧縮率と画質の向上とが図られる。
【0014】
【発明の実施の形態】
以下、本発明の実施の形態の一例における画像処理装置を備えたデジタルカメラについて図面を参照しながら説明する。
【0015】
[第1の実施の形態]
図1は、デジタルカメラ1が雑誌などの文字原稿2を撮像している状況を示す図である。本実施の形態では、文字原稿から、その文字原稿をプリントした元の電子データを復元あるいは推定することにより、高い圧縮率で圧縮を行なって、データを保存および転送に適したものとすることを目的としている。この際、必要であれば元の電子データに含まれるノイズなども除去される。
【0016】
図2は、デジタルカメラ1の前方からの斜視図であり、図3は、デジタルカメラ1のカメラバックである。図を参照して、デジタルカメラ1は、撮影ボタン3と、撮影レンズ部4と、カード挿入口5と、電源ボタン6と、文書補正指定スイッチ7と、液晶などよりなるファインダ用モニタ8とを備える。
【0017】
デジタルカメラ1による撮影結果は、デジタルカメラ1の内部に存在する図示しないハードディスクカードに電子データとして記憶される。ここでハードディスクカードは画像データの記録媒体であり、たとえばPCMCIAに準拠したハードディスクカードのようなものを用いても良いし、これに代えてメモリカードなどを用いてもよい。また、ミニディスク(MD)を記録媒体に用いてもよい。さらに、カードを記録媒体としなくても、たとえばSCSIケーブルなどでデジタルカメラ1をプリンタなどに直接接続するようにしてもよい。
【0018】
本実施の形態におけるデジタルカメラ1では、文書補正指定スイッチ7をオンとすることによって、会議などで配付された資料、カタログ、雑誌、研究記録などの紙原稿を電子データとして保存する場合の画質と圧縮率とを向上させることができる。
【0019】
すなわち、通常のデジタルカメラでこのような紙原稿を撮像する場合には以下のことが問題となる。
【0020】
・照明条件などに依存する露出ずれ、色ずれ、シェーディング
・紙質、照明、CCDの特性などに依存するダイナミックレンジの縮小
・入力系に依存する歪み
・CCD画素数に依存する解像度の低下
・被写体の位置、種類を限定しないことによって生じる、あおりや回転ずれ
・原稿自体が有する解像度の制限に依存する、むらや網点の存在
また、データの保存や転送を考慮した場合、圧縮効率が問題となり、電子データを複数回再圧縮することを想定した場合、画像特性と圧縮方法との組合せによっては画質に激しい劣化が生じ得る。すなわち、通常のデジタルカメラでは、圧縮方法の選択に依存する画質的な問題も生じる。さらに、ノイズによって画質や圧縮効率がともに低下することも問題となる。
【0021】
本実施の形態におけるデジタルカメラ1では、文書補正指定スイッチ7をオンとすることで、このような問題を解決することができる。
【0022】
デジタルカメラ1は、画像に含まれる各々の領域の属性(特性)を判別し、各属性に適した補正処理や圧縮処理を行なう。一般に画像の圧縮単位は矩形であるため、矩形のマクロ領域単位で領域の判別をすることが必要となる(マクロ領域判別)。また、マクロ領域ごとに最適な補正を行なうためには、マクロ領域内の局所的な領域の判別(局所領域判別)が必要となる。これらを行なうことによって圧縮効率の向上や画質の向上が達成される。
【0023】
図4は、デジタルカメラ1の回路構成を示すブロック図である。図を参照して、デジタルカメラ1はデジタルカメラ1の全体の制御を行なうCPU111と、撮像を行なうCCD部109と、撮像された内容を表示する表示部(ファインダ用モニタ8を含む)117と、CCD部109からのデータを一時記憶するRAM101と、撮像されたデータの幾何学的な補正などを行なう前処理部103と、撮像された画像のマクロ領域を判別するマクロ領域判別部105と、マクロ領域内に含まれる局所領域を判別する局所領域判別部107と、局所領域に対し適切な補正を行なう適応補正部113と、マクロ領域ごとに圧縮を行なう圧縮部119と、文字領域を処理する文字処理部115と、圧縮が行なわれた画像を統合し出力する画像統合部127と、画像データを記録するカードメモリ部125と、撮影のための各種定数を演算するAWB、AEなど演算部123と、撮影ボタン3を含む各種ボタン121とを備える。
【0024】
なお、デジタルカメラ1のCPU111に外部記憶装置129を設け、CD−ROM131やフロッピィディスク133からデジタルカメラ1の制御のためのプログラムを読取るようにしてもよい。
【0025】
次に、図4に示されるブロック図を用いて実際の撮影の様子を説明する。図4において太い矢印は画像データの流れを示し、細い矢印は制御データの流れを示している。ユーザがカメラの電源をONにすると、ファインダ用モニタ8には撮影レンズ部4が捉えているシーンが、CCD部109を介してそのまま映される。
【0026】
ユーザは、紙原稿を撮影するのか風景や人物を撮影するのかを文書補正指定スイッチ7により設定する。CPU111は、撮影ボタン3がONになったことを検出したのであれば、CCD部109に対してCCDの積分を指示し、積分が終了すればCCDデータのRAM101へのダンプを行なう。そして、ファインダ用モニタ8にこの画像を表示(フリーズ表示)させる。
【0027】
CCD部109からの画像データは、RAM101に記憶される。文書補正指定スイッチ7がONであれば、デジタルカメラ1は文書補正モードに移行し、文書補正を行なった後PDFなどの領域ごとに異なる圧縮方法を指定できる形式のデータを作成する。
【0028】
一方、文書補正指定スイッチ7がOFFであればデジタルカメラ1は風景モードに移行し、そのままJPEGなどの画像圧縮データを作成する。各モードでのデータ作成後に、CPU111はカードメモリ部125にカードメモリへの記憶を指示する。カードメモリ部125はハードディスクなどであっても外部の記憶装置や端末などであってもよい。また、圧縮を行なわずに画像データをプリンタやモニタに出力することもできる。さらに以下に述べるマクロ領域判別、局所領域判別、適応補正処理はデジタルカメラ1の内部で行なってもよいし、デジタルカメラ1に接続された別のカメラやパーソナルコンピュータの端末などにデータを転送してそこで行なってもよい。
【0029】
次に文書補正指定スイッチ7がONである場合の処理の流れを示す。
図5は、文書補正指定スイッチ7がONである場合の全体の処理の流れを示すフローチャートである。図を参照して、撮像により得られた画像データが入力されると(S1)、そのデータには前処理が施される(S3)。次に、画像データに対しマクロ領域判別が行なわれる(S5)。これにより、画像データは文字領域、線画領域、または写真領域に分割される。文字領域に対しては、解像度変換、文字補正、2値化などの処理が行なわれる(S9)。その後、文字領域は2値圧縮される(S11)。また、文字領域に対しては、OCRを行ない、キャラクタコードに変換する処理を行なってもよい。
【0030】
線画領域および写真領域に対しては、局所領域判別を行なって画素ごとあるいは局所領域ごとに属性を決定し、各属性に応じた適応補正を行なう(S13,S17)。図5中の線画領域処理(S13)、および写真領域処理(S17)は、各マクロ領域に応じた局所領域判別を行なう処理と、各マクロ領域に応じた適応補正とを含んでいる。
【0031】
線画領域に対してはLossless圧縮(S15)、写真領域に対してはLossy圧縮(S19)が行なわれる。それぞれの圧縮されたデータは統合化され(S21)、カードメモリ部125へ出力される(S23)。
【0032】
なお、図5において前処理(S3)とは、マクロ領域を判別する前の補正であり、レンズ歪み、回転ずれ、あおりなどによる画像の幾何学的変形に対する補正、および露出、カラーバランス、シェーディングなどの補正が含まれる。また、マクロ領域判別(S5)とは、圧縮単位となる矩形領域の全体的な属性の判別を意味する。
【0033】
すなわち、デジタルカメラ1では各マクロ領域の属性に適した処理として、画素またはブロック(局所領域)ごとに行なわれる局所的な特徴の判別と、その特徴の判別結果に伴う補正処理とが行なわれる。前者を局所領域判別、後者を適応補正と呼ぶ。
【0034】
また、マクロ領域の判別結果に従って圧縮方法を変える、適応圧縮が行なわれる(S11,S15,S19)。
【0035】
一般に、紙原稿には、文字領域、線画領域、写真領域などが含まれる。ここに文字領域とは、黒字の文字のみで構成される矩形領域を示す。線画領域とは、棒グラフやベタ塗り画像など、単色領域とエッジ領域とで主に構成される矩形領域を示す。また、写真領域とは階調の変化する部分を多く含む矩形領域を示し、絵画、イラスト、テクスチャなども写真領域に含まれる。
【0036】
文字領域は、文字を構成する黒色の部分と、下地を構成する白色の部分とから主に構成される。階調の情報や色情報は文字領域ではあまり重要ではない。一方、階調数や色数が少ないほど、画像の情報量は少なくなる。つまり、解像度が十分であれば文字領域は2値画像であることが圧縮的にも画質的にも好ましい。
【0037】
また、文字はキャラクタコードとして記録すれば2値圧縮を用いたとき以上に圧縮率を上げることができるため、紙原稿中の文字フォントが汎用的なものであったり、フォント情報があまり重要でない場合などには、文字認識を行なってキャラクタコードとして文字領域を記録すればよい。逆に、手書き文字の情報やフォント情報をユーザが重視する場合には文字領域に対して2値圧縮を行なえばよい。2値圧縮では既存のJBIGなどを用いればよい。文字認識についても既存の方法を用いることができる。
【0038】
線画領域は、主に単色領域とエッジ領域とで構成される領域であるため、濃度変化のない部分が極めて多い。ところで、Lossy圧縮では画質劣化を伴うため、複数回数の圧縮で大きな画質劣化を引き起こし得るのに対し、Lossless圧縮では画質劣化がなく画質的には好ましい。しかしながらLossless圧縮を用いると、圧縮率が低い場合が多くなる。
【0039】
しかしながら、Lossless圧縮では、ランレングスやパターンマッチング、および予測符号化などが主に用いられており、単色領域やエッジ領域など同じ濃度の値を有する領域が連続する場合には圧縮率が高くなる。したがって、線画領域にはLossless圧縮を施す(S15)。
【0040】
人間の目には大局的には単色領域に見えたとしても、紙原稿自身が有する印刷の解像度や、照明やデジタルカメラ1に依存するノイズやむらなどによって、デジタル化された画像上では全く同じ画素値(画素濃度値)の画素が連続することは少ない。元の紙原稿上では、このようなノイズやむらの情報は重要ではない。すなわち、デジタル化された場合ノイズやむらはないことが好ましい。また、上述のLossless圧縮を行なうときに圧縮率を向上させるために、ノイズやむらがないことが好ましい。Lossless圧縮の方法としては、PNGなどの既存の方法を用いることができる。
【0041】
したがって、ノイズやむらをなくすため画像データ中の単色領域と判別された部分に対しては単色化を行ない、エッジ領域と判定された部分に対してはエッジ方向の平滑化を行なう。すなわち、判別された局所領域ごとの適応補正が行なわれる。
【0042】
また、マクロ領域判別は矩形単位で行なわれるため、線画領域と判別されたマクロ領域にも階調領域が含まれ得る。このような領域に対しては、ノイズによる画質劣化と圧縮率の低下とを防ぐために平滑化が行なわれる。
【0043】
写真領域は、主に階調変化の多い部分から構成され、このような部分は重要な情報である可能性が高い。したがって、写真領域においては階調変化をなるべく維持した処理を行なう。具体的には、写真領域においては単色領域やエッジ領域と判別される領域を少なくする。また、単色領域と判別された領域に対しても、完全な単色化を行なうのではなく、減色を行なう程度に処理をとどめる。また、エッジ整形度合いも低く抑える。さらに、写真領域に対しては、Lossless圧縮では圧縮率が非常に低くなるため、Lossy圧縮を行なう。Lossy圧縮としては、JPEGのDCTベース圧縮など既存の方法を用いることができる。
【0044】
次に、図5の各ステップについて詳しく説明する。
[前処理(S3)]
図6はデジタルカメラ1が撮像する原稿を示す図であり、図7および図8は、デジタルカメラ1が図6の原稿を撮像することで得る画像データの例を示す図である。図7および図8に示すように、撮影角度やレンズの歪みなどによって、画像データにはあおり(図7)、回転ずれ、歪み(図8)などが発生する。一般に、原稿上の写真領域は矩形であることが多い。したがって、あおり、回転ずれ、歪みがなければ、正確に写真領域を切り出すことができ、圧縮率や画質の点で最適な圧縮を行ないやすい。しかしながら、あおり、回転ずれ、歪みがあることによってこれが困難となりやすい。
【0045】
図9は、あおりの発生により写真領域を矩形領域として切り出すことができなかった例を説明するための図である。図9に示されるように、マクロ領域判別結果が写真(ハッチング部分)以外の画像を含むこととなるため、画像の圧縮が非効率的となってしまう。
【0046】
また、文字領域にOCRを行なう場合、あおり、回転ずれ、歪みに起因する文字の歪みやずれが判別精度の低下をもたらしやすい。さらに、図10に示されるように、解像度が画像の位置によって異なることにつながるため、領域や属性の判別精度が画像の位置によって変化してしまうという問題がある。
【0047】
本実施の形態においては、このような問題を解決するために適応補正、適応圧縮、およびマクロ領域の判別などの処理の前に、前処理としてあおり、回転ずれ、および歪みを補正する。これによって、マクロ領域の判別や適応補正前の局所領域判別の精度を高くすることができる。また、適応補正や適応圧縮を容易にかつ良好に行なうことができる。
【0048】
あおりの原因となる撮影角度は、カメラの測距情報や原稿の形などから容易に知ることができる。また、回転ずれは原稿の形や文字列の方向などから容易に補正することができる。歪みに対しては、予めレンズ特性に適した補正手順をカメラに記憶させておくことで補正することができる。すなわち、画素の位置を変換するテーブルなどを用いるようにすればよい。
【0049】
また、図11はシェーディングの発生によって画像の位置によって画素値の変化が生じてしまった例を示す図である。このような場合にも、領域や属性の判別に用いるしきい値が一定せず、判別精度に悪影響が生じる。したがって、適応補正、適応圧縮、マクロ領域の判別の処理の前に前処理としてこのようなシェーディングに対する補正も行なう。
【0050】
露出、色バランス、ホワイトバランス、ダイナミックレンジなどが撮影条件や照明条件に依存しないようにするため、同様に前処理によって補正する。これらはそれぞれのセンサの値を用いたり、画像全体の各色成分の平均値を利用したり、下地を検出して下地部分を基準に色合わせなどを行なう、などの既存の技術を用いることで補正を行なうことができる。
【0051】
図12は、幾何学的な補正の例としてのあおり補正の方法を示す図である。図12(A)はデジタルカメラ1と被写体である原稿2との位置関係を示した図である。図12において、Pはデジタルカメラ1から、原稿2のデジタルカメラ1から遠い方の端までの距離である。原稿2は、下地のエッジ部検出によって検出される。Qは、光軸方向のデジタルカメラ1から原稿2までの距離である。Aは、カメラに近い方の原稿の端を示す。
【0052】
原稿2のデジタルカメラ1から遠い方の端へのデジタルカメラ1からの方向と、光軸とのなす角をαとし、光軸と原稿2とのなす角をβとし、光軸に垂直な平面と原稿2とのなす角をγとしている。
【0053】
hは、原稿2を光軸と垂直な平面の方向に回転したものを、原稿2が存在する平面に光軸方向に射影した場合の原稿の高さを示す。実際に得られる原稿の高さをhに拡大することで、撮影角度の影響によって縮んだ高さを補正することができる。なお、通常の撮影では、原稿のサイズや撮影距離または撮影角度は同様な値をとることが多いため、固定値を用いて以降の幾何学的補正を行なうことができる。
【0054】
図12(B)は、図12(A)の位置関係によって撮像されたためにあおりを生じた画像(ハッチング部分)を示す図である。図12(C)は、位置Aにおける画像の幅Wを基準に、図12(B)の画像の幅を修正した状態を示す図である。これは、具体的には原稿画像の幅をすべての部分でWとするものである。
【0055】
図12(D)は、図12(C)の画像を、図12(A)のhまで高さを拡大して補正したものである。
【0056】
以上の処理によってあおりが補正された画像(図12(D))を得ることができる。
【0057】
なお、原稿サイズ、撮影距離、撮影角度などが異なる場合にもあおり補正を行なうために、カメラに設けられたセンサによって得られる測距情報を用いてもよい。これは、図13を参照して、原稿画像Dを撮像するときに、その原稿までの距離を数箇所の点P1〜P5で測定し、すべての点までの距離が等しくなるように補正を行なうものである。
【0058】
[マクロ領域判別(S5)]
図14は、前処理を行なった後に、原稿画像を文字領域、写真領域、線画領域にマクロ領域判別する様子を示した図である。
【0059】
このようなマクロ領域の判別方法について以下に説明する。
図15は、図5のマクロ領域判別処理(S5)の内容を示すフローチャートである。図を参照して、まず画像データの全体をいくつかのブロック(ここでは8×8の画素を1ブロックとする)に分割し、各ブロックの特徴を抽出する(S101)。ここで、ブロックの特徴としては、画素の濃度のMax−min値(1ブロック内の画素の濃度の最大値−最小値)、画素の彩度のMax−min値(1ブロック内の画素の彩度の最大値−最小値)、画素の彩度の平均値(1ブロック内の画素の彩度の平均値)、画素濃度の平均値(1ブロック内の画素の濃度の平均値)、網点カウント値(1ブロック内のある画素の濃度がその4近傍にある画素の濃度に対して最大または最小である画素の数)を用いる。
【0060】
次に、各ブロックの特徴から各ブロックの属性を判別する(S103)。これは具体的には、各ブロックの特徴から各ブロックが、背景ブロックであるか、文字ブロックであるか、写真・線画ブロックであるか、を判別するものである。この判別結果に基づき、文字属性2値マップ、および写真・線画属性2値マップを作成する。文字属性2値マップとは、文字ブロックの部分に「1」が書込まれ、他の部分は「0」とされるマップである。また、写真・線画属性2値マップとは、写真または線画ブロックの位置に「1」が書込まれ、他の部分に「0」が書込まれるマップである。
【0061】
写真と線画とはブロック単位では特徴が似ており、この段階では判別するのが困難であるため同じ属性として取扱う。
【0062】
以下に具体的なブロック属性判別処理の手順を説明する。
(1) 画素の彩度の平均値があるしきい値より大きいブロックを写真・線画ブロックとし、写真・線画属性2値マップに「1」を書込む。
【0063】
(2) 残りのブロックに対して、網点カウント値があるしきい値より大きいブロックを写真・線画ブロックとし、写真・線画属性2値マップに「1」を書込む。
【0064】
(3) 残りのブロックに対して、画素の濃度のMax−min値が、あるしきい値より大きいブロックを文字ブロックとして、文字属性2値マップに「1」を書込む。
【0065】
(4) 残りのブロックに対して、画素の濃度のMax−min値が、中程度(あるしきい値と別のあるしきい値との間にある状態)のブロックを写真・線画ブロックとし、写真・線画属性2値マップに「1」を書込む。
【0066】
(5) 残りのブロックのうち画素の濃度の平均値の高いブロックは写真・線画ブロックとし、写真・線画属性2値マップに「1」を書込む。残りは文字ブロックとし、文字属性2値マップに「1」を書込む。
【0067】
このようにして結果として作成された各属性2値マップには、写真・線画ブロックと文字ブロックとの位置に「1」が書込まれることになる。
【0068】
次に、誤判別ブロックの修正(孤立ブロックの除去)が行なわれる(S105)。一般に、同属性の領域はある程度の大きさをもって存在するため、誤判別ブロックは孤立して存在する。したがって、ブロック属性判別結果の2値マップに対して孤立ブロックの除去を行ない、これにより誤判別ブロックの修正を行なう。
【0069】
具体的には、2値マップ上で、注目ブロックを中心に含む3×3の領域を調べ、あるしきい値以上の「1」があれば注目ブロックを「1」にし、なければ「0」に注目ブロックを修正する。
【0070】
次に、修正された2値マップに対して、外接矩形で写真・線画領域および文字領域を抽出する(S107)。外接矩形の抽出は、図16に示すように以下の方法で行なう。
【0071】
(1) 2値マップを1ラインずつ順に上から下に走査し、1ブロックでも「1」のブロックがあれば領域の開始ラインとする(ライン(1))。
【0072】
(2) そのまま走査を続け、1ブロックも「1」のブロックが存在しないラインを領域終了ライン(ライン(2))とし、その間を領域候補とする。
【0073】
(3) その領域候補間で、今度は横方向に縦1ラインずつ走査し、同様に領域開始ライン(ライン(3))と、終了ライン(ライン(4))とを見つけ、縦/横の開始ラインと終了ラインとで囲まれた矩形領域を抽出する。
【0074】
(4) これらの手順を数回繰返し、外接矩形領域を抽出する(ライン(5)〜(8))。
【0075】
以上の手順を文字属性2値マップ、および写真・線画2値マップにそれぞれ施し、文字領域および写真・線画領域がそれぞれ矩形で抽出される。次に、抽出した写真・線画領域について、ブロックの特徴として抽出した画素の彩度のMax−min値の矩形領域内での分布を調べる。彩度のMax−min値は、写真領域では大きなブロックが多く、線画ブロックでは小さなブロックが多い。そこで矩形内で、彩度のMax−min値があるしきい値より大きなブロックが一定数より多い矩形領域を写真領域矩形とし、それ以外を線画領域矩形とする。
【0076】
以上の手順により、マクロ領域として、文字領域、写真領域および線画領域が抽出される。
【0077】
[文字、線画、写真領域処理(S9,S13,S17)]
これらの処理は、マクロ領域内の局所領域がエッジ領域であるか、階調領域であるか、単色領域であるかを判別し、その判別結果に基づいて適応補正を行なうものである。
【0078】
図17は、図14に含まれる写真領域内において局所領域の判別を行なった結果、階調領域やエッジ領域が検出された状態を示す図である。図に示されるように、写真領域中の文字が書かれている部分の周辺や、画素濃度の変化が特に激しい部分はエッジ領域と判定され、その他は階調領域と判定される。
【0079】
図18は、図14に含まれる線画領域内において局所領域の判別を行なった結果を示す図である。図18においては、線画領域内で単色領域(画素の色彩、明度および彩度がほとんど変化しない領域)やエッジ領域が検出されている。
【0080】
線画領域と写真領域とでは、その属性によって局所領域判別と適応補正の処理内容を変える必要がある。
【0081】
マクロ領域判別で線画領域と判別された領域は、主に線画、色付き文字、色付き下地などから構成される。すなわち単色領域やエッジ領域が比較的多く含まれる。このような領域では、画像の細かい階調変化が重要な意味を持つことは少ない。すなわち、たとえば線画がグラフであれば、グラフが示す内容が重要な意味を持ち、線画が色文字であれば文字と下地の判別の容易さや文字の内容が重要な意味を持つ。したがって、線画領域内では階調領域をエッジ領域や単色領域と誤判別することによる影響は少ない。
【0082】
したがって、線画領域内の局所領域判別においては、エッジ領域や単色領域が抽出されやすいようなしきい値を設定し、処理を行なう。また、一続きの単色領域の大きさが圧縮率に大きく寄与するため、適応補正処理では、単色領域に対して(減色を行なうのではなく)完全な単色化を行なうか、1つの単色領域の中に複数の単色化領域を設けることで減色化を行なうのであっても、一続きの単色領域に含まれる単色化領域の数が少なくなるように度合いを設定する。
【0083】
また、単色化を行なう度合いを上げた場合、単色化領域同士の境界部分のエッジ領域のむらが目立ちやすくなるため、エッジの整形度合いも上げる。さらに、線画領域では階調の複雑な変化は少ないと考えられるため、局所領域判別で階調領域と判別された領域はノイズである可能性や重要でない領域である可能性が高い。したがって、階調領域の平滑化度合いを上げて処理を行なう。これによって、画質を向上させることができ、不要な高周波成分を除去することで圧縮率の向上を行なうことができる。
【0084】
一方、マクロ領域判別で写真領域と判別される領域は、写真、テクスチャなどから主に構成され、階調領域が比較的多く含まれる。このような領域に対しては、階調の複雑な変化が重要な意味を持つことが多い。したがって、階調領域をエッジ領域と誤判別してエッジ整形したり、単色領域と誤判別して単色化した場合、大きく画質を損なうことになりやすい。したがって、これを防ぐために階調領域が抽出されやすいように局所領域判別のしきい値を設定する。
【0085】
また、仮に誤判別されても適応補正による劣化をできるだけ抑えるように、エッジ整形の度合いを低く抑えたり、一続きの単色領域に完全な単色化を行なうのではなく、単色領域がいくつかの小さな単色化領域に分割されるようにすることで、単色化を、減色化に留めるようにする。また、階調領域の平滑化度合いも低く抑える。
【0086】
図19は、図5の線画領域処理(S13)の内容を示すフローチャートである。図を参照して、ステップS31でパラメータの設定をAとする。ステップS33で判別および補正を行なう。
【0087】
図20は、図5の写真領域処理(S17)の内容を示すフローチャートである。図を参照して、ステップS41でパラメータの設定をBとする。ステップS43で判別および補正を行なう。
【0088】
設定Aと設定Bとは、局所領域の判別と適応補正に関するパラメータ集合の設定を示す。設定Aを採用すると、設定Bを採用したときよりも単色領域やエッジ領域の割合が多くなるように局所領域判別が行なわれる。また、補正においては単色化(減色化)度合いやエッジ整形度合いが上がり、また階調処理の平滑化の度合いが大きくなる。
【0089】
図21は、設定Aと設定Bとの内容を説明するための図である。図を参照して、設定Aはマクロ領域が線画領域の場合に採用される設定であり、局所領域判別に用いられるしきい値のTH1を大きくし、TH2を小さくする設定である。また、エッジ方向の平滑化フィルタにおいては平滑化の度合いが大きくなるようにする。階調処理の平滑化フィルタにおいても平滑化の度合いを大きくする。減色処理方法では減色度合いを大きくし、より単色化に近い処理(または完全な単色化)が行なわれるようにする。
【0090】
一方、設定Bはマクロ領域が写真領域の場合に設定されるものであり、しきい値TH1を小さくし、TH2を大きくする設定である。エッジ方向の平滑化フィルタでは平滑化の度合いを小さくし、階調処理の平滑化フィルタでも平滑化の度合いを小さくする。また、減色処理方法においては減色度合いを小さくする。
【0091】
図22は、図19および図20の判別および補正(S33,S43)での処理を示すフローチャートである。ステップS51で、局所領域判別が行なわれ、ステップS53で適応補正が行なわれる。これらは、パラメータの設定AまたはBに基づいて行なわれる。
【0092】
図23は、図22の局所領域判別(S51)の内容を示すフローチャートである。ステップS61で、局所領域に含まれる画素の画素値が色空間における座標に変換される。ステップS63で変換された座標に基づき局所領域内の最大色空間距離Fが算出される。ステップS65で最大色空間距離Fに基づいてその局所領域の特性が判別される。ステップS67で判別結果におけるノイズが除去される。
【0093】
一般に、階調領域での画素濃度の変化は、エッジ領域での変化より緩やかであり、単色領域での変化より急激である。したがって、3×3画素や5×5画素程度の小さな大きさのブロック(局所領域)内の画素値の色空間での分布を考えた場合、単色領域、階調領域、エッジ領域の順に分布範囲が大きくなる。この実施の形態では、色空間での画素の分布を示す指標として、ブロック内の任意の画素の色空間での最大距離を用いている。たとえば、3×3画素のブロック内で処理を行なう場合、9個の画素のうちすべての2画素の組合せに対して色空間での距離を計算し、その最大値Fをこのブロックの中心画素の有する画素値変化度(局所領域内の最大色空間距離F)とするのである(S63)。
【0094】
局所領域判別や適応補正に用いる色空間距離は原稿上の文字や写真の濃度分布の変化の度合いや、人間が視覚的に異なる色であると判定する色を判断する尺度として用いるものであるため、判別精度や補正精度を上げるためには人間の視覚特性に準ずる色空間や色差式を用いることが好ましい。
【0095】
このような色空間としてはLa* b* やLu* v* などがあり、色差式としては、Hunter色差式や、CMC色差式や、アダムス=ニッカーソン色差式などを用いることができる。
【0096】
また、処理速度を上げるために入力装置や処理装置に依存する色空間、たとえば汎用的なRGB空間、YUV空間などをそのまま用いてもよい。
【0097】
また、特定の情報を強調したい場合には、それに関連する色空間を用いればよい。たとえば、色相情報を重視して局所領域判別をしたい場合には、HSB空間を採用し、色差式内のH値の重みを上げてやればよい。
【0098】
図24は、R−G、B−Gの2次元色空間に3×3画素のブロック内の9画素の位置P1〜P9をプロットしたものである。ここでは、局所領域内の最大色空間距離FはP3とP7との間の色差式の値となる。
【0099】
図25は、図23の領域判別処理(S65)の内容を示すフローチャートである。ステップS71で、局所領域内の最大色空間距離Fの値としきい値とが比較され、F>TH2であれば、その局所領域はエッジ領域であると判定される(S73)。TH1≦F≦TH2であれば、その局所領域は階調領域であると判定される(S75)。F<TH1であれば、その局所領域は単色領域であると判定される(S77)。
【0100】
図26は、局所領域内の最大色空間距離Fとしきい値TH1,TH2と、判定される局所領域との関係を示す図である。最大色空間距離Fがあるしきい値TH1より小さければ単色領域であり、あるしきい値TH2(>TH1)より大きければエッジ領域であり、残りが階調領域となる。前述のように、マクロ領域の判別結果が線画領域の場合は、図26の単色領域、およびエッジ領域と判定される部分が大きくされる。一方、写真領域の場合には図26の階調領域と判定される部分が大きくなるようにしきい値が設定される。
【0101】
すなわち、Lossy圧縮を用いる写真領域ではしきい値TH1を小さくかつTH2を大きくし、Lossless圧縮を用いる線画領域では、逆にしきい値TH1を大きく、TH2を小さくするものである。
【0102】
このようにして、局所領域の判別を行なった後、判別結果のノイズ除去を行なう(図23のS67)。以下にその理由について説明する。
【0103】
単色領域やエッジ領域は連続してある程度大きいサイズを持つことが多い。したがって、局所領域判別された結果の領域サイズが小さい単色領域やエッジ領域はノイズや誤判別である可能性が高い。また、ノイズや誤判別でなかったとしても、連続した領域が小さい単色領域やエッジ領域は、単色化やエッジ整形を行なっても画質の向上や圧縮率の向上には大きな効果をもたらさない。
【0104】
したがって、連続した領域であってあまりに小さい単色領域やエッジ領域は、その領域に隣接する領域がある程度大きい領域であるならば、この領域までの距離などから領域統合を行ない、局所領域判別結果におけるノイズとして消去する。
【0105】
階調領域では、後述する画素値の変化の激しさに応じた平滑化を行なう。このため、エッジ領域に対し階調領域に対する処理を行なってもほとんど処理がなされず、単色領域に対し階調処理を行なうと減色作用を持つ。つまり、本来エッジ領域や単色領域である領域を階調領域として処理しても大きな画質劣化は生じない。逆に、隣接する領域のサイズも小さい場合には、前述のようにエッジ領域や単色領域を階調領域として処理しても画質や圧縮率に悪影響が起きにくいため、局所領域判別結果が階調領域だったものとして適応処理を行なう。
【0106】
図27は原画像を示す図であり、図28は図27に示される画像を処理した結果ハッチングで示されるエッジ領域とハッチングが付されていない階調領域とが局所領域として識別されている状態を示す図である。図28における局所領域判別結果での面積の小さい領域BLはノイズとして除去されるため、最終的な局所領域判別結果は、図29に示されるものとなる。
【0107】
図30は、図22の適応補正(S53)の処理の内容を示すフローチャートである。その局所領域の判別結果が、エッジ領域、階調領域、または単色領域のそれぞれであった場合に対応してエッジ処理(S83)、階調処理(S85)、単色化(または減色化)処理(S87)が行なわれる。
【0108】
図31は、図30のエッジ処理(S83)の内容を示すフローチャートである。
【0109】
エッジ領域においては、図32に示されるようなエッジ領域と判定された部分のエッジの方向を判別して(S91)、図33に示すようにエッジ方向に対して平滑化を行ない(S93)、図34に示されるようにエッジと垂直な方向にエッジ強調を行なう(S95)。エッジの方向の判別では、縦横それぞれにエッジの存在を調べ、縦横のどちらかにのみエッジがあった場合に、エッジが存在する方向をその画素におけるエッジの方向とする。それ以外の場合には、エッジ方向を特定できないものとしてエッジ補正は行なわない。
エッジ処理は、3×3画素のブロックごとに行なう。ただしズーム倍率に従って5×5画素などにブロックサイズを変更しても同様にエッジ処理を行なうことができる。
【0110】
次に、横方向のエッジ存在の判定の具体例について説明する。図35は、エッジ存在判定に用いる3×3画素のブロックを示す図である。図35において、Eが適応補正の対象となる注目画素に対応する部分である。Eの部分において横方向のエッジが存在するとは、ABCとDEFとの間、またはDEFとGHIとの間の少なくとも1つにエッジがあることをいう。
【0111】
ABC、DEF間のエッジの存在の判断では、入力画像が濃淡画像である場合、AD、BE、CFの3つのうち、すべてが同じ向きに、あるしきい値THe1以上の画素値の変化を有するか、または2つ以上が同じ向きに、あるしきい値THe2(>THe1)以上の画素値の変化を有するかのいずれかの条件を満たせば、エッジが存在すると判断する。またそれらの条件のいずれをも満たさない場合には、エッジは存在しないと判断する。
【0112】
RGBやYUVなどの多次元の色空間においては、エッジの向きに関する情報を得るためにはベクトル距離と内積とを求める必要がある。また、エッジが同じ向きであるかどうかの評価も適切な条件で行なう必要がある。よって、入力画像が単なる濃淡画像ではない場合、ABCとDEF間のエッジの存在判定は、AD、BE、CF間の色空間距離の和があるしきい値以上であり、ABCの平均とDEFの平均の色空間距離が、AD、BE、CF間の色空間距離和に対するK1倍(K1はある定数)以上であるか否かで判定する。
【0113】
このような判定について、以下色空間がRGB空間である場合を例として説明する。
【0114】
(R,G,B)=(Pr,Pg,Pb)の画素値を持つ画素Pと、(R,G,B)=(Qr,Qg,Qb)の画素値を持つ画素QのRGB色空間距離とは、3次元ベクトル(Pr−Qr,Pg−Qg,Pb−Qb)の大きさを示す。
【0115】
AD、BE、CF間の色空間距離が大きいとは、これらの間つまり縦に大きい画素値変化があることを意味する。また、ABCの平均とDEFの平均との色空間距離がAD、BE、CF間の色空間距離和のある定数K1倍以上であるとは、AD、BE、CFの画素値変化が方向的に似たものであることを保証するものである。
【0116】
たとえば、ADの画素値変化とBEの画素値変化とが色空間において全く逆向きで同じ大きさのものであれば、AD、BE、CF間の色空間距離和は大きくても、ABCの平均とCEFの平均の色空間距離はCF間の色空間距離に一致する。これは、AD、BEの画素値変化が方向、大きさともに全く同じものであった場合に比べて、小さい色空間距離となる。
【0117】
同様に、DEF、GHI間のエッジの存在についても判定し、どちらかの片方でもエッジがあれば、Eは横方向のエッジ画素であると判定される。縦方向のエッジに対しては、ADG、BEH、CFIに対して同様に判定を行なう。
【0118】
前述のとおり、縦か横のいずれかのみにエッジが存在すると判定された場合にのみ、エッジの存在する方向に平滑化を行なう。縦方向のエッジ画素であると判定された画素に対する縦方向の平滑化は、たとえば図36(a)に示す一般的な平滑化フィルタを用いて行なう。
【0119】
横方向も同様に、図36(b)に示す一般的な平滑化フィルタで平滑化を行なう。
【0120】
前述のとおり、線画領域に比べて写真領域では、エッジ整形はなるべく行なわないようにすることが好ましい。したがって、エッジの判定に用いるしきい値THe1,THe2や定数K1を大きくすることでエッジ整形の対象とする画素を減らしたり、平滑化フィルタを図37(a)や図37(b)のようなものに変えることでエッジ整形の度合いを写真領域では下げるようにする。
【0121】
図38は、図30の階調処理(S85)の内容を示すフローチャートである。ステップS101で、画素における輝度の変化度が計算され、ステップS103で平滑化の演算が行なわれる。
【0122】
階調処理においては、高周波成分の量やエッジの度合いに応じて平滑化度合いを変化させる適応平滑化が行なわれる。高周波成分の量は、DCTの交流成分の和などを用いればよく、エッジの度合いは2次微分フィルタの出力値を用いればよい。平滑化は、図39に示す一般的な平滑化フィルタを用いることにより行なうことができる。フィルタの中央の値Xを高周波成分量やエッジ度合いに比例させてブロックごとに変化させると適応平滑化を行なうことができる。エッジ領域と同様に、線画領域に比べて写真領域では階調処理を行なわない方が好ましい場合が多い。したがって、線画領域に比べて写真領域ではフィルタの中央の値(X)を大きめに設定する。
【0123】
図40は、図30の単色(または減色)処理(S87)の内容を示すフローチャートである。ステップS111で、隣接画素の色空間距離が計算される。ステップS113で平滑化の演算が行なわれ、ステップS115で単色化(または減色化)の演算が行なわれる。
【0124】
線画領域に含まれる単色領域は、原稿中ではベタ塗りがされている領域であると考えられる。したがって、この単色領域内はすべて同じ色と思われるため、単色化処理する。
【0125】
図41は、単色化処理(または減色化処理)について説明するための図である。図41(C)は、図41(A)のヒストグラム分布を持つ単色領域の単色化処理を行なった後のヒストグラムを示す図である。また、図41(F)は、図41(D)の画素の輝度値を単色化処理した後の画素の輝度値を示す図である。
【0126】
図41(A)〜(C)においては、横軸は画素の輝度値を示し、縦軸はその輝度値を有する画素の数を示す。図41(D)〜(F)においては横軸は、画素の位置を示し、縦軸はその画素の輝度値を示す。画素位置は、たとえばある画像領域内の1次元の成分を示す。
【0127】
写真領域に含まれる単色領域は、写真などの階調画像中の画素値の変化の穏やかな領域であると考えられるため、単色化は行なわずに減色処理にとどめた方が好ましい。すなわち、図41(A)に示されるヒストグラム分布を、図41(B)に示されるヒストグラム分布のようにすることで減色化を行なう。同様に、図41(D)の画素の分布を、図41(E)のようにすることで減色化を行なう。
【0128】
JPEG、PNGなどの既存の圧縮方法の多くにおいて、画素値が完全に均一である単色化領域は圧縮率が高い。よって、入力時や印刷時などにおけるノイズと思われる画素値変化を強制的に均一化することで、圧縮率を大きく上げることができる。
【0129】
なお、隣接画素間の画素値変化が少ないものを統合することで単一色の領域を検出し、領域内の画素値の平均値ですべての画素値を置換することにより単色化を実行できる。減色化は、画素濃度の平滑化を行なったり、ビット数を減らすことで行なうことができる。
【0130】
上述のように、線画領域と写真領域とで単色化処理に差をつける方法として、線画領域においては単色化を行ない、写真領域に対しては減色のみを行なうようにしてもよいが、線画領域と写真領域のそれぞれにおいて単一色抽出のためのしきい値や平滑化度合いや、ビット削減数などを変えることで減色の度合いを変えるようにしてもよい。
【0131】
[統合化(S21)、出力(S23)]
適応圧縮された各領域の画像は統合化され、1つのファイルとして出力される。図42は統合化を行なう状態を示す図である。統合化の例として、PDF、HTMLなどが既存の方法として挙げられる。
【0132】
図42においては、画像1〜4が統合化されている例を示し、画像1〜画像4のそれぞれのリンク情報が記憶されている。画像1の情報としてJPEGの画像が記憶され、画像2の情報としてJBIG画像が記憶され、画像3の情報としてJBIG画像が記憶され、画像4の情報としてPNG画像が記憶されている。
【0133】
なお、文書補正指定スイッチ7がOFFとなっている場合には、既存の一般に用いられているノイズ除去、平滑化、先鋭化、色補正などを画像データに対して行ない、JPEGなどの既存の圧縮方法で画像データの圧縮を行なった後、保存、出力、または転送などを行なえばよい(図43)。
【0134】
なお、既存の圧縮方法は極めて多くあり、それぞれ効率よくまたは高画質に圧縮を行なえる画像の種類は異なるものも多い。したがって、圧縮の単位となる矩形領域であるマクロ領域の属性判別は、線画領域、写真領域、文字領域のみに限定されない。
【0135】
すなわち、たとえば線画領域をさらに複数の領域に分解して検出するようにしてもよい。または全く別の領域判別、たとえば印刷物の種類に従って領域判別を行なうようにしてもよい。
【0136】
このような場合、図44に示されるフローチャートを図5のフローチャートに代えて用いることができる。すなわち、図5の例においてはマクロ領域を3つの種類に分けることとしたが(S7)、図44の例では、マクロ領域を領域1〜KのK種類に分け、それぞれにおいて局所領域を判別し、判別されたマクロ領域や局所領域に適応した補正や圧縮を行なう。
【0137】
[第2の実施の形態]
第2の実施の形態におけるデジタルカメラの外観は、図2および3に示されるものと同じである。
【0138】
図45は、本発明の第2の実施の形態におけるデジタルカメラの回路構成を示すブロック図である。図を参照して、デジタルカメラはCPU211と、撮影対象からの光を光電変換するCCD部209と、CCD部209からの画像データを一旦記憶するRAM201と、画像データに対し前処理を行なう前処理部203と、前処理された画像データから文字領域を判別する文字判別部205と、文字判別後の画像データに対し局所領域判別を行なう局所領域判別部207と、局所領域判別後の画像データに対しマクロ領域判別を行なうマクロ領域判別部213と、適応補正部217と、文字データを処理する文字処理部219と、画像の圧縮を行なう圧縮部227と、圧縮された画像データを統合し出力する画像統合部225と、圧縮された画像データを記憶するカードメモリ部229と、撮像のための各種演算を行なうAWB、AEなど演算部223と、シャッタボタン221と、画像データを表示する表示部215とを備えている。
【0139】
また、デジタルカメラに外部記憶装置229を接続し、CD−ROM231やフロッピィディスク233から後述のフローチャートなどを実行するプログラムをCPU211に対し読込むようにしてもよい。
【0140】
本実施の形態におけるデジタルカメラは第1の実施の形態におけるデジタルカメラと比較して、局所領域の判別を行なった後に、マクロ領域の判別を行なうことを特徴としている。これにより、マクロ領域の判別に局所領域の判別結果を利用することが可能となる。
【0141】
次に、具体的に文書補正指定スイッチ7がONである場合の本実施の形態におけるデジタルカメラの処理の流れを説明する。
【0142】
図46は、文書補正指定スイッチ7がONである場合の処理の流れを示すフローチャートである。入力された画像データ(S201)は、前処理された後に(S203)、文字領域が判別される(S205)。文字領域には、解像度変換、文字補正、2値化などの処理が行なわれ(S215)、2値圧縮される(S217)。
【0143】
また、文字領域に対してOCRを行ないキャラクタコードに文字領域のデータを変換するようにしてもよい。
【0144】
非文字領域に対しては、局所領域判別を行なって画素ごとまたは局所領域ごとに属性を決定する(S209)。局所領域の判別結果を利用してマクロ領域判別が行なわれる(S211)。
【0145】
単色領域やエッジ領域が局所領域として多く含まれるマクロ領域は線画である可能性が高い。これに対し、階調領域が局所領域に多く含まれるマクロ領域は写真領域である可能性が高い。この性質を利用して、マクロ領域判別において線画領域と写真領域との判別は、局所領域の属性に基づき行なう。
【0146】
すなわち、図17および図18を参照して、写真領域には階調領域が多く含まれ、線画領域には単色領域やエッジ領域が多く含まれるからである。
【0147】
つまり、第1の実施の形態においては彩度のMax−min値が、写真領域では大きなブロックが多く、線画ブロックでは小さなブロックが多いという特徴に基づいて写真領域と線画領域とを区別することとしたが、本実施の形態においては局所領域判別で、単色領域あるいはエッジ領域と判別された局所領域をある一定のしきい値以上の割合で含むマクロ領域を線画領域と判定し、そうでないマクロ領域を写真領域として判別する。
【0148】
再び図46に戻って、局所領域の判別結果とマクロ領域の判別結果とに応じた適応補正が行なわれる。すなわち、図46中の、線画領域処理(S219)と、写真領域処理(S223)とは、各領域に応じた適応補正を示す。線画領域に対しては、Lossless圧縮(S221)が、写真領域に対してはLossy圧縮(S225)が行なわれる。
【0149】
図47は図46の線画領域処理(S219)の内容を示すフローチャートであり、図48は図46の写真領域処理(S223)の内容を示すフローチャートである。図47および図48中のパラメータ設定Aとパラメータ設定Bとは、それぞれ線画領域と写真領域とで用いる適応補正に関するパラメータ集合の設定を示す。
【0150】
パラメータ設定Bに対して、パラメータ設定Aでは、単色化度合いやエッジ整形度合いを上げるような設定がなされる。具体的には、パラメータ設定Bに比べて、パラメータ設定Aでは平滑化度合いの大きいフィルタが用いられるなどの第1の実施の形態と同様の処理が行なわれる。
【0151】
なお、既存の圧縮の方法は極めて多くあり、それぞれ効率的または高画質に圧縮を行なえる画像の種類は異なるものも多い。したがって、圧縮単位となるマクロ領域の属性判別である対象は、線画領域、写真領域、文字領域に限定されない。たとえば、線画領域をさらに複数の領域に分割したり、または全く別の判別(たとえば印刷物の種類に従って領域判別することなど)も考えられる。この場合、図46の処理に代えて、図49の処理を実行すればよい。
【0152】
図49を参照して、入力された画像データ(S251)は、前処理された後に(S253)、マクロ領域の領域の形が判別される(S255)。このとき判別された各領域1〜Kごとにその内部の局所領域が判別され(S259,S239,S249)、その結果に基づいてそのマクロ領域の属性が判別される(S231,S241,S251)。その後、それぞれのマクロ領域および局所領域に応じた適応補正が行なわれ(S233,S243,S253)、マクロ領域ごとに圧縮が行なわれる(S235,S245,S255)。その後、圧縮された画像データは統合され(S257)、出力される(S259)。
【0153】
なお、実施の形態において説明したフローチャートを実行するプログラムを、CD−ROM131,231やフロッピィディスク133,233に記憶させ、外部記憶装置129,229を介し、CPU111,211に実行させるようにしてもよい(図4、図45参照)。
【図面の簡単な説明】
【図1】本発明の実施の形態の1つにおけるデジタルカメラ1と撮像対象である原稿2との関係を示す図である。
【図2】デジタルカメラ1をレンズの側から見た図である。
【図3】デジタルカメラ1を表示部の側から見た図である。
【図4】デジタルカメラ1のハードウェア構成を示すブロック図である。
【図5】文書補正指定スイッチ7がONである場合の処理を示すフローチャートである。
【図6】原稿の一例を示す図である。
【図7】図6の原稿を撮像したときに生ずるあおりを説明するための図である。
【図8】図6の原稿を撮像したときに生ずる歪みを説明するための図である。
【図9】写真領域が矩形でない場合の問題点を説明するための図である。
【図10】解像度の相違が生じた場合の問題点を説明するための図である。
【図11】シェーディングが発生した場合の問題を説明するための図である。
【図12】あおり補正の具体例を説明するための図である。
【図13】あおり補正における測距データの取得方法について説明するための図である。
【図14】画像データがマクロ領域に分割される状態を説明するための図である。
【図15】図5のマクロ領域判別(S5)の内容を示すフローチャートである。
【図16】マクロブロックの矩形化方法を説明するための図である。
【図17】マクロ領域に含まれる局所領域について説明するための第1の図である。
【図18】マクロ領域に含まれる局所領域について説明するための第2の図である。
【図19】図5の線画領域処理(S13)の内容を示すフローチャートである。
【図20】図5の写真領域処理(S17)の内容を示すフローチャートである。
【図21】パラメータ設定Aとパラメータ設定Bとの関係を説明するための図である。
【図22】図19および図20の判別および補正処理(S33,S43)の内容を示すフローチャートである。
【図23】図22の局所領域判別(S51)の内容を示すフローチャートである。
【図24】最大色空間距離Fの求め方について説明するための図である。
【図25】図23の領域判別(S65)の内容を示すフローチャートである。
【図26】しきい値TH1とTH2と判別される領域との関係を説明するための図である。
【図27】局所領域の判別の対象となるマクロ領域の具体例を説明するための図である。
【図28】図27の状態から局所領域が判別された状態を示す図である。
【図29】図28の状態からノイズ除去が行なわれた状態を説明するための図である。
【図30】図22の適応補正(S53)の内容を示すフローチャートである。
【図31】図30のエッジ処理(S83)の内容を示すフローチャートである。
【図32】エッジ処理の対象となる画像データを示す図である。
【図33】図32の画像データに平滑化が行なわれた後の状態を示す図である。
【図34】図33の画像データにエッジ強調が行なわれた状態を示す図である。
【図35】エッジ処理に用いるフィルタを説明するための図である。
【図36】線画領域において用いられる平滑化フィルタの具体例を示す図である。
【図37】写真領域において用いられる平滑化フィルタの具体例を示す図である。
【図38】図30の階調処理(S85)の内容を示すフローチャートである。
【図39】階調処理で用いられるフィルタを示す図である。
【図40】図30の単色化(または減色化)処理(S87)の内容を示すフローチャートである。
【図41】単色化(または減色化)処理の具体例を説明するための図である。
【図42】画像の統合の方法を説明するための図である。
【図43】風景モードにおいて出力される画像データを示す図である。
【図44】第1の実施の形態の変形例を示すフローチャートである。
【図45】第2の実施の形態におけるデジタルカメラのハードウェア構成を示すブロック図である。
【図46】第2の実施の形態における処理を示すフローチャートである。
【図47】図46の線画領域処理(S219)の内容を示すフローチャートである。
【図48】図46の写真領域処理(S223)の内容を示すフローチャートである。
【図49】第2の実施の形態の変形例を示すフローチャートである。
【符号の説明】
1 デジタルカメラ
7 文書補正指定スイッチ
103,203 前処理部
105,213 マクロ領域判別部
107,207 局所領域判別部
113,217 適応補正部
115,219 文字処理部
119,227 圧縮部
127,225 画像統合部
125,228 カードメモリ部
131,231 CD−ROM
133,233 フロッピィディスク
Claims (5)
- 入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別する第1の判別手段と、
線画領域と、写真領域のそれぞれについて階調領域を判別する第2の判別手段と、
線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくする平滑化手段とを備えた、画像処理装置。 - 前記入力された画像から第1の判別手段により判別される線画領域および写真領域について単色領域を判別する第3の判別手段と、
前記判別された単色領域において単色化を行なう単色化手段とをさらに備えた、請求項1に記載の画像処理装置。 - 前記平滑化または単色化が行なわれた領域の圧縮を行なう圧縮手段をさらに備えた、請求項2に記載の画像処理装置。
- 入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別するステップと、
線画領域と、写真領域のそれぞれについて階調領域を判別するステップと、
線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくするステップとを備えた、画像処理方法。 - 入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別するステップと、
線画領域と、写真領域のそれぞれについて階調領域を判別するステップと、
線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくするステップとをコンピュータに実行させることを特徴とする、画像処理プログラムを記録した記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17177298A JP3820751B2 (ja) | 1998-06-18 | 1998-06-18 | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 |
US09/325,356 US6735341B1 (en) | 1998-06-18 | 1999-06-04 | Image processing device and method and recording medium for recording image processing program for same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17177298A JP3820751B2 (ja) | 1998-06-18 | 1998-06-18 | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000013605A JP2000013605A (ja) | 2000-01-14 |
JP3820751B2 true JP3820751B2 (ja) | 2006-09-13 |
Family
ID=15929403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP17177298A Expired - Lifetime JP3820751B2 (ja) | 1998-06-18 | 1998-06-18 | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3820751B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8447109B2 (en) | 2009-02-23 | 2013-05-21 | Anygraaf Oy | Method for utilizing segementation of raster image for compression of an image |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6836564B2 (en) | 2000-04-28 | 2004-12-28 | Denso Corporation | Image data compressing method and apparatus which compress image data separately by modifying color |
US6901170B1 (en) * | 2000-09-05 | 2005-05-31 | Fuji Xerox Co., Ltd. | Image processing device and recording medium |
JP2005122323A (ja) * | 2003-10-14 | 2005-05-12 | Casio Comput Co Ltd | 撮影装置、画像処理装置、撮影装置の画像処理方法及びプログラム |
US7848578B2 (en) * | 2004-09-13 | 2010-12-07 | Nokia Corporation | Methods, devices and computer program products for capture and display of visually encoded data and an image |
JP4649237B2 (ja) * | 2005-03-07 | 2011-03-09 | 株式会社東芝 | 画像圧縮装置、画像圧縮方法及び画像圧縮プログラム |
JP4586891B2 (ja) | 2008-06-10 | 2010-11-24 | コニカミノルタビジネステクノロジーズ株式会社 | 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム |
JP5884509B2 (ja) * | 2012-01-24 | 2016-03-15 | 富士ゼロックス株式会社 | 画像処理装置、画像読取装置およびプログラム |
JP6651776B2 (ja) * | 2014-12-25 | 2020-02-19 | 株式会社リコー | 画像処理装置、画像処理方法、及び、プログラム |
JP6708118B2 (ja) * | 2016-12-26 | 2020-06-10 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
-
1998
- 1998-06-18 JP JP17177298A patent/JP3820751B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8447109B2 (en) | 2009-02-23 | 2013-05-21 | Anygraaf Oy | Method for utilizing segementation of raster image for compression of an image |
Also Published As
Publication number | Publication date |
---|---|
JP2000013605A (ja) | 2000-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6735341B1 (en) | Image processing device and method and recording medium for recording image processing program for same | |
US6628833B1 (en) | Image processing apparatus, image processing method, and recording medium with image processing program to process image according to input image | |
US7454040B2 (en) | Systems and methods of detecting and correcting redeye in an image suitable for embedded applications | |
US7221790B2 (en) | Processing for accurate reproduction of symbols and other high-frequency areas in a color image | |
US8861845B2 (en) | Detecting and correcting redeye in an image | |
US8086031B2 (en) | Region detection | |
EP0824246B1 (en) | Automatic image cropping | |
JP4423298B2 (ja) | デジタル画像におけるテキスト状エッジの強調 | |
JP4248812B2 (ja) | 明度調整のためのデジタル画像の処理方法 | |
JP2008523504A (ja) | ディジタル画像受容可能性自動判別 | |
JP2004529404A (ja) | 画像を分析するための方法及び装置 | |
JP2008099149A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP3820751B2 (ja) | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 | |
JP2006343863A (ja) | 画像処理装置及びその方法 | |
US20110026818A1 (en) | System and method for correction of backlit face images | |
JP2000013596A (ja) | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 | |
JP4920814B2 (ja) | 画像処理方法、装置および記録媒体 | |
JP2005260657A (ja) | 撮影装置、画像処理方法及びプログラム | |
JP2000013612A (ja) | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 | |
JP2000013613A (ja) | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 | |
JP2006113658A (ja) | 画像処理装置及び方法、及びプログラムを記録した記憶媒体 | |
JP7382834B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2000013611A (ja) | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 | |
JP2000276581A (ja) | 画像処理装置および画像処理方法ならびに画像処理プログラムを記録した記録媒体 | |
JP4228905B2 (ja) | 画像処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20050615 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050721 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20050829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051125 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20051227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060223 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060320 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060612 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090630 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100630 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110630 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120630 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130630 Year of fee payment: 7 |
|
EXPY | Cancellation because of completion of term |