JP3820751B2

JP3820751B2 - 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体

Info

Publication number: JP3820751B2
Application number: JP17177298A
Authority: JP
Inventors: 大作保理江
Original assignee: コニカミノルタフォトイメージング株式会社
Priority date: 1998-06-18
Filing date: 1998-06-18
Publication date: 2006-09-13
Anticipated expiration: 2018-06-18
Also published as: JP2000013605A

Description

【０００１】
【発明の属する技術分野】
この発明は画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体に関し、特に入力された画像データの領域判別を行ない、領域ごとにデータの圧縮を行なった後に出力する画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体に関する。
【０００２】
【従来の技術】
特開平８−１２３９５８号公報は、人間の知覚に基づき、画像データから領域を抽出し、領域の一部または全部を色変換することで画質劣化を抑えながらデータ量の削減を行なう技術を開示する。また、撮像された画像の圧縮を行なう画像処理装置が知られている。
【０００３】
【発明が解決しようとする課題】
この発明は、そのような従来の技術を改良するためになされたものであり、画像の圧縮率と画質の向上を図ることができる画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体を提供することを目的としている。
【０００４】
【課題を解決するための手段】
上記目的を達成するため、この発明のある局面に従うと、画像処理装置は、入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別する第１の判別手段と、線画領域と、写真領域のそれぞれについて階調領域を判別する第２の判別手段と、線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくする平滑化手段とを備える。
【０００５】
好ましくは、画像処理装置は、入力された画像から第１の判別手段により判別される線画領域および写真領域について単色領域を判別する第３の判別手段と、判別された単色領域において単色化を行なう単色化手段とをさらに備える。
【０００６】
さらに好ましくは、画像処理装置は、平滑化または単色化が行なわれた領域の圧縮を行なう圧縮手段をさらに備える。
【０００８】
この発明のさらに他の局面に従うと画像処理方法は、入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別するステップと、線画領域と、写真領域のそれぞれについて階調領域を判別するステップと、線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくするステップとを備える。
【００１０】
この発明のさらに他の局面に従うと画像処理プログラムを記録した記録媒体は、入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別するステップと、線画領域と、写真領域のそれぞれについて階調領域を判別するステップと、線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくするステップとをコンピュータに実行させることを特徴とする。
【００１２】
これらの発明によると、階調領域の平滑化、単色領域の単色化が行なわれるため、画像の圧縮率と画質の向上とを図ることができる。
【００１３】
すなわち、ノイズや印刷上の網点などに起因する高周波成分によって画像の画質や圧縮率が低下するが、本願発明では画像のむらや小さな孤立点を消去することができるため、画像の圧縮率と画質の向上とが図られる。
【００１４】
【発明の実施の形態】
以下、本発明の実施の形態の一例における画像処理装置を備えたデジタルカメラについて図面を参照しながら説明する。
【００１５】
［第１の実施の形態］
図１は、デジタルカメラ１が雑誌などの文字原稿２を撮像している状況を示す図である。本実施の形態では、文字原稿から、その文字原稿をプリントした元の電子データを復元あるいは推定することにより、高い圧縮率で圧縮を行なって、データを保存および転送に適したものとすることを目的としている。この際、必要であれば元の電子データに含まれるノイズなども除去される。
【００１６】
図２は、デジタルカメラ１の前方からの斜視図であり、図３は、デジタルカメラ１のカメラバックである。図を参照して、デジタルカメラ１は、撮影ボタン３と、撮影レンズ部４と、カード挿入口５と、電源ボタン６と、文書補正指定スイッチ７と、液晶などよりなるファインダ用モニタ８とを備える。
【００１７】
デジタルカメラ１による撮影結果は、デジタルカメラ１の内部に存在する図示しないハードディスクカードに電子データとして記憶される。ここでハードディスクカードは画像データの記録媒体であり、たとえばＰＣＭＣＩＡに準拠したハードディスクカードのようなものを用いても良いし、これに代えてメモリカードなどを用いてもよい。また、ミニディスク（ＭＤ）を記録媒体に用いてもよい。さらに、カードを記録媒体としなくても、たとえばＳＣＳＩケーブルなどでデジタルカメラ１をプリンタなどに直接接続するようにしてもよい。
【００１８】
本実施の形態におけるデジタルカメラ１では、文書補正指定スイッチ７をオンとすることによって、会議などで配付された資料、カタログ、雑誌、研究記録などの紙原稿を電子データとして保存する場合の画質と圧縮率とを向上させることができる。
【００１９】
すなわち、通常のデジタルカメラでこのような紙原稿を撮像する場合には以下のことが問題となる。
【００２０】
・照明条件などに依存する露出ずれ、色ずれ、シェーディング
・紙質、照明、ＣＣＤの特性などに依存するダイナミックレンジの縮小
・入力系に依存する歪み
・ＣＣＤ画素数に依存する解像度の低下
・被写体の位置、種類を限定しないことによって生じる、あおりや回転ずれ
・原稿自体が有する解像度の制限に依存する、むらや網点の存在
また、データの保存や転送を考慮した場合、圧縮効率が問題となり、電子データを複数回再圧縮することを想定した場合、画像特性と圧縮方法との組合せによっては画質に激しい劣化が生じ得る。すなわち、通常のデジタルカメラでは、圧縮方法の選択に依存する画質的な問題も生じる。さらに、ノイズによって画質や圧縮効率がともに低下することも問題となる。
【００２１】
本実施の形態におけるデジタルカメラ１では、文書補正指定スイッチ７をオンとすることで、このような問題を解決することができる。
【００２２】
デジタルカメラ１は、画像に含まれる各々の領域の属性（特性）を判別し、各属性に適した補正処理や圧縮処理を行なう。一般に画像の圧縮単位は矩形であるため、矩形のマクロ領域単位で領域の判別をすることが必要となる（マクロ領域判別）。また、マクロ領域ごとに最適な補正を行なうためには、マクロ領域内の局所的な領域の判別（局所領域判別）が必要となる。これらを行なうことによって圧縮効率の向上や画質の向上が達成される。
【００２３】
図４は、デジタルカメラ１の回路構成を示すブロック図である。図を参照して、デジタルカメラ１はデジタルカメラ１の全体の制御を行なうＣＰＵ１１１と、撮像を行なうＣＣＤ部１０９と、撮像された内容を表示する表示部（ファインダ用モニタ８を含む）１１７と、ＣＣＤ部１０９からのデータを一時記憶するＲＡＭ１０１と、撮像されたデータの幾何学的な補正などを行なう前処理部１０３と、撮像された画像のマクロ領域を判別するマクロ領域判別部１０５と、マクロ領域内に含まれる局所領域を判別する局所領域判別部１０７と、局所領域に対し適切な補正を行なう適応補正部１１３と、マクロ領域ごとに圧縮を行なう圧縮部１１９と、文字領域を処理する文字処理部１１５と、圧縮が行なわれた画像を統合し出力する画像統合部１２７と、画像データを記録するカードメモリ部１２５と、撮影のための各種定数を演算するＡＷＢ、ＡＥなど演算部１２３と、撮影ボタン３を含む各種ボタン１２１とを備える。
【００２４】
なお、デジタルカメラ１のＣＰＵ１１１に外部記憶装置１２９を設け、ＣＤ−ＲＯＭ１３１やフロッピィディスク１３３からデジタルカメラ１の制御のためのプログラムを読取るようにしてもよい。
【００２５】
次に、図４に示されるブロック図を用いて実際の撮影の様子を説明する。図４において太い矢印は画像データの流れを示し、細い矢印は制御データの流れを示している。ユーザがカメラの電源をＯＮにすると、ファインダ用モニタ８には撮影レンズ部４が捉えているシーンが、ＣＣＤ部１０９を介してそのまま映される。
【００２６】
ユーザは、紙原稿を撮影するのか風景や人物を撮影するのかを文書補正指定スイッチ７により設定する。ＣＰＵ１１１は、撮影ボタン３がＯＮになったことを検出したのであれば、ＣＣＤ部１０９に対してＣＣＤの積分を指示し、積分が終了すればＣＣＤデータのＲＡＭ１０１へのダンプを行なう。そして、ファインダ用モニタ８にこの画像を表示（フリーズ表示）させる。
【００２７】
ＣＣＤ部１０９からの画像データは、ＲＡＭ１０１に記憶される。文書補正指定スイッチ７がＯＮであれば、デジタルカメラ１は文書補正モードに移行し、文書補正を行なった後ＰＤＦなどの領域ごとに異なる圧縮方法を指定できる形式のデータを作成する。
【００２８】
一方、文書補正指定スイッチ７がＯＦＦであればデジタルカメラ１は風景モードに移行し、そのままＪＰＥＧなどの画像圧縮データを作成する。各モードでのデータ作成後に、ＣＰＵ１１１はカードメモリ部１２５にカードメモリへの記憶を指示する。カードメモリ部１２５はハードディスクなどであっても外部の記憶装置や端末などであってもよい。また、圧縮を行なわずに画像データをプリンタやモニタに出力することもできる。さらに以下に述べるマクロ領域判別、局所領域判別、適応補正処理はデジタルカメラ１の内部で行なってもよいし、デジタルカメラ１に接続された別のカメラやパーソナルコンピュータの端末などにデータを転送してそこで行なってもよい。
【００２９】
次に文書補正指定スイッチ７がＯＮである場合の処理の流れを示す。
図５は、文書補正指定スイッチ７がＯＮである場合の全体の処理の流れを示すフローチャートである。図を参照して、撮像により得られた画像データが入力されると（Ｓ１）、そのデータには前処理が施される（Ｓ３）。次に、画像データに対しマクロ領域判別が行なわれる（Ｓ５）。これにより、画像データは文字領域、線画領域、または写真領域に分割される。文字領域に対しては、解像度変換、文字補正、２値化などの処理が行なわれる（Ｓ９）。その後、文字領域は２値圧縮される（Ｓ１１）。また、文字領域に対しては、ＯＣＲを行ない、キャラクタコードに変換する処理を行なってもよい。
【００３０】
線画領域および写真領域に対しては、局所領域判別を行なって画素ごとあるいは局所領域ごとに属性を決定し、各属性に応じた適応補正を行なう（Ｓ１３，Ｓ１７）。図５中の線画領域処理（Ｓ１３）、および写真領域処理（Ｓ１７）は、各マクロ領域に応じた局所領域判別を行なう処理と、各マクロ領域に応じた適応補正とを含んでいる。
【００３１】
線画領域に対してはＬｏｓｓｌｅｓｓ圧縮（Ｓ１５）、写真領域に対してはＬｏｓｓｙ圧縮（Ｓ１９）が行なわれる。それぞれの圧縮されたデータは統合化され（Ｓ２１）、カードメモリ部１２５へ出力される（Ｓ２３）。
【００３２】
なお、図５において前処理（Ｓ３）とは、マクロ領域を判別する前の補正であり、レンズ歪み、回転ずれ、あおりなどによる画像の幾何学的変形に対する補正、および露出、カラーバランス、シェーディングなどの補正が含まれる。また、マクロ領域判別（Ｓ５）とは、圧縮単位となる矩形領域の全体的な属性の判別を意味する。
【００３３】
すなわち、デジタルカメラ１では各マクロ領域の属性に適した処理として、画素またはブロック（局所領域）ごとに行なわれる局所的な特徴の判別と、その特徴の判別結果に伴う補正処理とが行なわれる。前者を局所領域判別、後者を適応補正と呼ぶ。
【００３４】
また、マクロ領域の判別結果に従って圧縮方法を変える、適応圧縮が行なわれる（Ｓ１１，Ｓ１５，Ｓ１９）。
【００３５】
一般に、紙原稿には、文字領域、線画領域、写真領域などが含まれる。ここに文字領域とは、黒字の文字のみで構成される矩形領域を示す。線画領域とは、棒グラフやベタ塗り画像など、単色領域とエッジ領域とで主に構成される矩形領域を示す。また、写真領域とは階調の変化する部分を多く含む矩形領域を示し、絵画、イラスト、テクスチャなども写真領域に含まれる。
【００３６】
文字領域は、文字を構成する黒色の部分と、下地を構成する白色の部分とから主に構成される。階調の情報や色情報は文字領域ではあまり重要ではない。一方、階調数や色数が少ないほど、画像の情報量は少なくなる。つまり、解像度が十分であれば文字領域は２値画像であることが圧縮的にも画質的にも好ましい。
【００３７】
また、文字はキャラクタコードとして記録すれば２値圧縮を用いたとき以上に圧縮率を上げることができるため、紙原稿中の文字フォントが汎用的なものであったり、フォント情報があまり重要でない場合などには、文字認識を行なってキャラクタコードとして文字領域を記録すればよい。逆に、手書き文字の情報やフォント情報をユーザが重視する場合には文字領域に対して２値圧縮を行なえばよい。２値圧縮では既存のＪＢＩＧなどを用いればよい。文字認識についても既存の方法を用いることができる。
【００３８】
線画領域は、主に単色領域とエッジ領域とで構成される領域であるため、濃度変化のない部分が極めて多い。ところで、Ｌｏｓｓｙ圧縮では画質劣化を伴うため、複数回数の圧縮で大きな画質劣化を引き起こし得るのに対し、Ｌｏｓｓｌｅｓｓ圧縮では画質劣化がなく画質的には好ましい。しかしながらＬｏｓｓｌｅｓｓ圧縮を用いると、圧縮率が低い場合が多くなる。
【００３９】
しかしながら、Ｌｏｓｓｌｅｓｓ圧縮では、ランレングスやパターンマッチング、および予測符号化などが主に用いられており、単色領域やエッジ領域など同じ濃度の値を有する領域が連続する場合には圧縮率が高くなる。したがって、線画領域にはＬｏｓｓｌｅｓｓ圧縮を施す（Ｓ１５）。
【００４０】
人間の目には大局的には単色領域に見えたとしても、紙原稿自身が有する印刷の解像度や、照明やデジタルカメラ１に依存するノイズやむらなどによって、デジタル化された画像上では全く同じ画素値（画素濃度値）の画素が連続することは少ない。元の紙原稿上では、このようなノイズやむらの情報は重要ではない。すなわち、デジタル化された場合ノイズやむらはないことが好ましい。また、上述のＬｏｓｓｌｅｓｓ圧縮を行なうときに圧縮率を向上させるために、ノイズやむらがないことが好ましい。Ｌｏｓｓｌｅｓｓ圧縮の方法としては、ＰＮＧなどの既存の方法を用いることができる。
【００４１】
したがって、ノイズやむらをなくすため画像データ中の単色領域と判別された部分に対しては単色化を行ない、エッジ領域と判定された部分に対してはエッジ方向の平滑化を行なう。すなわち、判別された局所領域ごとの適応補正が行なわれる。
【００４２】
また、マクロ領域判別は矩形単位で行なわれるため、線画領域と判別されたマクロ領域にも階調領域が含まれ得る。このような領域に対しては、ノイズによる画質劣化と圧縮率の低下とを防ぐために平滑化が行なわれる。
【００４３】
写真領域は、主に階調変化の多い部分から構成され、このような部分は重要な情報である可能性が高い。したがって、写真領域においては階調変化をなるべく維持した処理を行なう。具体的には、写真領域においては単色領域やエッジ領域と判別される領域を少なくする。また、単色領域と判別された領域に対しても、完全な単色化を行なうのではなく、減色を行なう程度に処理をとどめる。また、エッジ整形度合いも低く抑える。さらに、写真領域に対しては、Ｌｏｓｓｌｅｓｓ圧縮では圧縮率が非常に低くなるため、Ｌｏｓｓｙ圧縮を行なう。Ｌｏｓｓｙ圧縮としては、ＪＰＥＧのＤＣＴベース圧縮など既存の方法を用いることができる。
【００４４】
次に、図５の各ステップについて詳しく説明する。
［前処理（Ｓ３）］
図６はデジタルカメラ１が撮像する原稿を示す図であり、図７および図８は、デジタルカメラ１が図６の原稿を撮像することで得る画像データの例を示す図である。図７および図８に示すように、撮影角度やレンズの歪みなどによって、画像データにはあおり（図７）、回転ずれ、歪み（図８）などが発生する。一般に、原稿上の写真領域は矩形であることが多い。したがって、あおり、回転ずれ、歪みがなければ、正確に写真領域を切り出すことができ、圧縮率や画質の点で最適な圧縮を行ないやすい。しかしながら、あおり、回転ずれ、歪みがあることによってこれが困難となりやすい。
【００４５】
図９は、あおりの発生により写真領域を矩形領域として切り出すことができなかった例を説明するための図である。図９に示されるように、マクロ領域判別結果が写真（ハッチング部分）以外の画像を含むこととなるため、画像の圧縮が非効率的となってしまう。
【００４６】
また、文字領域にＯＣＲを行なう場合、あおり、回転ずれ、歪みに起因する文字の歪みやずれが判別精度の低下をもたらしやすい。さらに、図１０に示されるように、解像度が画像の位置によって異なることにつながるため、領域や属性の判別精度が画像の位置によって変化してしまうという問題がある。
【００４７】
本実施の形態においては、このような問題を解決するために適応補正、適応圧縮、およびマクロ領域の判別などの処理の前に、前処理としてあおり、回転ずれ、および歪みを補正する。これによって、マクロ領域の判別や適応補正前の局所領域判別の精度を高くすることができる。また、適応補正や適応圧縮を容易にかつ良好に行なうことができる。
【００４８】
あおりの原因となる撮影角度は、カメラの測距情報や原稿の形などから容易に知ることができる。また、回転ずれは原稿の形や文字列の方向などから容易に補正することができる。歪みに対しては、予めレンズ特性に適した補正手順をカメラに記憶させておくことで補正することができる。すなわち、画素の位置を変換するテーブルなどを用いるようにすればよい。
【００４９】
また、図１１はシェーディングの発生によって画像の位置によって画素値の変化が生じてしまった例を示す図である。このような場合にも、領域や属性の判別に用いるしきい値が一定せず、判別精度に悪影響が生じる。したがって、適応補正、適応圧縮、マクロ領域の判別の処理の前に前処理としてこのようなシェーディングに対する補正も行なう。
【００５０】
露出、色バランス、ホワイトバランス、ダイナミックレンジなどが撮影条件や照明条件に依存しないようにするため、同様に前処理によって補正する。これらはそれぞれのセンサの値を用いたり、画像全体の各色成分の平均値を利用したり、下地を検出して下地部分を基準に色合わせなどを行なう、などの既存の技術を用いることで補正を行なうことができる。
【００５１】
図１２は、幾何学的な補正の例としてのあおり補正の方法を示す図である。図１２（Ａ）はデジタルカメラ１と被写体である原稿２との位置関係を示した図である。図１２において、Ｐはデジタルカメラ１から、原稿２のデジタルカメラ１から遠い方の端までの距離である。原稿２は、下地のエッジ部検出によって検出される。Ｑは、光軸方向のデジタルカメラ１から原稿２までの距離である。Ａは、カメラに近い方の原稿の端を示す。
【００５２】
原稿２のデジタルカメラ１から遠い方の端へのデジタルカメラ１からの方向と、光軸とのなす角をαとし、光軸と原稿２とのなす角をβとし、光軸に垂直な平面と原稿２とのなす角をγとしている。
【００５３】
ｈは、原稿２を光軸と垂直な平面の方向に回転したものを、原稿２が存在する平面に光軸方向に射影した場合の原稿の高さを示す。実際に得られる原稿の高さをｈに拡大することで、撮影角度の影響によって縮んだ高さを補正することができる。なお、通常の撮影では、原稿のサイズや撮影距離または撮影角度は同様な値をとることが多いため、固定値を用いて以降の幾何学的補正を行なうことができる。
【００５４】
図１２（Ｂ）は、図１２（Ａ）の位置関係によって撮像されたためにあおりを生じた画像（ハッチング部分）を示す図である。図１２（Ｃ）は、位置Ａにおける画像の幅Ｗを基準に、図１２（Ｂ）の画像の幅を修正した状態を示す図である。これは、具体的には原稿画像の幅をすべての部分でＷとするものである。
【００５５】
図１２（Ｄ）は、図１２（Ｃ）の画像を、図１２（Ａ）のｈまで高さを拡大して補正したものである。
【００５６】
以上の処理によってあおりが補正された画像（図１２（Ｄ））を得ることができる。
【００５７】
なお、原稿サイズ、撮影距離、撮影角度などが異なる場合にもあおり補正を行なうために、カメラに設けられたセンサによって得られる測距情報を用いてもよい。これは、図１３を参照して、原稿画像Ｄを撮像するときに、その原稿までの距離を数箇所の点Ｐ１〜Ｐ５で測定し、すべての点までの距離が等しくなるように補正を行なうものである。
【００５８】
［マクロ領域判別（Ｓ５）］
図１４は、前処理を行なった後に、原稿画像を文字領域、写真領域、線画領域にマクロ領域判別する様子を示した図である。
【００５９】
このようなマクロ領域の判別方法について以下に説明する。
図１５は、図５のマクロ領域判別処理（Ｓ５）の内容を示すフローチャートである。図を参照して、まず画像データの全体をいくつかのブロック（ここでは８×８の画素を１ブロックとする）に分割し、各ブロックの特徴を抽出する（Ｓ１０１）。ここで、ブロックの特徴としては、画素の濃度のＭａｘ−ｍｉｎ値（１ブロック内の画素の濃度の最大値−最小値）、画素の彩度のＭａｘ−ｍｉｎ値（１ブロック内の画素の彩度の最大値−最小値）、画素の彩度の平均値（１ブロック内の画素の彩度の平均値）、画素濃度の平均値（１ブロック内の画素の濃度の平均値）、網点カウント値（１ブロック内のある画素の濃度がその４近傍にある画素の濃度に対して最大または最小である画素の数）を用いる。
【００６０】
次に、各ブロックの特徴から各ブロックの属性を判別する（Ｓ１０３）。これは具体的には、各ブロックの特徴から各ブロックが、背景ブロックであるか、文字ブロックであるか、写真・線画ブロックであるか、を判別するものである。この判別結果に基づき、文字属性２値マップ、および写真・線画属性２値マップを作成する。文字属性２値マップとは、文字ブロックの部分に「１」が書込まれ、他の部分は「０」とされるマップである。また、写真・線画属性２値マップとは、写真または線画ブロックの位置に「１」が書込まれ、他の部分に「０」が書込まれるマップである。
【００６１】
写真と線画とはブロック単位では特徴が似ており、この段階では判別するのが困難であるため同じ属性として取扱う。
【００６２】
以下に具体的なブロック属性判別処理の手順を説明する。
（１）画素の彩度の平均値があるしきい値より大きいブロックを写真・線画ブロックとし、写真・線画属性２値マップに「１」を書込む。
【００６３】
（２）残りのブロックに対して、網点カウント値があるしきい値より大きいブロックを写真・線画ブロックとし、写真・線画属性２値マップに「１」を書込む。
【００６４】
（３）残りのブロックに対して、画素の濃度のＭａｘ−ｍｉｎ値が、あるしきい値より大きいブロックを文字ブロックとして、文字属性２値マップに「１」を書込む。
【００６５】
（４）残りのブロックに対して、画素の濃度のＭａｘ−ｍｉｎ値が、中程度（あるしきい値と別のあるしきい値との間にある状態）のブロックを写真・線画ブロックとし、写真・線画属性２値マップに「１」を書込む。
【００６６】
（５）残りのブロックのうち画素の濃度の平均値の高いブロックは写真・線画ブロックとし、写真・線画属性２値マップに「１」を書込む。残りは文字ブロックとし、文字属性２値マップに「１」を書込む。
【００６７】
このようにして結果として作成された各属性２値マップには、写真・線画ブロックと文字ブロックとの位置に「１」が書込まれることになる。
【００６８】
次に、誤判別ブロックの修正（孤立ブロックの除去）が行なわれる（Ｓ１０５）。一般に、同属性の領域はある程度の大きさをもって存在するため、誤判別ブロックは孤立して存在する。したがって、ブロック属性判別結果の２値マップに対して孤立ブロックの除去を行ない、これにより誤判別ブロックの修正を行なう。
【００６９】
具体的には、２値マップ上で、注目ブロックを中心に含む３×３の領域を調べ、あるしきい値以上の「１」があれば注目ブロックを「１」にし、なければ「０」に注目ブロックを修正する。
【００７０】
次に、修正された２値マップに対して、外接矩形で写真・線画領域および文字領域を抽出する（Ｓ１０７）。外接矩形の抽出は、図１６に示すように以下の方法で行なう。
【００７１】
（１）２値マップを１ラインずつ順に上から下に走査し、１ブロックでも「１」のブロックがあれば領域の開始ラインとする（ライン（１））。
【００７２】
（２）そのまま走査を続け、１ブロックも「１」のブロックが存在しないラインを領域終了ライン（ライン（２））とし、その間を領域候補とする。
【００７３】
（３）その領域候補間で、今度は横方向に縦１ラインずつ走査し、同様に領域開始ライン（ライン（３））と、終了ライン（ライン（４））とを見つけ、縦／横の開始ラインと終了ラインとで囲まれた矩形領域を抽出する。
【００７４】
（４）これらの手順を数回繰返し、外接矩形領域を抽出する（ライン（５）〜（８））。
【００７５】
以上の手順を文字属性２値マップ、および写真・線画２値マップにそれぞれ施し、文字領域および写真・線画領域がそれぞれ矩形で抽出される。次に、抽出した写真・線画領域について、ブロックの特徴として抽出した画素の彩度のＭａｘ−ｍｉｎ値の矩形領域内での分布を調べる。彩度のＭａｘ−ｍｉｎ値は、写真領域では大きなブロックが多く、線画ブロックでは小さなブロックが多い。そこで矩形内で、彩度のＭａｘ−ｍｉｎ値があるしきい値より大きなブロックが一定数より多い矩形領域を写真領域矩形とし、それ以外を線画領域矩形とする。
【００７６】
以上の手順により、マクロ領域として、文字領域、写真領域および線画領域が抽出される。
【００７７】
［文字、線画、写真領域処理（Ｓ９，Ｓ１３，Ｓ１７）］
これらの処理は、マクロ領域内の局所領域がエッジ領域であるか、階調領域であるか、単色領域であるかを判別し、その判別結果に基づいて適応補正を行なうものである。
【００７８】
図１７は、図１４に含まれる写真領域内において局所領域の判別を行なった結果、階調領域やエッジ領域が検出された状態を示す図である。図に示されるように、写真領域中の文字が書かれている部分の周辺や、画素濃度の変化が特に激しい部分はエッジ領域と判定され、その他は階調領域と判定される。
【００７９】
図１８は、図１４に含まれる線画領域内において局所領域の判別を行なった結果を示す図である。図１８においては、線画領域内で単色領域（画素の色彩、明度および彩度がほとんど変化しない領域）やエッジ領域が検出されている。
【００８０】
線画領域と写真領域とでは、その属性によって局所領域判別と適応補正の処理内容を変える必要がある。
【００８１】
マクロ領域判別で線画領域と判別された領域は、主に線画、色付き文字、色付き下地などから構成される。すなわち単色領域やエッジ領域が比較的多く含まれる。このような領域では、画像の細かい階調変化が重要な意味を持つことは少ない。すなわち、たとえば線画がグラフであれば、グラフが示す内容が重要な意味を持ち、線画が色文字であれば文字と下地の判別の容易さや文字の内容が重要な意味を持つ。したがって、線画領域内では階調領域をエッジ領域や単色領域と誤判別することによる影響は少ない。
【００８２】
したがって、線画領域内の局所領域判別においては、エッジ領域や単色領域が抽出されやすいようなしきい値を設定し、処理を行なう。また、一続きの単色領域の大きさが圧縮率に大きく寄与するため、適応補正処理では、単色領域に対して（減色を行なうのではなく）完全な単色化を行なうか、１つの単色領域の中に複数の単色化領域を設けることで減色化を行なうのであっても、一続きの単色領域に含まれる単色化領域の数が少なくなるように度合いを設定する。
【００８３】
また、単色化を行なう度合いを上げた場合、単色化領域同士の境界部分のエッジ領域のむらが目立ちやすくなるため、エッジの整形度合いも上げる。さらに、線画領域では階調の複雑な変化は少ないと考えられるため、局所領域判別で階調領域と判別された領域はノイズである可能性や重要でない領域である可能性が高い。したがって、階調領域の平滑化度合いを上げて処理を行なう。これによって、画質を向上させることができ、不要な高周波成分を除去することで圧縮率の向上を行なうことができる。
【００８４】
一方、マクロ領域判別で写真領域と判別される領域は、写真、テクスチャなどから主に構成され、階調領域が比較的多く含まれる。このような領域に対しては、階調の複雑な変化が重要な意味を持つことが多い。したがって、階調領域をエッジ領域と誤判別してエッジ整形したり、単色領域と誤判別して単色化した場合、大きく画質を損なうことになりやすい。したがって、これを防ぐために階調領域が抽出されやすいように局所領域判別のしきい値を設定する。
【００８５】
また、仮に誤判別されても適応補正による劣化をできるだけ抑えるように、エッジ整形の度合いを低く抑えたり、一続きの単色領域に完全な単色化を行なうのではなく、単色領域がいくつかの小さな単色化領域に分割されるようにすることで、単色化を、減色化に留めるようにする。また、階調領域の平滑化度合いも低く抑える。
【００８６】
図１９は、図５の線画領域処理（Ｓ１３）の内容を示すフローチャートである。図を参照して、ステップＳ３１でパラメータの設定をＡとする。ステップＳ３３で判別および補正を行なう。
【００８７】
図２０は、図５の写真領域処理（Ｓ１７）の内容を示すフローチャートである。図を参照して、ステップＳ４１でパラメータの設定をＢとする。ステップＳ４３で判別および補正を行なう。
【００８８】
設定Ａと設定Ｂとは、局所領域の判別と適応補正に関するパラメータ集合の設定を示す。設定Ａを採用すると、設定Ｂを採用したときよりも単色領域やエッジ領域の割合が多くなるように局所領域判別が行なわれる。また、補正においては単色化（減色化）度合いやエッジ整形度合いが上がり、また階調処理の平滑化の度合いが大きくなる。
【００８９】
図２１は、設定Ａと設定Ｂとの内容を説明するための図である。図を参照して、設定Ａはマクロ領域が線画領域の場合に採用される設定であり、局所領域判別に用いられるしきい値のＴＨ１を大きくし、ＴＨ２を小さくする設定である。また、エッジ方向の平滑化フィルタにおいては平滑化の度合いが大きくなるようにする。階調処理の平滑化フィルタにおいても平滑化の度合いを大きくする。減色処理方法では減色度合いを大きくし、より単色化に近い処理（または完全な単色化）が行なわれるようにする。
【００９０】
一方、設定Ｂはマクロ領域が写真領域の場合に設定されるものであり、しきい値ＴＨ１を小さくし、ＴＨ２を大きくする設定である。エッジ方向の平滑化フィルタでは平滑化の度合いを小さくし、階調処理の平滑化フィルタでも平滑化の度合いを小さくする。また、減色処理方法においては減色度合いを小さくする。
【００９１】
図２２は、図１９および図２０の判別および補正（Ｓ３３，Ｓ４３）での処理を示すフローチャートである。ステップＳ５１で、局所領域判別が行なわれ、ステップＳ５３で適応補正が行なわれる。これらは、パラメータの設定ＡまたはＢに基づいて行なわれる。
【００９２】
図２３は、図２２の局所領域判別（Ｓ５１）の内容を示すフローチャートである。ステップＳ６１で、局所領域に含まれる画素の画素値が色空間における座標に変換される。ステップＳ６３で変換された座標に基づき局所領域内の最大色空間距離Ｆが算出される。ステップＳ６５で最大色空間距離Ｆに基づいてその局所領域の特性が判別される。ステップＳ６７で判別結果におけるノイズが除去される。
【００９３】
一般に、階調領域での画素濃度の変化は、エッジ領域での変化より緩やかであり、単色領域での変化より急激である。したがって、３×３画素や５×５画素程度の小さな大きさのブロック（局所領域）内の画素値の色空間での分布を考えた場合、単色領域、階調領域、エッジ領域の順に分布範囲が大きくなる。この実施の形態では、色空間での画素の分布を示す指標として、ブロック内の任意の画素の色空間での最大距離を用いている。たとえば、３×３画素のブロック内で処理を行なう場合、９個の画素のうちすべての２画素の組合せに対して色空間での距離を計算し、その最大値Ｆをこのブロックの中心画素の有する画素値変化度（局所領域内の最大色空間距離Ｆ）とするのである（Ｓ６３）。
【００９４】
局所領域判別や適応補正に用いる色空間距離は原稿上の文字や写真の濃度分布の変化の度合いや、人間が視覚的に異なる色であると判定する色を判断する尺度として用いるものであるため、判別精度や補正精度を上げるためには人間の視覚特性に準ずる色空間や色差式を用いることが好ましい。
【００９５】
このような色空間としてはＬａ^*ｂ^*やＬｕ^*ｖ^*などがあり、色差式としては、Ｈｕｎｔｅｒ色差式や、ＣＭＣ色差式や、アダムス＝ニッカーソン色差式などを用いることができる。
【００９６】
また、処理速度を上げるために入力装置や処理装置に依存する色空間、たとえば汎用的なＲＧＢ空間、ＹＵＶ空間などをそのまま用いてもよい。
【００９７】
また、特定の情報を強調したい場合には、それに関連する色空間を用いればよい。たとえば、色相情報を重視して局所領域判別をしたい場合には、ＨＳＢ空間を採用し、色差式内のＨ値の重みを上げてやればよい。
【００９８】
図２４は、Ｒ−Ｇ、Ｂ−Ｇの２次元色空間に３×３画素のブロック内の９画素の位置Ｐ１〜Ｐ９をプロットしたものである。ここでは、局所領域内の最大色空間距離ＦはＰ３とＰ７との間の色差式の値となる。
【００９９】
図２５は、図２３の領域判別処理（Ｓ６５）の内容を示すフローチャートである。ステップＳ７１で、局所領域内の最大色空間距離Ｆの値としきい値とが比較され、Ｆ＞ＴＨ２であれば、その局所領域はエッジ領域であると判定される（Ｓ７３）。ＴＨ１≦Ｆ≦ＴＨ２であれば、その局所領域は階調領域であると判定される（Ｓ７５）。Ｆ＜ＴＨ１であれば、その局所領域は単色領域であると判定される（Ｓ７７）。
【０１００】
図２６は、局所領域内の最大色空間距離Ｆとしきい値ＴＨ１，ＴＨ２と、判定される局所領域との関係を示す図である。最大色空間距離Ｆがあるしきい値ＴＨ１より小さければ単色領域であり、あるしきい値ＴＨ２（＞ＴＨ１）より大きければエッジ領域であり、残りが階調領域となる。前述のように、マクロ領域の判別結果が線画領域の場合は、図２６の単色領域、およびエッジ領域と判定される部分が大きくされる。一方、写真領域の場合には図２６の階調領域と判定される部分が大きくなるようにしきい値が設定される。
【０１０１】
すなわち、Ｌｏｓｓｙ圧縮を用いる写真領域ではしきい値ＴＨ１を小さくかつＴＨ２を大きくし、Ｌｏｓｓｌｅｓｓ圧縮を用いる線画領域では、逆にしきい値ＴＨ１を大きく、ＴＨ２を小さくするものである。
【０１０２】
このようにして、局所領域の判別を行なった後、判別結果のノイズ除去を行なう（図２３のＳ６７）。以下にその理由について説明する。
【０１０３】
単色領域やエッジ領域は連続してある程度大きいサイズを持つことが多い。したがって、局所領域判別された結果の領域サイズが小さい単色領域やエッジ領域はノイズや誤判別である可能性が高い。また、ノイズや誤判別でなかったとしても、連続した領域が小さい単色領域やエッジ領域は、単色化やエッジ整形を行なっても画質の向上や圧縮率の向上には大きな効果をもたらさない。
【０１０４】
したがって、連続した領域であってあまりに小さい単色領域やエッジ領域は、その領域に隣接する領域がある程度大きい領域であるならば、この領域までの距離などから領域統合を行ない、局所領域判別結果におけるノイズとして消去する。
【０１０５】
階調領域では、後述する画素値の変化の激しさに応じた平滑化を行なう。このため、エッジ領域に対し階調領域に対する処理を行なってもほとんど処理がなされず、単色領域に対し階調処理を行なうと減色作用を持つ。つまり、本来エッジ領域や単色領域である領域を階調領域として処理しても大きな画質劣化は生じない。逆に、隣接する領域のサイズも小さい場合には、前述のようにエッジ領域や単色領域を階調領域として処理しても画質や圧縮率に悪影響が起きにくいため、局所領域判別結果が階調領域だったものとして適応処理を行なう。
【０１０６】
図２７は原画像を示す図であり、図２８は図２７に示される画像を処理した結果ハッチングで示されるエッジ領域とハッチングが付されていない階調領域とが局所領域として識別されている状態を示す図である。図２８における局所領域判別結果での面積の小さい領域ＢＬはノイズとして除去されるため、最終的な局所領域判別結果は、図２９に示されるものとなる。
【０１０７】
図３０は、図２２の適応補正（Ｓ５３）の処理の内容を示すフローチャートである。その局所領域の判別結果が、エッジ領域、階調領域、または単色領域のそれぞれであった場合に対応してエッジ処理（Ｓ８３）、階調処理（Ｓ８５）、単色化（または減色化）処理（Ｓ８７）が行なわれる。
【０１０８】
図３１は、図３０のエッジ処理（Ｓ８３）の内容を示すフローチャートである。
【０１０９】
エッジ領域においては、図３２に示されるようなエッジ領域と判定された部分のエッジの方向を判別して（Ｓ９１）、図３３に示すようにエッジ方向に対して平滑化を行ない（Ｓ９３）、図３４に示されるようにエッジと垂直な方向にエッジ強調を行なう（Ｓ９５）。エッジの方向の判別では、縦横それぞれにエッジの存在を調べ、縦横のどちらかにのみエッジがあった場合に、エッジが存在する方向をその画素におけるエッジの方向とする。それ以外の場合には、エッジ方向を特定できないものとしてエッジ補正は行なわない。
エッジ処理は、３×３画素のブロックごとに行なう。ただしズーム倍率に従って５×５画素などにブロックサイズを変更しても同様にエッジ処理を行なうことができる。
【０１１０】
次に、横方向のエッジ存在の判定の具体例について説明する。図３５は、エッジ存在判定に用いる３×３画素のブロックを示す図である。図３５において、Ｅが適応補正の対象となる注目画素に対応する部分である。Ｅの部分において横方向のエッジが存在するとは、ＡＢＣとＤＥＦとの間、またはＤＥＦとＧＨＩとの間の少なくとも１つにエッジがあることをいう。
【０１１１】
ＡＢＣ、ＤＥＦ間のエッジの存在の判断では、入力画像が濃淡画像である場合、ＡＤ、ＢＥ、ＣＦの３つのうち、すべてが同じ向きに、あるしきい値ＴＨｅ１以上の画素値の変化を有するか、または２つ以上が同じ向きに、あるしきい値ＴＨｅ２（＞ＴＨｅ１）以上の画素値の変化を有するかのいずれかの条件を満たせば、エッジが存在すると判断する。またそれらの条件のいずれをも満たさない場合には、エッジは存在しないと判断する。
【０１１２】
ＲＧＢやＹＵＶなどの多次元の色空間においては、エッジの向きに関する情報を得るためにはベクトル距離と内積とを求める必要がある。また、エッジが同じ向きであるかどうかの評価も適切な条件で行なう必要がある。よって、入力画像が単なる濃淡画像ではない場合、ＡＢＣとＤＥＦ間のエッジの存在判定は、ＡＤ、ＢＥ、ＣＦ間の色空間距離の和があるしきい値以上であり、ＡＢＣの平均とＤＥＦの平均の色空間距離が、ＡＤ、ＢＥ、ＣＦ間の色空間距離和に対するＫ１倍（Ｋ１はある定数）以上であるか否かで判定する。
【０１１３】
このような判定について、以下色空間がＲＧＢ空間である場合を例として説明する。
【０１１４】
（Ｒ，Ｇ，Ｂ）＝（Ｐｒ，Ｐｇ，Ｐｂ）の画素値を持つ画素Ｐと、（Ｒ，Ｇ，Ｂ）＝（Ｑｒ，Ｑｇ，Ｑｂ）の画素値を持つ画素ＱのＲＧＢ色空間距離とは、３次元ベクトル（Ｐｒ−Ｑｒ，Ｐｇ−Ｑｇ，Ｐｂ−Ｑｂ）の大きさを示す。
【０１１５】
ＡＤ、ＢＥ、ＣＦ間の色空間距離が大きいとは、これらの間つまり縦に大きい画素値変化があることを意味する。また、ＡＢＣの平均とＤＥＦの平均との色空間距離がＡＤ、ＢＥ、ＣＦ間の色空間距離和のある定数Ｋ１倍以上であるとは、ＡＤ、ＢＥ、ＣＦの画素値変化が方向的に似たものであることを保証するものである。
【０１１６】
たとえば、ＡＤの画素値変化とＢＥの画素値変化とが色空間において全く逆向きで同じ大きさのものであれば、ＡＤ、ＢＥ、ＣＦ間の色空間距離和は大きくても、ＡＢＣの平均とＣＥＦの平均の色空間距離はＣＦ間の色空間距離に一致する。これは、ＡＤ、ＢＥの画素値変化が方向、大きさともに全く同じものであった場合に比べて、小さい色空間距離となる。
【０１１７】
同様に、ＤＥＦ、ＧＨＩ間のエッジの存在についても判定し、どちらかの片方でもエッジがあれば、Ｅは横方向のエッジ画素であると判定される。縦方向のエッジに対しては、ＡＤＧ、ＢＥＨ、ＣＦＩに対して同様に判定を行なう。
【０１１８】
前述のとおり、縦か横のいずれかのみにエッジが存在すると判定された場合にのみ、エッジの存在する方向に平滑化を行なう。縦方向のエッジ画素であると判定された画素に対する縦方向の平滑化は、たとえば図３６（ａ）に示す一般的な平滑化フィルタを用いて行なう。
【０１１９】
横方向も同様に、図３６（ｂ）に示す一般的な平滑化フィルタで平滑化を行なう。
【０１２０】
前述のとおり、線画領域に比べて写真領域では、エッジ整形はなるべく行なわないようにすることが好ましい。したがって、エッジの判定に用いるしきい値ＴＨｅ１，ＴＨｅ２や定数Ｋ１を大きくすることでエッジ整形の対象とする画素を減らしたり、平滑化フィルタを図３７（ａ）や図３７（ｂ）のようなものに変えることでエッジ整形の度合いを写真領域では下げるようにする。
【０１２１】
図３８は、図３０の階調処理（Ｓ８５）の内容を示すフローチャートである。ステップＳ１０１で、画素における輝度の変化度が計算され、ステップＳ１０３で平滑化の演算が行なわれる。
【０１２２】
階調処理においては、高周波成分の量やエッジの度合いに応じて平滑化度合いを変化させる適応平滑化が行なわれる。高周波成分の量は、ＤＣＴの交流成分の和などを用いればよく、エッジの度合いは２次微分フィルタの出力値を用いればよい。平滑化は、図３９に示す一般的な平滑化フィルタを用いることにより行なうことができる。フィルタの中央の値Ｘを高周波成分量やエッジ度合いに比例させてブロックごとに変化させると適応平滑化を行なうことができる。エッジ領域と同様に、線画領域に比べて写真領域では階調処理を行なわない方が好ましい場合が多い。したがって、線画領域に比べて写真領域ではフィルタの中央の値（Ｘ）を大きめに設定する。
【０１２３】
図４０は、図３０の単色（または減色）処理（Ｓ８７）の内容を示すフローチャートである。ステップＳ１１１で、隣接画素の色空間距離が計算される。ステップＳ１１３で平滑化の演算が行なわれ、ステップＳ１１５で単色化（または減色化）の演算が行なわれる。
【０１２４】
線画領域に含まれる単色領域は、原稿中ではベタ塗りがされている領域であると考えられる。したがって、この単色領域内はすべて同じ色と思われるため、単色化処理する。
【０１２５】
図４１は、単色化処理（または減色化処理）について説明するための図である。図４１（Ｃ）は、図４１（Ａ）のヒストグラム分布を持つ単色領域の単色化処理を行なった後のヒストグラムを示す図である。また、図４１（Ｆ）は、図４１（Ｄ）の画素の輝度値を単色化処理した後の画素の輝度値を示す図である。
【０１２６】
図４１（Ａ）〜（Ｃ）においては、横軸は画素の輝度値を示し、縦軸はその輝度値を有する画素の数を示す。図４１（Ｄ）〜（Ｆ）においては横軸は、画素の位置を示し、縦軸はその画素の輝度値を示す。画素位置は、たとえばある画像領域内の１次元の成分を示す。
【０１２７】
写真領域に含まれる単色領域は、写真などの階調画像中の画素値の変化の穏やかな領域であると考えられるため、単色化は行なわずに減色処理にとどめた方が好ましい。すなわち、図４１（Ａ）に示されるヒストグラム分布を、図４１（Ｂ）に示されるヒストグラム分布のようにすることで減色化を行なう。同様に、図４１（Ｄ）の画素の分布を、図４１（Ｅ）のようにすることで減色化を行なう。
【０１２８】
ＪＰＥＧ、ＰＮＧなどの既存の圧縮方法の多くにおいて、画素値が完全に均一である単色化領域は圧縮率が高い。よって、入力時や印刷時などにおけるノイズと思われる画素値変化を強制的に均一化することで、圧縮率を大きく上げることができる。
【０１２９】
なお、隣接画素間の画素値変化が少ないものを統合することで単一色の領域を検出し、領域内の画素値の平均値ですべての画素値を置換することにより単色化を実行できる。減色化は、画素濃度の平滑化を行なったり、ビット数を減らすことで行なうことができる。
【０１３０】
上述のように、線画領域と写真領域とで単色化処理に差をつける方法として、線画領域においては単色化を行ない、写真領域に対しては減色のみを行なうようにしてもよいが、線画領域と写真領域のそれぞれにおいて単一色抽出のためのしきい値や平滑化度合いや、ビット削減数などを変えることで減色の度合いを変えるようにしてもよい。
【０１３１】
［統合化（Ｓ２１）、出力（Ｓ２３）］
適応圧縮された各領域の画像は統合化され、１つのファイルとして出力される。図４２は統合化を行なう状態を示す図である。統合化の例として、ＰＤＦ、ＨＴＭＬなどが既存の方法として挙げられる。
【０１３２】
図４２においては、画像１〜４が統合化されている例を示し、画像１〜画像４のそれぞれのリンク情報が記憶されている。画像１の情報としてＪＰＥＧの画像が記憶され、画像２の情報としてＪＢＩＧ画像が記憶され、画像３の情報としてＪＢＩＧ画像が記憶され、画像４の情報としてＰＮＧ画像が記憶されている。
【０１３３】
なお、文書補正指定スイッチ７がＯＦＦとなっている場合には、既存の一般に用いられているノイズ除去、平滑化、先鋭化、色補正などを画像データに対して行ない、ＪＰＥＧなどの既存の圧縮方法で画像データの圧縮を行なった後、保存、出力、または転送などを行なえばよい（図４３）。
【０１３４】
なお、既存の圧縮方法は極めて多くあり、それぞれ効率よくまたは高画質に圧縮を行なえる画像の種類は異なるものも多い。したがって、圧縮の単位となる矩形領域であるマクロ領域の属性判別は、線画領域、写真領域、文字領域のみに限定されない。
【０１３５】
すなわち、たとえば線画領域をさらに複数の領域に分解して検出するようにしてもよい。または全く別の領域判別、たとえば印刷物の種類に従って領域判別を行なうようにしてもよい。
【０１３６】
このような場合、図４４に示されるフローチャートを図５のフローチャートに代えて用いることができる。すなわち、図５の例においてはマクロ領域を３つの種類に分けることとしたが（Ｓ７）、図４４の例では、マクロ領域を領域１〜ＫのＫ種類に分け、それぞれにおいて局所領域を判別し、判別されたマクロ領域や局所領域に適応した補正や圧縮を行なう。
【０１３７】
［第２の実施の形態］
第２の実施の形態におけるデジタルカメラの外観は、図２および３に示されるものと同じである。
【０１３８】
図４５は、本発明の第２の実施の形態におけるデジタルカメラの回路構成を示すブロック図である。図を参照して、デジタルカメラはＣＰＵ２１１と、撮影対象からの光を光電変換するＣＣＤ部２０９と、ＣＣＤ部２０９からの画像データを一旦記憶するＲＡＭ２０１と、画像データに対し前処理を行なう前処理部２０３と、前処理された画像データから文字領域を判別する文字判別部２０５と、文字判別後の画像データに対し局所領域判別を行なう局所領域判別部２０７と、局所領域判別後の画像データに対しマクロ領域判別を行なうマクロ領域判別部２１３と、適応補正部２１７と、文字データを処理する文字処理部２１９と、画像の圧縮を行なう圧縮部２２７と、圧縮された画像データを統合し出力する画像統合部２２５と、圧縮された画像データを記憶するカードメモリ部２２９と、撮像のための各種演算を行なうＡＷＢ、ＡＥなど演算部２２３と、シャッタボタン２２１と、画像データを表示する表示部２１５とを備えている。
【０１３９】
また、デジタルカメラに外部記憶装置２２９を接続し、ＣＤ−ＲＯＭ２３１やフロッピィディスク２３３から後述のフローチャートなどを実行するプログラムをＣＰＵ２１１に対し読込むようにしてもよい。
【０１４０】
本実施の形態におけるデジタルカメラは第１の実施の形態におけるデジタルカメラと比較して、局所領域の判別を行なった後に、マクロ領域の判別を行なうことを特徴としている。これにより、マクロ領域の判別に局所領域の判別結果を利用することが可能となる。
【０１４１】
次に、具体的に文書補正指定スイッチ７がＯＮである場合の本実施の形態におけるデジタルカメラの処理の流れを説明する。
【０１４２】
図４６は、文書補正指定スイッチ７がＯＮである場合の処理の流れを示すフローチャートである。入力された画像データ（Ｓ２０１）は、前処理された後に（Ｓ２０３）、文字領域が判別される（Ｓ２０５）。文字領域には、解像度変換、文字補正、２値化などの処理が行なわれ（Ｓ２１５）、２値圧縮される（Ｓ２１７）。
【０１４３】
また、文字領域に対してＯＣＲを行ないキャラクタコードに文字領域のデータを変換するようにしてもよい。
【０１４４】
非文字領域に対しては、局所領域判別を行なって画素ごとまたは局所領域ごとに属性を決定する（Ｓ２０９）。局所領域の判別結果を利用してマクロ領域判別が行なわれる（Ｓ２１１）。
【０１４５】
単色領域やエッジ領域が局所領域として多く含まれるマクロ領域は線画である可能性が高い。これに対し、階調領域が局所領域に多く含まれるマクロ領域は写真領域である可能性が高い。この性質を利用して、マクロ領域判別において線画領域と写真領域との判別は、局所領域の属性に基づき行なう。
【０１４６】
すなわち、図１７および図１８を参照して、写真領域には階調領域が多く含まれ、線画領域には単色領域やエッジ領域が多く含まれるからである。
【０１４７】
つまり、第１の実施の形態においては彩度のＭａｘ−ｍｉｎ値が、写真領域では大きなブロックが多く、線画ブロックでは小さなブロックが多いという特徴に基づいて写真領域と線画領域とを区別することとしたが、本実施の形態においては局所領域判別で、単色領域あるいはエッジ領域と判別された局所領域をある一定のしきい値以上の割合で含むマクロ領域を線画領域と判定し、そうでないマクロ領域を写真領域として判別する。
【０１４８】
再び図４６に戻って、局所領域の判別結果とマクロ領域の判別結果とに応じた適応補正が行なわれる。すなわち、図４６中の、線画領域処理（Ｓ２１９）と、写真領域処理（Ｓ２２３）とは、各領域に応じた適応補正を示す。線画領域に対しては、Ｌｏｓｓｌｅｓｓ圧縮（Ｓ２２１）が、写真領域に対してはＬｏｓｓｙ圧縮（Ｓ２２５）が行なわれる。
【０１４９】
図４７は図４６の線画領域処理（Ｓ２１９）の内容を示すフローチャートであり、図４８は図４６の写真領域処理（Ｓ２２３）の内容を示すフローチャートである。図４７および図４８中のパラメータ設定Ａとパラメータ設定Ｂとは、それぞれ線画領域と写真領域とで用いる適応補正に関するパラメータ集合の設定を示す。
【０１５０】
パラメータ設定Ｂに対して、パラメータ設定Ａでは、単色化度合いやエッジ整形度合いを上げるような設定がなされる。具体的には、パラメータ設定Ｂに比べて、パラメータ設定Ａでは平滑化度合いの大きいフィルタが用いられるなどの第１の実施の形態と同様の処理が行なわれる。
【０１５１】
なお、既存の圧縮の方法は極めて多くあり、それぞれ効率的または高画質に圧縮を行なえる画像の種類は異なるものも多い。したがって、圧縮単位となるマクロ領域の属性判別である対象は、線画領域、写真領域、文字領域に限定されない。たとえば、線画領域をさらに複数の領域に分割したり、または全く別の判別（たとえば印刷物の種類に従って領域判別することなど）も考えられる。この場合、図４６の処理に代えて、図４９の処理を実行すればよい。
【０１５２】
図４９を参照して、入力された画像データ（Ｓ２５１）は、前処理された後に（Ｓ２５３）、マクロ領域の領域の形が判別される（Ｓ２５５）。このとき判別された各領域１〜Ｋごとにその内部の局所領域が判別され（Ｓ２５９，Ｓ２３９，Ｓ２４９）、その結果に基づいてそのマクロ領域の属性が判別される（Ｓ２３１，Ｓ２４１，Ｓ２５１）。その後、それぞれのマクロ領域および局所領域に応じた適応補正が行なわれ（Ｓ２３３，Ｓ２４３，Ｓ２５３）、マクロ領域ごとに圧縮が行なわれる（Ｓ２３５，Ｓ２４５，Ｓ２５５）。その後、圧縮された画像データは統合され（Ｓ２５７）、出力される（Ｓ２５９）。
【０１５３】
なお、実施の形態において説明したフローチャートを実行するプログラムを、ＣＤ−ＲＯＭ１３１，２３１やフロッピィディスク１３３，２３３に記憶させ、外部記憶装置１２９，２２９を介し、ＣＰＵ１１１，２１１に実行させるようにしてもよい（図４、図４５参照）。
【図面の簡単な説明】
【図１】本発明の実施の形態の１つにおけるデジタルカメラ１と撮像対象である原稿２との関係を示す図である。
【図２】デジタルカメラ１をレンズの側から見た図である。
【図３】デジタルカメラ１を表示部の側から見た図である。
【図４】デジタルカメラ１のハードウェア構成を示すブロック図である。
【図５】文書補正指定スイッチ７がＯＮである場合の処理を示すフローチャートである。
【図６】原稿の一例を示す図である。
【図７】図６の原稿を撮像したときに生ずるあおりを説明するための図である。
【図８】図６の原稿を撮像したときに生ずる歪みを説明するための図である。
【図９】写真領域が矩形でない場合の問題点を説明するための図である。
【図１０】解像度の相違が生じた場合の問題点を説明するための図である。
【図１１】シェーディングが発生した場合の問題を説明するための図である。
【図１２】あおり補正の具体例を説明するための図である。
【図１３】あおり補正における測距データの取得方法について説明するための図である。
【図１４】画像データがマクロ領域に分割される状態を説明するための図である。
【図１５】図５のマクロ領域判別（Ｓ５）の内容を示すフローチャートである。
【図１６】マクロブロックの矩形化方法を説明するための図である。
【図１７】マクロ領域に含まれる局所領域について説明するための第１の図である。
【図１８】マクロ領域に含まれる局所領域について説明するための第２の図である。
【図１９】図５の線画領域処理（Ｓ１３）の内容を示すフローチャートである。
【図２０】図５の写真領域処理（Ｓ１７）の内容を示すフローチャートである。
【図２１】パラメータ設定Ａとパラメータ設定Ｂとの関係を説明するための図である。
【図２２】図１９および図２０の判別および補正処理（Ｓ３３，Ｓ４３）の内容を示すフローチャートである。
【図２３】図２２の局所領域判別（Ｓ５１）の内容を示すフローチャートである。
【図２４】最大色空間距離Ｆの求め方について説明するための図である。
【図２５】図２３の領域判別（Ｓ６５）の内容を示すフローチャートである。
【図２６】しきい値ＴＨ１とＴＨ２と判別される領域との関係を説明するための図である。
【図２７】局所領域の判別の対象となるマクロ領域の具体例を説明するための図である。
【図２８】図２７の状態から局所領域が判別された状態を示す図である。
【図２９】図２８の状態からノイズ除去が行なわれた状態を説明するための図である。
【図３０】図２２の適応補正（Ｓ５３）の内容を示すフローチャートである。
【図３１】図３０のエッジ処理（Ｓ８３）の内容を示すフローチャートである。
【図３２】エッジ処理の対象となる画像データを示す図である。
【図３３】図３２の画像データに平滑化が行なわれた後の状態を示す図である。
【図３４】図３３の画像データにエッジ強調が行なわれた状態を示す図である。
【図３５】エッジ処理に用いるフィルタを説明するための図である。
【図３６】線画領域において用いられる平滑化フィルタの具体例を示す図である。
【図３７】写真領域において用いられる平滑化フィルタの具体例を示す図である。
【図３８】図３０の階調処理（Ｓ８５）の内容を示すフローチャートである。
【図３９】階調処理で用いられるフィルタを示す図である。
【図４０】図３０の単色化（または減色化）処理（Ｓ８７）の内容を示すフローチャートである。
【図４１】単色化（または減色化）処理の具体例を説明するための図である。
【図４２】画像の統合の方法を説明するための図である。
【図４３】風景モードにおいて出力される画像データを示す図である。
【図４４】第１の実施の形態の変形例を示すフローチャートである。
【図４５】第２の実施の形態におけるデジタルカメラのハードウェア構成を示すブロック図である。
【図４６】第２の実施の形態における処理を示すフローチャートである。
【図４７】図４６の線画領域処理（Ｓ２１９）の内容を示すフローチャートである。
【図４８】図４６の写真領域処理（Ｓ２２３）の内容を示すフローチャートである。
【図４９】第２の実施の形態の変形例を示すフローチャートである。
【符号の説明】
１デジタルカメラ
７文書補正指定スイッチ
１０３，２０３前処理部
１０５，２１３マクロ領域判別部
１０７，２０７局所領域判別部
１１３，２１７適応補正部
１１５，２１９文字処理部
１１９，２２７圧縮部
１２７，２２５画像統合部
１２５，２２８カードメモリ部
１３１，２３１ＣＤ−ＲＯＭ
１３３，２３３フロッピィディスク

Claims

入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別する第１の判別手段と、
線画領域と、写真領域のそれぞれについて階調領域を判別する第２の判別手段と、
線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくする平滑化手段とを備えた、画像処理装置。
前記入力された画像から第１の判別手段により判別される線画領域および写真領域について単色領域を判別する第３の判別手段と、
前記判別された単色領域において単色化を行なう単色化手段とをさらに備えた、請求項１に記載の画像処理装置。
前記平滑化または単色化が行なわれた領域の圧縮を行なう圧縮手段をさらに備えた、請求項２に記載の画像処理装置。
入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別するステップと、
線画領域と、写真領域のそれぞれについて階調領域を判別するステップと、
線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくするステップとを備えた、画像処理方法。
入力された画像から、黒字の文字のみで構成される文字領域、単色領域とエッジ領域とで主に構成される線画領域、階調の変化する部分を多く含む写真領域を判別するステップと、
線画領域と、写真領域のそれぞれについて階調領域を判別するステップと、
線画領域における階調領域については平滑化の度合いを大きくし、写真領域における階調領域については平滑化の度合いを小さくするステップとをコンピュータに実行させることを特徴とする、画像処理プログラムを記録した記録媒体。