JP4442701B2

JP4442701B2 - 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム

Info

Publication number: JP4442701B2
Application number: JP2008146822A
Authority: JP
Inventors: 俊浩森; 修田村
Original assignee: Konica Minolta Business Technologies Inc
Current assignee: Konica Minolta Business Technologies Inc
Priority date: 2008-06-04
Filing date: 2008-06-04
Publication date: 2010-03-31
Anticipated expiration: 2028-06-04
Also published as: JP2009296218A; US8311333B2; US20090304295A1

Description

本発明は、スキャナで読み取った画像データを圧縮する方法およびその圧縮を行う画像処理装置などに関する。

従来、複合機またはＭＦＰ（Multi Functional Peripherals）などと呼ばれる画像処理装置を用いて、原稿をスキャンして得られた画像データを電子メールに添付して送信することがよく行われている。近年、そのような画像形成装置のカラー対応の機種が多く用いられるようになり、カラーの画像データを電子メールに添付して送信する需要が高まっている。

ところが、カラーの画像データは、例えばＡ４サイズの原稿をフルカラーの３００ｄｐｉでスキャンした場合に、そのデータ量が２５ＭＢ程度にもなるので、そのまま電子メールに添付して送信することが困難な場合がある。よって、そのような画像データは、圧縮して送信するのが一般的である。しかし、電子メールでの送信を可能とするために画像データの全体を高い圧縮率で圧縮するとそれに含まれている文字がつぶれて読めなくなってしまうことがある。また、文字が読めるように圧縮率を低くして圧縮するとファイルサイズを十分に小さくできないことがある。

そこで、従来、高圧縮ＰＤＦ（Portable Document Format）またはコンパクトＰＤＦなどと呼ばれる、高い圧縮率のＰＤＦファイルを生成する技術を用いてデータ量を少なくする工夫がなされている。この技術では、次のようにしてＰＤＦファイルを生成する。

変換の対象の画像（対象画像）に含まれる文字、図形、および写真などのオブジェクトの領域を抽出する。抽出した領域が文字の領域であるか文字以外の領域であるかを判別する。文字の領域に対しては、二値化を行い、その文字の代表色を１つ決定する。さらに、その文字の判読性を考慮した圧縮処理を行う。文字以外の領域に対しては高い圧縮率で圧縮処理を行う。これによって、文字の判読性を考慮した高い圧縮率のＰＤＦファイルを生成する。

ところで、対象画像に地図が含まれていることがある。通常、地図には、地名などの示す文字が含まれている。上述の高圧縮ＰＤＦの生成において、そのような地図の領域は、文字以外の領域と判別される。そうすると、その地図に含まれる文字の判読性を考慮した圧縮処理がなされないので、それらの文字が読みにくくなってしまう。

よって、地図に含まれる文字の判読性を維持するには、地図の領域に適した圧縮処理を行う必要があり、そのために、地図の領域とそれ以外の領域とを判別する必要がある。

地図の領域の判別に関連する技術として、従来、特許文献１、２のような方法が提案されている。

特許文献１の方法によると、地図原稿を原稿読取部によって読みとって得られた原稿画像の濃度分布特性を示すヒストグラムを生成する。生成したヒストグラムを用いて、その原稿画像に含まれる高濃度成分、中濃度成分、および低濃度成分の全濃度成分に対する各割合を求める。そして、中濃度成分および高濃度成分の割合が低濃度成分の割合よりも高い場合にその原稿画像を外国製地図の原稿画像であると判別し、中濃度成分および高濃度成分の割合が低濃度成分の割合よりも低い場合にその原稿画像を日本製地図の原稿画像であると判別する。

特許文献２の方法によると、原稿の画像に対して、所定サイズ（縦５画素×横５画素）の尾根画素パターンを用いてパターンマッチングを行うことにより、その画像に含まれる網点上の文字画素を検出する。その文字画素の個数が多い場合に、その原稿を地図的原稿と判別し、多くない場合に一般原稿と判別する。
特開２００５―７９７８７号公報特開平１０―２８５３９４号公報

上述のように特許文献１の方法では、中濃度成分および高濃度成分の画素の割合が多いか否かに基づいて領域の判別を行う。このような判別方法を適用して地図の領域とそれ以外の領域とを判別しようとすると、地図と似た濃度分布特性を持った写真などの領域が誤って地図の領域であると判別されてしまう。従って、特許文献１の方法では、地図とそれ以外の領域とを正確に判別できない可能性が高い。

特許文献２の方法では、注目画素を決定し、その注目画素および周辺の画素に対して所定のサイズの尾根画素パターンを用いてパターンマッチングを行い、その注目画素が文字の画素か否かを判定する。そのような処理を１画素ずつ全ての画素に対して行わなければならないので、多くの計算量を要してしまう。

本発明はこのような問題点に鑑み、従来よりも簡単な処理で地図の領域を的確に判別できるようにすることを目的とする。

本発明の一形態に係る領域判別方法は、画像に含まれる領域の判別方法であって、前記画像を二値化することによって二値画像を生成し、前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、前記二値化画素率および前記細線画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する。

本発明の一形態に係る画像圧縮方法は、画像を二値化することによって二値画像を生成し、前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、前記二値化画素率および前記細線画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別し、写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、地図の領域と判別した場合は、前記特定の領域の画像を、低解像度化することなく、圧縮する。

好ましくは、前記特定の領域を地図の領域と判別した場合は、写真の領域と判別した場合の圧縮率よりも低い圧縮率で圧縮する。

本発明の他の形態に係る画像圧縮方法は、前記画像を二値化することによって二値画像を生成し、前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、前記二値化画素率および前記細線画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別し、写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、地図の領域と判別した場合は、写真の領域と判別した場合に行う低解像度化よりも解像度が高くなるように前記特定の領域の画像を低解像度化した後で、当該画像を圧縮する。

本発明によると、従来よりも簡単な処理で地図の領域を的確に判別できるようになる。

図１は本発明の一実施形態に係る画像形成装置１のハードウェア構成の例を示す図である。

画像形成装置１は、コピー、スキャナ、ファックス、ネットワークプリンティング、ドキュメントサーバ、およびファイル転送などの様々な機能を集約した画像処理装置である。複合機またはＭＦＰ（Multi Function Peripherals）などと呼ばれることもある。

画像形成装置１は、図１に示すように、スキャナ１０ａ、ＣＰＵ１０ｂ、ハードディスク１０ｃ、ＲＡＭ１０ｄ、ＲＯＭ１０ｅ、印刷装置１０ｆ、モデム１０ｇ、ネットワークインタフェース１０ｈ、制御用回路１０ｋ、および操作パネル１０ｍなどによって構成される。

スキャナ１０ａは、原稿の用紙（以下、単に「原稿」と記載する。）に描かれている写真、文字、絵、図表などの画像を光学的に読み取って電子データ化する装置である。読み取られた画像は、ＲＧＢ（Ｒ（赤）、Ｇ（緑）、およびＢ（青））によって表されるビットマップなどの形式の画像データとして保存される。予め指定しておくことによって、ＰＤＦ（Portable Document Format）またはＸＰＳ（XML Paper Specification）の形式で保存することもできる。

ＣＰＵ１０ｂは、スキャナ１０ａが読み取った原稿の画像データをＴＩＦＦ、ＪＰＥＧ、ビットマップ、およびＰＤＦなどの形式のファイルに変換するための処理を行う。また、ユーザからの入力の検出、操作パネル１０ｍの表示の制御，または電子メールの作成など、画像形成装置１の全体的な制御も行う。

印刷装置１０ｆは、スキャナ１０ａで読み取られた画像データの画像または他の装置から送信されてきた画像データの画像を用紙に印刷する装置である。画像形成装置１がカラー印刷に対応している場合は、イエロー、マゼンタ、シアン、およびブラックの４色のトナーを用いて印刷を行う。

操作パネル１０ｍは、ユーザが画像形成装置１に対して種々の入力を行うための装置である。操作部および表示部などによって構成される。ユーザは、操作パネル１０ｍを用いて、画像データの保存形式の選択、スキャンの条件の設定、処理の開始または実行の指令の入力、電子メールの宛先の入力などの種々の入力を行うことができる。

モデム１０ｇは、ＮＣＵ（Network Control Unit）が内蔵されており、アナログの公衆回線を介して他のファックス端末と接続し、ファクシミリプロトコルに基づくデータ制御およびファックスデータの変復調などを行う。

ネットワークインタフェース１０ｈは、ＮＩＣ（Network Interface Card）であって、ＬＡＮまたはインターネットなどを介して他の装置への接続を行う。

制御用回路１０ｋは、ハードディスク１０ｃ、操作パネル１０ｍ、スキャナ１０ａ、印刷装置１０ｆ、モデム１０ｇ、およびネットワークインタフェース１０ｈなどの装置を制御するための回路である。制御用回路１０ｋは、例えば、種々の電子部品を用いたハードウェア回路によって構成される。

ハードディスク１０ｃには、後に説明する図２に示すような各部の機能を実現するためのプログラム（コンピュータプログラム）およびデータなどが格納されている。これらは必要に応じてＲＡＭ１０ｄに読み出され、ＣＰＵ１０ｂによってプログラムが実行される。これらのプログラムまたはデータの一部または全部を、ＲＯＭ１０ｅに記憶させておいてもよい。または、図２の機能の一部または全部を、制御用回路１０ｋによって実現するようにしてもよい。

図２は画像形成装置１の機能的構成の例を示す図、図３は原稿に印刷された画像の例を示す図である。次に、原稿をスキャナ１０ａで読み取って得られる原稿画像データＧＤを、ＰＤＦ形式のファイル（ＰＤＦファイル）に変換して保存する際の画像形成装置１の各部の処理について、図２および図３を参照しながら説明する。

図２に示すように、画像形成装置１は、画像データ取得部１１、前処理部１２、領域抽出部１３、領域判別部１４、写真地図領域処理部１５、文字背景分離部１６、および文字圧縮処理部１７、減色処理部１８、図形圧縮処理部１９、低解像度化部２０、背景等圧縮処理部２１、地図圧縮処理部２２、ファイル生成部２３、およびファイル保存部２４などによって構成される。

ユーザが原稿をスキャナ１０ａにセットし、保存形式をＰＤＦに設定してスキャンの実行のコマンドを入力すると、スキャナ１０ａは、その原稿の画像をスキャンし、予め指定された、ＴＩＦＦ、ＪＰＥＧ、およびビットマップなどの形式の、ＲＧＢで表される原稿画像データＧＤを生成する。

画像データ取得部１１は、その原稿画像データＧＤを取得する。前処理部１２は、画像形式の変換、解像度の変換、および下地除去などの処理を行う。

領域抽出部１３は、原稿画像データＧＤの画像（原稿画像）に含まれる文字、図形、および写真などの各オブジェクトが描かれた領域を抽出することによってラベリングの処理を行う。この処理は例えば次のようにして行う。

原稿画像データＧＤを二値化する。その二値化によって得られた画像（二値画像）において、文字、図形、および写真などを形成する連続する黒画素である黒画素群を検出する。比較的近い距離にある黒画素群同士は、一つの黒画素群として検出する。検出した黒画素群を包含する矩形の領域（矩形領域）を求める。すなわち、例えばその矩形領域の二値画像内における位置（つまり、原稿画像内における位置）を求める。以下、このような矩形領域を「ブロックＢＫ」と記載する。

例えば、図３（ａ）に示すような原稿画像であった場合は、この領域抽出部１３の処理によって、図３（ｂ）に示すような、文字を包含するブロックＢＫ１１、１２、…、図形を包含するブロックＢＫ３１、および写真を包含するブロックＢＫ４１などが求められる。

領域判別部１４は、ブロックＢＫのサイズまたはブロックＢＫ内に描かれているオブジェクトのエッジ部分の画素数などに基づいて、ブロックＢＫの種別を判別する。すなわち、各ブロックＢＫが、文字、図形、またはそれ以外のいずれのブロックＢＫであるかを判別する。なお、本実施形態では、表を含むブロックＢＫも文字のブロックＢＫと判別される。

写真地図領域処理部１５は、領域判別部１４によって種別が文字または図形のいずれでもないと判別されたブロックＢＫ（以下、「非文字図形ブロックＢＫｈ」と記載する。）について、写真地図判別処理を行い、それが写真または地図のいずれのブロックＢＫであるかを判別する。さらに、写真のブロックＢＫと判別されたブロックＢＫに含まれる文字を抽出し、その文字を包含するブロックＢＫを求める。写真地図領域処理部１５の詳細な処理の手順については後で説明する。

文字背景分離部１６は、領域判別部１４によって文字のブロックＢＫと判別されたブロックＢＫおよび写真地図領域処理部１５によって求められた文字のブロックＢＫについて、それらのブロックＢＫ内に含まれる文字の部分と背景の部分とを分けるための処理を行う。この処理は次のようにして行う。

原稿画像の、そのブロックＢＫに対応する部分を二値化する。その部分に二値化の閾値よりも濃度が低い下地（背景）にその閾値よりも濃度の高い文字が描かれている場合、すなわち薄い背景に濃い色で文字が描かれている場合、文字を形成する画素がドットが打たれた画素である黒画素となり、背景の画素がドットが打たれていない画素である白画素となる。すなわち、文字を形成する画素と背景の画素とが黒画素と白画素とによって分けられる。以下、原稿画像の、ブロックＢＫに対応する部分の画像を「部分原稿画像」と記載する。

文字圧縮処理部１７は、文字を形成する画素のデータをＭＭＲなどの可逆圧縮の方式で圧縮する。このとき低解像度化の処理を行うことなく圧縮する。

減色処理部１８は、図形のブロックＢＫであると判別されたブロックＢＫの部分原稿画像のデータに対して減色処理を行い、色を均一化させる。図形圧縮処理部１９は、減色処理が施された後のデータをＦＬＡＴＥなどの可逆圧縮の方式で圧縮する。

低解像度化部２０は、写真のブロックＢＫであると判別されたブロックＢＫの部分原稿画像のデータに対して低解像度化の処理を行う。また、文字背景分離部１６によって特定された背景の部分に対して低解像度化の処理を行う。この処理では、解像度を例えば３００ｄｐｉから１５０ｄｐｉ程度に下げる。

背景等圧縮処理部２１は、低解像度化された後の写真および文字の背景のデータをＪＰＥＧなどの圧縮の方式で圧縮する。

地図圧縮処理部２２は、地図のブロックＢＫであると判別されたブロックＢＫの部分原稿画像のデータをＪＥＰＧなどの圧縮の方式で圧縮する。この際、写真および背景よりも画質が良好に保たれるように、少なくとも背景等圧縮処理部２１による圧縮よりも圧縮率が低くなるように圧縮する。

ファイル生成部２３は、文字圧縮処理部１７、図形圧縮処理部１８、背景等圧縮処理部２１、および地図圧縮処理部２２によって生成されたそれぞれの圧縮データを用いてＰＤＦファイルを生成する。ファイル保存部２４は、生成されたＰＤＦファイルを保存する。

図４は写真地図領域処理部１５の構成の例を示す図、図５は写真の画像の例を示す図、図６は地図の画像の例を示す図、図７は写真地図判別処理の流れを説明するためのフローチャート、図８は複数の地図のサンプルの二値化画素率と細線画素率との関係を示す図、図９は複数の写真のサンプルの二値化画素率と細線画素率との関係を示す図である。

次に、図４に示す写真地図領域処理部１５の処理について、図５〜図９を参照しながら説明する。また、図５（ａ）に示すような写真および図６（ａ）に示すような地図を含む原稿画像が処理の対象であるものとして説明する。

明度画像生成部１０１は、ＲＧＢで表される原稿画像データＧＤを明度変換して、原稿画像に対応した、すなわち原稿画像データＧＤが表す原稿画像を明度で示す明度原稿画像データＭＧを生成する（図７の＃１０１）。

二値化部１０２は、生成された明度原稿画像データＭＧを二値化することによって、原稿画像に対応した二値の画像（二値原稿画像）を示す二値原稿画像データＮＧを生成する（＃１０２）。これによって、図５（ａ）および図６（ａ）の原稿画像は、それぞれ、図５（ｂ）および図６（ｂ）のような二値の画像に変換される。

二値化画素率算出部１０３は、二値原稿画像の、非文字図形ブロックＢＫｈに対応する部分に含まれる黒画素の、その非文字図形ブロックＢＫｈに含まれる画素の総数に対する割合である二値化画素率を、各非文字図形ブロックＢＫｈのそれぞれについて算出する（＃１０３）。

細線化部１０４は、二値原稿画像データＮＧに対して細線化処理を行い、原稿画像に対応する細線原稿画像を示す細線原稿画像データＳＧを生成する（＃１０４）。以下、細線原稿画像データＳＧにおいてドットが打たれている画素のこと、すなわち細線を形成する画素のことを「細線画素」と記載する。これによって、図５（ｂ）および図６（ｂ）の二値原稿画像は、それぞれ、図５（ｃ）および図６（ｃ）のような細線で表される画像に変換される。

細線画素率算出部１０５は、細線原稿画像の、非文字図形ブロックＢＫｈに対応する部分に含まれる細線画素の、二値原稿画像の、その非文字図形ブロックＢＫｈに対応する部分に含まれる黒画素の総数に対する割合である細線画素率を、各非文字図形ブロックＢＫｈのそれぞれについて算出する（＃１０５）。

ところで、図５（ａ）および図６（ａ）の例でも分かるように、地図は、写真に比べて下地の色が薄く文字を多く含む傾向がある。従って、地図を表す画像を二値化すると図６（ｂ）に示すように下地の部分が白画素となるので、写真に比べて黒画素（二値化画素）の個数が少なくなる。さらにその二値化された画像を細線化すると、図６（ｃ）に示すように多く含まれている文字の部分が細線画素として残るので、黒画素に対する細線画素の割合が多くなる。

地図の画像および写真の画像の複数のサンプルを用いて、図８および図９のように二値化画素率と細線画素率との関係をグラフに表すと、上述のような地図の特徴と写真の特徴との差をさらにわかりやすく見ることができる。

図８には、複数の地図のサンプルについての二値化画素率と細線画素率との関係を示す点の分布が示される。図９には、複数の写真のサンプルについての二値化画素率と細線画素率との関係を示す点の分布が示される。

図８および図９から分かるように、写真は二値化画素率が３０％以上になるものが多く、地図は１０％以下になるものが多い。よって、二値化画素率に基づいて、ある程度、写真および地図の判別することは可能である。しかし、その方法では、二値化画素率が２０％前後の画像を正確に判別することが難しい。そこで、本実施形態では、さらに細線画素率も考慮して判別を行う。

図８および図９の例では、写真は、細線画素率が「２０％」以下となることが多く、地図は「２０％」以上となることが多い。よって、単純に細線画素率の「２０％」を境にして写真と地図との判別を行うこともできるが、本実施形態では、判別の精度を高めるために、傾きの「ａ」および切片の「ｂ」の２つのパラメータによって求まる「Ｙ＝−ａＸ＋ｂ」の直線を境界線として用いて判別する。図８および図９の例では、ａの値が「−１／５」程度およびｂの値が「２０」程度のときに判別の精度がよい。なお、ａの値を「０」として、「Ｙ＝ｂ」の直線を境界線としてもよい。

写真地図判別部１０６は、非文字図形ブロックＢＫｈの細線画素率および二値化画素率に基づいて、その非文字図形ブロックＢＫｈが写真のブロックＢＫであるか地図のブロックＢＫであるかを判別する（＃１０６）。本実施形態では、二値化画素率（Ｘ）と細線画素率（Ｙ）とが式（１）の条件を満たす場合に（＃１０６でＹｅｓ）、そのブロックＢＫを地図のブロックＢＫであると判別する（＃１０７）。

Ｙ≧−ａＸ＋ｂ …（１）
（ａ，ｂ：正の数）
二値化画素率（Ｘ）と細線画素率（Ｙ）とが式（２）の条件を満たす場合に（＃１０６でＮｏ）、そのブロックＢＫを写真のブロックＢＫであると判別する（＃１０８）。

Ｙ＜−ａＸ＋ｂ …（２）
（ａ，ｂ：正の数）
文字抽出部１０７は、写真のブロックＢＫと判別された各ブロックＢＫに含まれる文字を抽出し、その文字を包含するブロックＢＫを求める。この抽出は、公知の方法を用いて行う。これによって、例えば図３の例では、写真のブロックＢＫ４１に含まれる各文字を包含するブロックＢＫが求められる。

図１０はＰＤＦファイルを生成する際の画像形成装置１の全体的な処理の流れを説明するためのフローチャートである。

ユーザがスキャナ１０ａに原稿をセットし、保存の形式としてＰＤＦを選択してスキャンの実行を指示すると、画像形成装置１は、その原稿をスキャンし（図１０の＃２０１）、スキャンによって得た原稿画像データＧＤをＰＤＦファイルに変換するための処理を行う。

それに際して、画像形成装置１は、その原稿画像データＧＤに前処理を施し（＃２０２）、前処理を施した後の原稿画像データＧＤを用いてそれに含まれる各オブジェクトを包含するブロックＢＫを求める（＃２０３）。さらに、求めた各ブロックＢＫの種別を判別する。その判別に際して、まず、文字、図形、またはそれ以外のいずれのブロックＢＫであるかを判別する（＃２０４）。

さらに、文字または図形のいずれでもないと判別されたブロックＢＫである非文字図形ブロックＢＫｈに対して写真地図判別処理を行い（図７参照）、各非文字図形ブロックＢＫｈのそれぞれが、写真または地図のいずれのブロックＢＫであるかを判別する（＃２０５）。

次に、写真のブロックＢＫと判別されたブロックＢＫに含まれる文字を抽出し、その文字を包含するブロックＢＫを求める（＃２０６）。

ステップ＃２０４において、文字のブロックＢＫと判別されたブロックＢＫおよびステップ＃２０６において求められた文字のブロックＢＫに対応する、原稿画像の部分を二値化し、文字と背景とを分離する（＃２０７）。分離された背景およびステップ＃２０５で写真のブロックＢＫと判別されたブロックＢＫに対応する、原稿画像の部分を低解像度化する（＃２０８）。なお、写真のブロックＢＫについては、それに含まれる文字以外の部分について低解像度化する。

また、ステップ＃２０４において、図形のブロックＢＫと判別されたブロックＢＫに対応する、原稿画像の部分に対して減色処理を行う（＃２０９）。

各ブロックＢＫのデータに対して、それぞれのブロックＢＫの種別に応じた圧縮処理を行う（＃２１０）。すなわち、文字のブロックＢＫに対しては、それに含まれる文字のデータをＭＭＲなどの可逆圧縮の方式で圧縮する。図形のブロックＢＫに対しては、減色処理が施された後のデータをＦＬＡＴＥなどの可逆圧縮の方式で圧縮する。写真のブロックＢＫおよび文字のブロックＢＫの背景の部分に対しては、低解像度化された後のデータをＪＰＥＧなどの圧縮の方式で圧縮する。地図のブロックＢＫに対しては、写真のブロックＢＫの場合のように低解像度化することなく、写真のブロックＢＫの場合よりも画質の劣化を抑えるために圧縮率を低くして、ＪＰＥＧなどの圧縮の方式で圧縮する。

そして、各ブロックＢＫの圧縮データを用いてＰＤＦファイルを生成し保存する（＃２１１）。

本実施形態によると、二値化画素率と細線画素率との関係、および上述の式（１）および式（２）に基づいて地図および写真の判別を行う。これによって、高い精度で地図と写真とを判別できる。しかも、簡単な処理で判別を行うことができる。

また、地図に対しては低解像度化をせず、低い圧縮率で圧縮を行うので、地図に含まれる文字の判読性を高く保つことができる。

本実施形態では、文字および地図のブロックＢＫに対しては、低解像度化の処理は行わないようにしたが、それを行うようにしてもよい。その場合は、例えば、そのブロックＢＫに含まれる文字の判読性が維持できるように、少なくとも写真のブロックＢＫの場合よりも高い解像度となるように低解像度化する。

また、図２の各部の機能の一部をハードウェアによって実現してもよい。例えば、入力画像処理部および出力画像処理部などのハードウェアを画像形成装置１に設けておく。入力画像処理部は、スキャナ１０ａから原稿画像データＧＤを受け付け、それに対して、色変換、色補正、解像度変換、および領域判別などの処理を行う。出力画像処理部は、スクリーン制御、スムージング処理、およびＰＷＭ制御などを行う。

その他、画像形成装置１の全体または各部の構成、機能、処理の内容または順序、各データが示す内容などは、本発明の趣旨に沿って適宜変更することができる。

本発明の一実施形態に係る画像形成装置のハードウェア構成の例を示す図である。画像形成装置の機能的構成の例を示す図である。原稿に印刷された画像の例を示す図である。写真地図領域処理部の構成の例を示す図である。写真の画像の例を示す図である。地図の画像の例を示す図である。写真地図判別処理の流れを説明するためのフローチャートである。複数の地図のサンプルの二値化画素率と細線画素率との関係を示す図である。複数の写真のサンプルの二値化画素率と細線画素率との関係を示す図である。ＰＤＦファイルを生成する際の画像形成装置の全体的な処理の流れを説明するためのフローチャートである。

符号の説明

１画像形成装置（画像圧縮装置、コンピュータ）
１５低解像度化部（圧縮手段）
２１背景等圧縮処理部（圧縮手段）
２２地図圧縮処理部（圧縮手段）
１０２二値化部（二値画像生成手段）
１０３二値化画素率算出部（二値化画素率算出手段）
１０４細線化部（細線化画像生成手段）
１０６写真地図判別部（領域判別手段）
ＢＫブロック（特定の領域）

Claims

画像に含まれる領域の判別方法であって、
前記画像を二値化することによって二値画像を生成し、
前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、
前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、
前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、
前記二値化画素率および前記細線画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する、
ことを特徴とする領域判別方法。
画像を二値化することによって二値画像を生成し、
前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、
前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、
前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、
前記二値化画素率および前記細線画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別し、
写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、
地図の領域と判別した場合は、前記特定の領域の画像を、低解像度化することなく、圧縮する、
ことを特徴とする画像圧縮方法。
前記画像を二値化することによって二値画像を生成し、
前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、
前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、
前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、
前記二値化画素率および前記細線画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別し、
写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、
地図の領域と判別した場合は、写真の領域と判別した場合に行う低解像度化よりも解像度が高くなるように前記特定の領域の画像を低解像度化した後で、当該画像を圧縮する、
ことを特徴とする画像圧縮方法。
前記特定の領域を地図の領域と判別した場合は、写真の領域と判別した場合の圧縮率よりも低い圧縮率で圧縮する、
請求項２または３記載の画像圧縮方法。
画像を圧縮する画像圧縮装置であって、
前記画像を二値化することによって二値画像を生成する二値画像生成手段と、
前記二値画像生成手段が生成した前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求める二値化画素率算出手段と、
前記特定の領域に対して細線化処理を施すことによって細線化画像を生成する細線化画像生成手段と、
前記細線化画像生成手段が生成した前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求める細線画素率算出手段と、
前記細線画素率算出手段が求めた前記細線画素率および前記二値化画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する領域判別手段と、
前記領域判別手段が写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、地図の領域と判別した場合は、当該特定の領域の画像を低解像度化することなく圧縮する、圧縮処理手段と、
を有することを特徴とする画像圧縮装置。
画像を圧縮する画像圧縮装置であって、
前記画像を二値化することによって二値画像を生成する二値画像生成手段と、
前記二値画像生成手段が生成した前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求める二値化画素率算出手段と、
前記特定の領域に対して細線化処理を施すことによって細線化画像を生成する細線化画像生成手段と、
前記細線化画像生成手段が生成した前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求める細線画素率算出手段と、
前記細線画素率算出手段が求めた前記細線画素率および前記二値化画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する領域判別手段と、
前記領域判別手段が写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、地図の領域と判別した場合は、写真の領域と判別した場合の低解像度化よりも解像度が高くなるように当該特定の領域の画像を低解像度化した後で圧縮する、圧縮処理手段と、
を有することを特徴とする画像圧縮装置。
前記圧縮処理手段は、前記領域判別手段が前記特定の領域を地図の領域と判別した場合は写真の領域と判別した場合の圧縮率よりも低い圧縮率で圧縮する、
請求項５または６記載の画像圧縮装置。
画像処理を行うコンピュータに、
画像を二値化することによって二値画像を生成する処理と、
前記二値画像に含まれる特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求める処理と、
前記特定の領域に対して細線化処理を施すことによって細線化画像を生成する処理と、
前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求める処理と、
前記二値化画素率および前記細線画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する処理と、
を実行させることを特徴とするコンピュータプログラム。
画像処理を行うコンピュータに、
画像を二値化することによって二値画像を生成する処理と、
前記二値画像に含まれる特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求める処理と、
前記特定の領域に対して細線化処理を施すことによって細線化画像を生成する処理と、
前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求める処理と、
前記二値化画素率および前記細線画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する処理と、
写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮する処理と、
地図の領域と判別した場合は、前記特定の領域の画像を、低解像度化することなく、圧縮する処理と、
を実行させることを特徴とするコンピュータプログラム。
画像処理を行うコンピュータに、
画像を二値化することによって二値画像を生成する処理と、
前記二値画像に含まれる特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求める処理と、
前記特定の領域に対して細線化処理を施すことによって細線化画像を生成する処理と、
前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求める処理と、
前記二値化画素率および前記細線画素率をそれぞれＸ軸、Ｙ軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「ａ」および切片「ｂ」の２つのパラメータによって求まるＹ＝−ａＸ＋ｂ（ａ，ｂは正の数）の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する処理と、
写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮する処理と、
地図の領域と判別した場合は、写真の領域と判別した場合に行う低解像度化よりも解像度が高くなるように前記特定の領域の画像を低解像度化した後で、当該画像を圧縮する処理と、
を実行させることを特徴とするコンピュータプログラム。