JP4442701B2 - 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム - Google Patents

領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム Download PDF

Info

Publication number
JP4442701B2
JP4442701B2 JP2008146822A JP2008146822A JP4442701B2 JP 4442701 B2 JP4442701 B2 JP 4442701B2 JP 2008146822 A JP2008146822 A JP 2008146822A JP 2008146822 A JP2008146822 A JP 2008146822A JP 4442701 B2 JP4442701 B2 JP 4442701B2
Authority
JP
Japan
Prior art keywords
image
area
specific area
pixels
binarized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008146822A
Other languages
English (en)
Other versions
JP2009296218A (ja
Inventor
俊浩 森
修 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2008146822A priority Critical patent/JP4442701B2/ja
Priority to US12/361,641 priority patent/US8311333B2/en
Publication of JP2009296218A publication Critical patent/JP2009296218A/ja
Application granted granted Critical
Publication of JP4442701B2 publication Critical patent/JP4442701B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/642Adapting to different types of images, e.g. characters, graphs, black and white image portions

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Description

本発明は、スキャナで読み取った画像データを圧縮する方法およびその圧縮を行う画像処理装置などに関する。
従来、複合機またはMFP(Multi Functional Peripherals)などと呼ばれる画像処理装置を用いて、原稿をスキャンして得られた画像データを電子メールに添付して送信することがよく行われている。近年、そのような画像形成装置のカラー対応の機種が多く用いられるようになり、カラーの画像データを電子メールに添付して送信する需要が高まっている。
ところが、カラーの画像データは、例えばA4サイズの原稿をフルカラーの300dpiでスキャンした場合に、そのデータ量が25MB程度にもなるので、そのまま電子メールに添付して送信することが困難な場合がある。よって、そのような画像データは、圧縮して送信するのが一般的である。しかし、電子メールでの送信を可能とするために画像データの全体を高い圧縮率で圧縮するとそれに含まれている文字がつぶれて読めなくなってしまうことがある。また、文字が読めるように圧縮率を低くして圧縮するとファイルサイズを十分に小さくできないことがある。
そこで、従来、高圧縮PDF(Portable Document Format)またはコンパクトPDFなどと呼ばれる、高い圧縮率のPDFファイルを生成する技術を用いてデータ量を少なくする工夫がなされている。この技術では、次のようにしてPDFファイルを生成する。
変換の対象の画像(対象画像)に含まれる文字、図形、および写真などのオブジェクトの領域を抽出する。抽出した領域が文字の領域であるか文字以外の領域であるかを判別する。文字の領域に対しては、二値化を行い、その文字の代表色を1つ決定する。さらに、その文字の判読性を考慮した圧縮処理を行う。文字以外の領域に対しては高い圧縮率で圧縮処理を行う。これによって、文字の判読性を考慮した高い圧縮率のPDFファイルを生成する。
ところで、対象画像に地図が含まれていることがある。通常、地図には、地名などの示す文字が含まれている。上述の高圧縮PDFの生成において、そのような地図の領域は、文字以外の領域と判別される。そうすると、その地図に含まれる文字の判読性を考慮した圧縮処理がなされないので、それらの文字が読みにくくなってしまう。
よって、地図に含まれる文字の判読性を維持するには、地図の領域に適した圧縮処理を行う必要があり、そのために、地図の領域とそれ以外の領域とを判別する必要がある。
地図の領域の判別に関連する技術として、従来、特許文献1、2のような方法が提案されている。
特許文献1の方法によると、地図原稿を原稿読取部によって読みとって得られた原稿画像の濃度分布特性を示すヒストグラムを生成する。生成したヒストグラムを用いて、その原稿画像に含まれる高濃度成分、中濃度成分、および低濃度成分の全濃度成分に対する各割合を求める。そして、中濃度成分および高濃度成分の割合が低濃度成分の割合よりも高い場合にその原稿画像を外国製地図の原稿画像であると判別し、中濃度成分および高濃度成分の割合が低濃度成分の割合よりも低い場合にその原稿画像を日本製地図の原稿画像であると判別する。
特許文献2の方法によると、原稿の画像に対して、所定サイズ(縦5画素×横5画素)の尾根画素パターンを用いてパターンマッチングを行うことにより、その画像に含まれる網点上の文字画素を検出する。その文字画素の個数が多い場合に、その原稿を地図的原稿と判別し、多くない場合に一般原稿と判別する。
特開2005―79787号公報 特開平10―285394号公報
上述のように特許文献1の方法では、中濃度成分および高濃度成分の画素の割合が多いか否かに基づいて領域の判別を行う。このような判別方法を適用して地図の領域とそれ以外の領域とを判別しようとすると、地図と似た濃度分布特性を持った写真などの領域が誤って地図の領域であると判別されてしまう。従って、特許文献1の方法では、地図とそれ以外の領域とを正確に判別できない可能性が高い。
特許文献2の方法では、注目画素を決定し、その注目画素および周辺の画素に対して所定のサイズの尾根画素パターンを用いてパターンマッチングを行い、その注目画素が文字の画素か否かを判定する。そのような処理を1画素ずつ全ての画素に対して行わなければならないので、多くの計算量を要してしまう。
本発明はこのような問題点に鑑み、従来よりも簡単な処理で地図の領域を的確に判別できるようにすることを目的とする。
本発明の一形態に係る領域判別方法は、画像に含まれる領域の判別方法であって、前記画像を二値化することによって二値画像を生成し、前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、記二値化画素率および前記細線画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する。
本発明の一形態に係る画像圧縮方法は、画像を二値化することによって二値画像を生成し、前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、記二値化画素率および前記細線画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別し、写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、地図の領域と判別した場合は、前記特定の領域の画像を、低解像度化することなく、圧縮する。
好ましくは、前記特定の領域を地図の領域と判別した場合は、写真の領域と判別した場合の圧縮率よりも低い圧縮率で圧縮する。
本発明の他の形態に係る画像圧縮方法は、前記画像を二値化することによって二値画像を生成し、前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、記二値化画素率および前記細線画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別し、写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、地図の領域と判別した場合は、写真の領域と判別した場合に行う低解像度化よりも解像度が高くなるように前記特定の領域の画像を低解像度化した後で、当該画像を圧縮する。
本発明によると、従来よりも簡単な処理で地図の領域を的確に判別できるようになる。
図1は本発明の一実施形態に係る画像形成装置1のハードウェア構成の例を示す図である。
画像形成装置1は、コピー、スキャナ、ファックス、ネットワークプリンティング、ドキュメントサーバ、およびファイル転送などの様々な機能を集約した画像処理装置である。複合機またはMFP(Multi Function Peripherals)などと呼ばれることもある。
画像形成装置1は、図1に示すように、スキャナ10a、CPU10b、ハードディスク10c、RAM10d、ROM10e、印刷装置10f、モデム10g、ネットワークインタフェース10h、制御用回路10k、および操作パネル10mなどによって構成される。
スキャナ10aは、原稿の用紙(以下、単に「原稿」と記載する。)に描かれている写真、文字、絵、図表などの画像を光学的に読み取って電子データ化する装置である。読み取られた画像は、RGB(R(赤)、G(緑)、およびB(青))によって表されるビットマップなどの形式の画像データとして保存される。予め指定しておくことによって、PDF(Portable Document Format)またはXPS(XML Paper Specification)の形式で保存することもできる。
CPU10bは、スキャナ10aが読み取った原稿の画像データをTIFF、JPEG、ビットマップ、およびPDFなどの形式のファイルに変換するための処理を行う。また、ユーザからの入力の検出、操作パネル10mの表示の制御,または電子メールの作成など、画像形成装置1の全体的な制御も行う。
印刷装置10fは、スキャナ10aで読み取られた画像データの画像または他の装置から送信されてきた画像データの画像を用紙に印刷する装置である。画像形成装置1がカラー印刷に対応している場合は、イエロー、マゼンタ、シアン、およびブラックの4色のトナーを用いて印刷を行う。
操作パネル10mは、ユーザが画像形成装置1に対して種々の入力を行うための装置である。操作部および表示部などによって構成される。ユーザは、操作パネル10mを用いて、画像データの保存形式の選択、スキャンの条件の設定、処理の開始または実行の指令の入力、電子メールの宛先の入力などの種々の入力を行うことができる。
モデム10gは、NCU(Network Control Unit)が内蔵されており、アナログの公衆回線を介して他のファックス端末と接続し、ファクシミリプロトコルに基づくデータ制御およびファックスデータの変復調などを行う。
ネットワークインタフェース10hは、NIC(Network Interface Card)であって、LANまたはインターネットなどを介して他の装置への接続を行う。
制御用回路10kは、ハードディスク10c、操作パネル10m、スキャナ10a、印刷装置10f、モデム10g、およびネットワークインタフェース10hなどの装置を制御するための回路である。制御用回路10kは、例えば、種々の電子部品を用いたハードウェア回路によって構成される。
ハードディスク10cには、後に説明する図2に示すような各部の機能を実現するためのプログラム(コンピュータプログラム)およびデータなどが格納されている。これらは必要に応じてRAM10dに読み出され、CPU10bによってプログラムが実行される。これらのプログラムまたはデータの一部または全部を、ROM10eに記憶させておいてもよい。または、図2の機能の一部または全部を、制御用回路10kによって実現するようにしてもよい。
図2は画像形成装置1の機能的構成の例を示す図、図3は原稿に印刷された画像の例を示す図である。次に、原稿をスキャナ10aで読み取って得られる原稿画像データGDを、PDF形式のファイル(PDFファイル)に変換して保存する際の画像形成装置1の各部の処理について、図2および図3を参照しながら説明する。
図2に示すように、画像形成装置1は、画像データ取得部11、前処理部12、領域抽出部13、領域判別部14、写真地図領域処理部15、文字背景分離部16、および文字圧縮処理部17、減色処理部18、図形圧縮処理部19、低解像度化部20、背景等圧縮処理部21、地図圧縮処理部22、ファイル生成部23、およびファイル保存部24などによって構成される。
ユーザが原稿をスキャナ10aにセットし、保存形式をPDFに設定してスキャンの実行のコマンドを入力すると、スキャナ10aは、その原稿の画像をスキャンし、予め指定された、TIFF、JPEG、およびビットマップなどの形式の、RGBで表される原稿画像データGDを生成する。
画像データ取得部11は、その原稿画像データGDを取得する。前処理部12は、画像形式の変換、解像度の変換、および下地除去などの処理を行う。
領域抽出部13は、原稿画像データGDの画像(原稿画像)に含まれる文字、図形、および写真などの各オブジェクトが描かれた領域を抽出することによってラベリングの処理を行う。この処理は例えば次のようにして行う。
原稿画像データGDを二値化する。その二値化によって得られた画像(二値画像)において、文字、図形、および写真などを形成する連続する黒画素である黒画素群を検出する。比較的近い距離にある黒画素群同士は、一つの黒画素群として検出する。検出した黒画素群を包含する矩形の領域(矩形領域)を求める。すなわち、例えばその矩形領域の二値画像内における位置(つまり、原稿画像内における位置)を求める。以下、このような矩形領域を「ブロックBK」と記載する。
例えば、図3(a)に示すような原稿画像であった場合は、この領域抽出部13の処理によって、図3(b)に示すような、文字を包含するブロックBK11、12、…、図形を包含するブロックBK31、および写真を包含するブロックBK41などが求められる。
領域判別部14は、ブロックBKのサイズまたはブロックBK内に描かれているオブジェクトのエッジ部分の画素数などに基づいて、ブロックBKの種別を判別する。すなわち、各ブロックBKが、文字、図形、またはそれ以外のいずれのブロックBKであるかを判別する。なお、本実施形態では、表を含むブロックBKも文字のブロックBKと判別される。
写真地図領域処理部15は、領域判別部14によって種別が文字または図形のいずれでもないと判別されたブロックBK(以下、「非文字図形ブロックBKh」と記載する。)について、写真地図判別処理を行い、それが写真または地図のいずれのブロックBKであるかを判別する。さらに、写真のブロックBKと判別されたブロックBKに含まれる文字を抽出し、その文字を包含するブロックBKを求める。写真地図領域処理部15の詳細な処理の手順については後で説明する。
文字背景分離部16は、領域判別部14によって文字のブロックBKと判別されたブロックBKおよび写真地図領域処理部15によって求められた文字のブロックBKについて、それらのブロックBK内に含まれる文字の部分と背景の部分とを分けるための処理を行う。この処理は次のようにして行う。
原稿画像の、そのブロックBKに対応する部分を二値化する。その部分に二値化の閾値よりも濃度が低い下地(背景)にその閾値よりも濃度の高い文字が描かれている場合、すなわち薄い背景に濃い色で文字が描かれている場合、文字を形成する画素がドットが打たれた画素である黒画素となり、背景の画素がドットが打たれていない画素である白画素となる。すなわち、文字を形成する画素と背景の画素とが黒画素と白画素とによって分けられる。以下、原稿画像の、ブロックBKに対応する部分の画像を「部分原稿画像」と記載する。
文字圧縮処理部17は、文字を形成する画素のデータをMMRなどの可逆圧縮の方式で圧縮する。このとき低解像度化の処理を行うことなく圧縮する。
減色処理部18は、図形のブロックBKであると判別されたブロックBKの部分原稿画像のデータに対して減色処理を行い、色を均一化させる。図形圧縮処理部19は、減色処理が施された後のデータをFLATEなどの可逆圧縮の方式で圧縮する。
低解像度化部20は、写真のブロックBKであると判別されたブロックBKの部分原稿画像のデータに対して低解像度化の処理を行う。また、文字背景分離部16によって特定された背景の部分に対して低解像度化の処理を行う。この処理では、解像度を例えば300dpiから150dpi程度に下げる。
背景等圧縮処理部21は、低解像度化された後の写真および文字の背景のデータをJPEGなどの圧縮の方式で圧縮する。
地図圧縮処理部22は、地図のブロックBKであると判別されたブロックBKの部分原稿画像のデータをJEPGなどの圧縮の方式で圧縮する。この際、写真および背景よりも画質が良好に保たれるように、少なくとも背景等圧縮処理部21による圧縮よりも圧縮率が低くなるように圧縮する。
ファイル生成部23は、文字圧縮処理部17、図形圧縮処理部18、背景等圧縮処理部21、および地図圧縮処理部22によって生成されたそれぞれの圧縮データを用いてPDFファイルを生成する。ファイル保存部24は、生成されたPDFファイルを保存する。
図4は写真地図領域処理部15の構成の例を示す図、図5は写真の画像の例を示す図、図6は地図の画像の例を示す図、図7は写真地図判別処理の流れを説明するためのフローチャート、図8は複数の地図のサンプルの二値化画素率と細線画素率との関係を示す図、図9は複数の写真のサンプルの二値化画素率と細線画素率との関係を示す図である。
次に、図4に示す写真地図領域処理部15の処理について、図5〜図9を参照しながら説明する。また、図5(a)に示すような写真および図6(a)に示すような地図を含む原稿画像が処理の対象であるものとして説明する。
明度画像生成部101は、RGBで表される原稿画像データGDを明度変換して、原稿画像に対応した、すなわち原稿画像データGDが表す原稿画像を明度で示す明度原稿画像データMGを生成する(図7の#101)。
二値化部102は、生成された明度原稿画像データMGを二値化することによって、原稿画像に対応した二値の画像(二値原稿画像)を示す二値原稿画像データNGを生成する(#102)。これによって、図5(a)および図6(a)の原稿画像は、それぞれ、図5(b)および図6(b)のような二値の画像に変換される。
二値化画素率算出部103は、二値原稿画像の、非文字図形ブロックBKhに対応する部分に含まれる黒画素の、その非文字図形ブロックBKhに含まれる画素の総数に対する割合である二値化画素率を、各非文字図形ブロックBKhのそれぞれについて算出する(#103)。
細線化部104は、二値原稿画像データNGに対して細線化処理を行い、原稿画像に対応する細線原稿画像を示す細線原稿画像データSGを生成する(#104)。以下、細線原稿画像データSGにおいてドットが打たれている画素のこと、すなわち細線を形成する画素のことを「細線画素」と記載する。これによって、図5(b)および図6(b)の二値原稿画像は、それぞれ、図5(c)および図6(c)のような細線で表される画像に変換される。
細線画素率算出部105は、細線原稿画像の、非文字図形ブロックBKhに対応する部分に含まれる細線画素の、二値原稿画像の、その非文字図形ブロックBKhに対応する部分に含まれる黒画素の総数に対する割合である細線画素率を、各非文字図形ブロックBKhのそれぞれについて算出する(#105)。
ところで、図5(a)および図6(a)の例でも分かるように、地図は、写真に比べて下地の色が薄く文字を多く含む傾向がある。従って、地図を表す画像を二値化すると図6(b)に示すように下地の部分が白画素となるので、写真に比べて黒画素(二値化画素)の個数が少なくなる。さらにその二値化された画像を細線化すると、図6(c)に示すように多く含まれている文字の部分が細線画素として残るので、黒画素に対する細線画素の割合が多くなる。
地図の画像および写真の画像の複数のサンプルを用いて、図8および図9のように二値化画素率と細線画素率との関係をグラフに表すと、上述のような地図の特徴と写真の特徴との差をさらにわかりやすく見ることができる。
図8には、複数の地図のサンプルについての二値化画素率と細線画素率との関係を示す点の分布が示される。図9には、複数の写真のサンプルについての二値化画素率と細線画素率との関係を示す点の分布が示される。
図8および図9から分かるように、写真は二値化画素率が30%以上になるものが多く、地図は10%以下になるものが多い。よって、二値化画素率に基づいて、ある程度、写真および地図の判別することは可能である。しかし、その方法では、二値化画素率が20%前後の画像を正確に判別することが難しい。そこで、本実施形態では、さらに細線画素率も考慮して判別を行う。
図8および図9の例では、写真は、細線画素率が「20%」以下となることが多く、地図は「20%」以上となることが多い。よって、単純に細線画素率の「20%」を境にして写真と地図との判別を行うこともできるが、本実施形態では、判別の精度を高めるために、傾きの「a」および切片の「b」の2つのパラメータによって求まる「Y=−aX+b」の直線を境界線として用いて判別する。図8および図9の例では、aの値が「−1/5」程度およびbの値が「20」程度のときに判別の精度がよい。なお、aの値を「0」として、「Y=b」の直線を境界線としてもよい。
写真地図判別部106は、非文字図形ブロックBKhの細線画素率および二値化画素率に基づいて、その非文字図形ブロックBKhが写真のブロックBKであるか地図のブロックBKであるかを判別する(#106)。本実施形態では、二値化画素率(X)と細線画素率(Y)とが式(1)の条件を満たす場合に(#106でYes)、そのブロックBKを地図のブロックBKであると判別する(#107)。
Y≧−aX+b …(1)
(a,b:正の数)
二値化画素率(X)と細線画素率(Y)とが式(2)の条件を満たす場合に(#106でNo)、そのブロックBKを写真のブロックBKであると判別する(#108)。
Y<−aX+b …(2)
(a,b:正の数)
文字抽出部107は、写真のブロックBKと判別された各ブロックBKに含まれる文字を抽出し、その文字を包含するブロックBKを求める。この抽出は、公知の方法を用いて行う。これによって、例えば図3の例では、写真のブロックBK41に含まれる各文字を包含するブロックBKが求められる。
図10はPDFファイルを生成する際の画像形成装置1の全体的な処理の流れを説明するためのフローチャートである。
ユーザがスキャナ10aに原稿をセットし、保存の形式としてPDFを選択してスキャンの実行を指示すると、画像形成装置1は、その原稿をスキャンし(図10の#201)、スキャンによって得た原稿画像データGDをPDFファイルに変換するための処理を行う。
それに際して、画像形成装置1は、その原稿画像データGDに前処理を施し(#202)、前処理を施した後の原稿画像データGDを用いてそれに含まれる各オブジェクトを包含するブロックBKを求める(#203)。さらに、求めた各ブロックBKの種別を判別する。その判別に際して、まず、文字、図形、またはそれ以外のいずれのブロックBKであるかを判別する(#204)。
さらに、文字または図形のいずれでもないと判別されたブロックBKである非文字図形ブロックBKhに対して写真地図判別処理を行い(図7参照)、各非文字図形ブロックBKhのそれぞれが、写真または地図のいずれのブロックBKであるかを判別する(#205)。
次に、写真のブロックBKと判別されたブロックBKに含まれる文字を抽出し、その文字を包含するブロックBKを求める(#206)。
ステップ#204において、文字のブロックBKと判別されたブロックBKおよびステップ#206において求められた文字のブロックBKに対応する、原稿画像の部分を二値化し、文字と背景とを分離する(#207)。分離された背景およびステップ#205で写真のブロックBKと判別されたブロックBKに対応する、原稿画像の部分を低解像度化する(#208)。なお、写真のブロックBKについては、それに含まれる文字以外の部分について低解像度化する。
また、ステップ#204において、図形のブロックBKと判別されたブロックBKに対応する、原稿画像の部分に対して減色処理を行う(#209)。
各ブロックBKのデータに対して、それぞれのブロックBKの種別に応じた圧縮処理を行う(#210)。すなわち、文字のブロックBKに対しては、それに含まれる文字のデータをMMRなどの可逆圧縮の方式で圧縮する。図形のブロックBKに対しては、減色処理が施された後のデータをFLATEなどの可逆圧縮の方式で圧縮する。写真のブロックBKおよび文字のブロックBKの背景の部分に対しては、低解像度化された後のデータをJPEGなどの圧縮の方式で圧縮する。地図のブロックBKに対しては、写真のブロックBKの場合のように低解像度化することなく、写真のブロックBKの場合よりも画質の劣化を抑えるために圧縮率を低くして、JPEGなどの圧縮の方式で圧縮する。
そして、各ブロックBKの圧縮データを用いてPDFファイルを生成し保存する(#211)。
本実施形態によると、二値化画素率と細線画素率との関係、および上述の式(1)および式(2)に基づいて地図および写真の判別を行う。これによって、高い精度で地図と写真とを判別できる。しかも、簡単な処理で判別を行うことができる。
また、地図に対しては低解像度化をせず、低い圧縮率で圧縮を行うので、地図に含まれる文字の判読性を高く保つことができる。
本実施形態では、文字および地図のブロックBKに対しては、低解像度化の処理は行わないようにしたが、それを行うようにしてもよい。その場合は、例えば、そのブロックBKに含まれる文字の判読性が維持できるように、少なくとも写真のブロックBKの場合よりも高い解像度となるように低解像度化する。
また、図2の各部の機能の一部をハードウェアによって実現してもよい。例えば、入力画像処理部および出力画像処理部などのハードウェアを画像形成装置1に設けておく。入力画像処理部は、スキャナ10aから原稿画像データGDを受け付け、それに対して、色変換、色補正、解像度変換、および領域判別などの処理を行う。出力画像処理部は、スクリーン制御、スムージング処理、およびPWM制御などを行う。
その他、画像形成装置1の全体または各部の構成、機能、処理の内容または順序、各データが示す内容などは、本発明の趣旨に沿って適宜変更することができる。
本発明の一実施形態に係る画像形成装置のハードウェア構成の例を示す図である。 画像形成装置の機能的構成の例を示す図である。 原稿に印刷された画像の例を示す図である。 写真地図領域処理部の構成の例を示す図である。 写真の画像の例を示す図である。 地図の画像の例を示す図である。 写真地図判別処理の流れを説明するためのフローチャートである。 複数の地図のサンプルの二値化画素率と細線画素率との関係を示す図である。 複数の写真のサンプルの二値化画素率と細線画素率との関係を示す図である。 PDFファイルを生成する際の画像形成装置の全体的な処理の流れを説明するためのフローチャートである。
符号の説明
1 画像形成装置(画像圧縮装置、コンピュータ)
15 低解像度化部(圧縮手段)
21 背景等圧縮処理部(圧縮手段)
22 地図圧縮処理部(圧縮手段)
102 二値化部(二値画像生成手段)
103 二値化画素率算出部(二値化画素率算出手段)
104 細線化部(細線化画像生成手段)
106 写真地図判別部(領域判別手段)
BK ブロック(特定の領域)

Claims (10)

  1. 画像に含まれる領域の判別方法であって、
    前記画像を二値化することによって二値画像を生成し、
    前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、
    前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、
    前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、
    記二値化画素率および前記細線画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する、
    ことを特徴とする領域判別方法。
  2. 画像を二値化することによって二値画像を生成し、
    前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、
    前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、
    前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、
    記二値化画素率および前記細線画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別し、
    写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、
    地図の領域と判別した場合は、前記特定の領域の画像を、低解像度化することなく、圧縮する、
    ことを特徴とする画像圧縮方法。
  3. 前記画像を二値化することによって二値画像を生成し、
    前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求め、
    前記特定の領域に対して細線化処理を施すことによって細線化画像を生成し、
    前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求め、
    記二値化画素率および前記細線画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別し、
    写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、
    地図の領域と判別した場合は、写真の領域と判別した場合に行う低解像度化よりも解像度が高くなるように前記特定の領域の画像を低解像度化した後で、当該画像を圧縮する、
    ことを特徴とする画像圧縮方法。
  4. 前記特定の領域を地図の領域と判別した場合は、写真の領域と判別した場合の圧縮率よりも低い圧縮率で圧縮する、
    請求項2または3記載の画像圧縮方法。
  5. 画像を圧縮する画像圧縮装置であって、
    前記画像を二値化することによって二値画像を生成する二値画像生成手段と、
    前記二値画像生成手段が生成した前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求める二値化画素率算出手段と、
    前記特定の領域に対して細線化処理を施すことによって細線化画像を生成する細線化画像生成手段と、
    前記細線化画像生成手段が生成した前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求める細線画素率算出手段と、
    前記細線画素率算出手段が求めた前記細線画素率および前記二値化画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する領域判別手段と、
    前記領域判別手段が写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、地図の領域と判別した場合は、当該特定の領域の画像を低解像度化することなく圧縮する、圧縮処理手段と、
    を有することを特徴とする画像圧縮装置。
  6. 画像を圧縮する画像圧縮装置であって、
    前記画像を二値化することによって二値画像を生成する二値画像生成手段と、
    前記二値画像生成手段が生成した前記二値画像の特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求める二値化画素率算出手段と、
    前記特定の領域に対して細線化処理を施すことによって細線化画像を生成する細線化画像生成手段と、
    前記細線化画像生成手段が生成した前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求める細線画素率算出手段と、
    前記細線画素率算出手段が求めた前記細線画素率および前記二値化画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する領域判別手段と、
    前記領域判別手段が写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮し、地図の領域と判別した場合は、写真の領域と判別した場合の低解像度化よりも解像度が高くなるように当該特定の領域の画像を低解像度化した後で圧縮する、圧縮処理手段と、
    を有することを特徴とする画像圧縮装置。
  7. 前記圧縮処理手段は、前記領域判別手段が前記特定の領域を地図の領域と判別した場合は写真の領域と判別した場合の圧縮率よりも低い圧縮率で圧縮する、
    請求項5または6記載の画像圧縮装置。
  8. 画像処理を行うコンピュータに、
    画像を二値化することによって二値画像を生成する処理と、
    前記二値画像に含まれる特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求める処理と、
    前記特定の領域に対して細線化処理を施すことによって細線化画像を生成する処理と、
    前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求める処理と、
    記二値化画素率および前記細線画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する処理と、
    を実行させることを特徴とするコンピュータプログラム。
  9. 画像処理を行うコンピュータに、
    画像を二値化することによって二値画像を生成する処理と、
    前記二値画像に含まれる特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求める処理と、
    前記特定の領域に対して細線化処理を施すことによって細線化画像を生成する処理と、
    前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求める処理と、
    前記二値化画素率および前記細線画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する処理と、
    写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮する処理と、
    地図の領域と判別した場合は、前記特定の領域の画像を、低解像度化することなく、圧縮する処理と、
    を実行させることを特徴とするコンピュータプログラム。
  10. 画像処理を行うコンピュータに、
    画像を二値化することによって二値画像を生成する処理と、
    前記二値画像に含まれる特定の領域に含まれるドットが打たれた画素の個数である二値化画素数の、当該特定の領域に含まれる画素の総数に対する割合である二値化画素率を求める処理と、
    前記特定の領域に対して細線化処理を施すことによって細線化画像を生成する処理と、
    前記細線化画像に含まれるドットが打たれた画素の個数の、前記二値化画素数に対する割合である細線画素率を求める処理と、
    前記二値化画素率および前記細線画素率をそれぞれX軸、Y軸とする平面上に、前記特定の領域の前記二値化画素率と前記細線画素率との関係をプロットし、傾き「a」および切片「b」の2つのパラメータによって求まるY=−aX+b(a,bは正の数)の直線を境界線として用いて、前記特定の領域が地図の領域かまたは写真の領域かを判別する処理と、
    写真の領域と判別した場合は、前記特定の領域の画像を低解像度化した後で圧縮する処理と、
    地図の領域と判別した場合は、写真の領域と判別した場合に行う低解像度化よりも解像度が高くなるように前記特定の領域の画像を低解像度化した後で、当該画像を圧縮する処理と、
    を実行させることを特徴とするコンピュータプログラム。
JP2008146822A 2008-06-04 2008-06-04 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム Expired - Fee Related JP4442701B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008146822A JP4442701B2 (ja) 2008-06-04 2008-06-04 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム
US12/361,641 US8311333B2 (en) 2008-06-04 2009-01-29 Area determination method, image compression method, image compression apparatus, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008146822A JP4442701B2 (ja) 2008-06-04 2008-06-04 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2009296218A JP2009296218A (ja) 2009-12-17
JP4442701B2 true JP4442701B2 (ja) 2010-03-31

Family

ID=41400381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008146822A Expired - Fee Related JP4442701B2 (ja) 2008-06-04 2008-06-04 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム

Country Status (2)

Country Link
US (1) US8311333B2 (ja)
JP (1) JP4442701B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274850A (zh) * 2017-07-18 2019-01-25 京瓷办公信息系统株式会社 图像处理装置和图像处理装置的控制方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012205181A (ja) * 2011-03-28 2012-10-22 Fuji Xerox Co Ltd 画像処理装置およびプログラム
JP6211749B2 (ja) * 2011-11-15 2017-10-11 ブラザー工業株式会社 制御装置及びプログラム
JP5807572B2 (ja) * 2012-01-31 2015-11-10 コニカミノルタ株式会社 画像処理装置、画像種別判別方法、およびコンピュータプログラム
US20220108106A1 (en) * 2020-10-05 2022-04-07 Automation Anywhere, Inc. Machined learning supporting document data extraction

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0965143A (ja) 1995-08-25 1997-03-07 Ricoh Co Ltd 地図原稿種判定付画像処理装置
JP3797448B2 (ja) 1997-04-11 2006-07-19 株式会社リコー 画像処理装置
JP4015977B2 (ja) 2003-08-29 2007-11-28 京セラミタ株式会社 画像処理装置
JP4556813B2 (ja) * 2005-09-08 2010-10-06 カシオ計算機株式会社 画像処理装置、及びプログラム
JP2007074578A (ja) * 2005-09-08 2007-03-22 Casio Comput Co Ltd 画像処理装置、撮影装置、及びプログラム
JP4240107B2 (ja) * 2006-10-27 2009-03-18 コニカミノルタビジネステクノロジーズ株式会社 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109274850A (zh) * 2017-07-18 2019-01-25 京瓷办公信息系统株式会社 图像处理装置和图像处理装置的控制方法
CN109274850B (zh) * 2017-07-18 2020-07-31 京瓷办公信息系统株式会社 图像处理装置和图像处理装置的控制方法

Also Published As

Publication number Publication date
JP2009296218A (ja) 2009-12-17
US8311333B2 (en) 2012-11-13
US20090304295A1 (en) 2009-12-10

Similar Documents

Publication Publication Date Title
JP4333708B2 (ja) 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
JP5220828B2 (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理方法、プログラム及び記録媒体
JP4135752B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4810413B2 (ja) 画像処理装置及び画像処理方法
JP4753638B2 (ja) 文書圧縮方法、文書を圧縮するためのシステム、及び画像処理装置
JP4586891B2 (ja) 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム
JP2008112215A (ja) 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム
JP4579759B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4442701B2 (ja) 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム
US20090310868A1 (en) Image processing apparatus, image conversion method, and computer-readable storage medium for computer program
JP4861362B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US8274708B2 (en) Image processing apparatus and method for preventing removal of an encoded image
JP4416782B2 (ja) 画像処理装置、決定装置、変更装置、および画像処理方法
JP5132440B2 (ja) 画像処理装置及び画像処理方法
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP6262102B2 (ja) 画像処理装置、画像処理システム、コンピュータプログラム及び記録媒体
JP4411244B2 (ja) 画像処理装置、画像処理方法、プログラム
JP2008193234A (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP4375106B2 (ja) 画像処理装置
US11405525B2 (en) Image processing apparatus, control method, and product capable of improving compression efficiency by converting close color to background color in a low light reading mode
US20100188670A1 (en) Image processing apparatus, image processing method and program executing the image processing method
JP6752263B2 (ja) 画像処理装置、画像形成装置、及び、画像処理方法
US11924390B2 (en) Apparatus, method, and storage medium for performing color reduction processing
JP4412339B2 (ja) 画像形成装置および画像データの補正方法
JP6618307B2 (ja) 画像処理装置、画像形成装置、及び、解像度決定方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090901

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100104

R150 Certificate of patent or registration of utility model

Ref document number: 4442701

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130122

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees