JP2007336000A - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法及び画像処理プログラム Download PDF

Info

Publication number
JP2007336000A
JP2007336000A JP2006162721A JP2006162721A JP2007336000A JP 2007336000 A JP2007336000 A JP 2007336000A JP 2006162721 A JP2006162721 A JP 2006162721A JP 2006162721 A JP2006162721 A JP 2006162721A JP 2007336000 A JP2007336000 A JP 2007336000A
Authority
JP
Japan
Prior art keywords
area
determination step
size
character
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006162721A
Other languages
English (en)
Other versions
JP4135752B2 (ja
Inventor
Toshihiro Mori
俊浩 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2006162721A priority Critical patent/JP4135752B2/ja
Priority to US11/647,353 priority patent/US7747089B2/en
Publication of JP2007336000A publication Critical patent/JP2007336000A/ja
Application granted granted Critical
Publication of JP4135752B2 publication Critical patent/JP4135752B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Color Image Communication Systems (AREA)
  • Image Analysis (AREA)

Abstract

【課題】文字領域か否かをより精確に判別して画像ファイルを圧縮する画像処理装置を提供する。
【解決手段】矩形領域のサイズが小さければ(S504:YES)、テキスト領域とする(S511)。下地率が66%以上であって(S506:YES)、ラベリング率が67%未満で、かつ、周辺長率が50%以上ならば(S513:YES)、大文字領域とする(S515)。さもなければ(S513:NO)、下地領域とする(S514)。直線数が10本以上か(S508:YES)、4本以上かつラベリング率が12%以下であって(S509:YES)、エッジ率が5%以上ならば(S517:YES)、表領域とする(S519)。さもなければ(S516:NO)、グラフ領域とする(S518)。直線数が4本未満か、ラベリング率が12%よりも大きければ(S509:NO)、写真領域とする(S510)。
【選択図】図5

Description

本発明は、画像処理装置、画像処理方法及び画像処理プログラムに関し、特に、文字の判読性を維持しつつ画像ファイルを圧縮する技術に関する。
近年、様々な分野において文書の電子ファイル化が進み、電子化された文書は電子メールに添付して送受信される。また、カラースキャナの普及に伴って、カラー文書の電子ファイル化が盛んに行なわれている。
さて、カラー文書を電子化する場合、例えば、A4サイズのフルカラー原稿を解像度300dpiでスキャンすると電子ファイルの容量が25MB程度にもなる。このため、カラー文書の電子ファイル(以下、「画像ファイル」という。)は圧縮してから電子メールに添付するのが通常である。
画像ファイルを圧縮する際、圧縮率を上げると文字が読み辛くなり、文字が読める程度に留めると容量をあまり小さくすることができない。このため、文字領域と文字以外の領域とで圧縮方法を変える高圧縮PDF(Compact Portable Document Format)技術が開発されている(特許文献1〜6を参照)。
すなわち、画像ファイルを参照して、先ず、文字領域と文字以外の領域とに判別する。そして、文字領域は高い解像度を維持しつつ2値化し、同じ色の文字に係る文字領域を統合し、可逆圧縮を施すことによって、文字の読み易さを確保する。一方、文字以外の領域は解像度を下げると共に非可逆圧縮を施して、高い圧縮率を達成する。
特開2002−245405号公報 特開2005−094796号公報 特開2002−373341号公報 特開2003−030584号公報 特開2005−236800号公報 特開2005−252321号公報
しかしながら、カラースキャナで電子ファイル化される原稿には、ワープロ文書や表といった一般的なオフィス文書に限らず、雑誌やカタログ等、イラストや写真を多く含む原稿までもが含まれる。また、使われる文字の大きさや色も多様極まりない。
これに対して、従来技術においては、画像データを構成する各画素を連結させ、連結した矩形領域についてラベリング処理を行ってオブジェクトを特定し、この特定されたオブジェクトの大きさがある一定値以下のものを文字領域と判定している。
これは、処理が簡単で負荷が小さいからであるが、このような判定処理だけでは、上述のような多様な原稿に対しては文字であるにも関わらず文字以外の領域であると誤判定されて当該領域に対して非可逆圧縮がかけられてしまい、展開後に文字の判読性が低下してしまうという問題がある。
特に、表や図の中に文字が書かれている場合には、誤判別が発生し易く、判読性の低下が著しい。
本発明は、上述のような問題に鑑みて為されたものであって、画像ファイルを圧縮する際に文字領域か否かによって異なる圧縮方式を適用する画像処理装置、画像処理方法及び画像処理プログラムであって、より精度良く領域判別を行なう画像処理装置、画像処理方法及び画像処理プログラムを提供することを目的とする。
上記目的を達成するため、本発明に係る画像処理装置は、画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理装置であって、領域が所定サイズよりも小さいかを判定するサイズ判定手段と、領域が略同色の画素を所定割合以上含むかを判定する下地判定手段と、領域が文字を含むかを判定する文字判定手段と、を備え、領域毎に、サイズ判定手段にて所定サイズよりも小さいと判定されたか、または下地判定手段にて略同色の画素が所定割合以上含まれていると判定されたら、文字判定手段にて文字が含まれているかを判定することを特徴とする。
このようにすれば、大きな文字が含まれているために領域サイズが大きくなり、従来は非可逆圧縮される領域についても、文字判定を行って可逆圧縮することができるので、大きな文字であっても展開後に判読し易くすることができる。
また、本発明に係る画像処理装置は、画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理装置であって、領域が所定サイズよりも小さいかを判定するサイズ判定手段と、領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定手段と、領域が文字を含むかを判定する文字判定手段と、を備え、領域毎に、サイズ判定手段にて所定サイズよりも小さいと判定されたか、または直線判定手段にて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定手段にて文字が含まれているかを判定することを特徴とする。
このようにすれば、表やグラフといった垂直方向や水平方向の直線を多く含むために領域サイズが大きくなり、従来は非可逆圧縮される領域についても、文字判定を行って可逆圧縮することができるので、表やグラフに含まれる文字についても展開後に判読し易くすることができる。
また、本発明に係る画像処理装置は、画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理装置であって、領域が所定サイズよりも小さいかを判定するサイズ判定手段と、領域が略同色の画素を所定割合以上含むかを判定する下地判定手段と、領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定手段と、領域が文字を含むかを判定する文字判定手段と、を備え、領域毎に、サイズ判定手段にて所定サイズよりも小さいと判定されたか、下地判定手段にて略同色の画素が所定割合以上含まれていると判定されたか、または直線判定手段にて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定手段にて文字が含まれているかを判定することを特徴とする。
このようにすれば、大きな文字と表やグラフに含まれる文字の双方について展開後の可読性を向上させることができる。
この場合において、下地判定手段は、サイズ判定手段にて所定サイズよりも小さいと判定されなかった領域について判定を行い、直線判定手段は、下地判定手段にて略同色の画素が所定以上含まれていると判定されなかった領域について判定を行なえば、判定に要する処理負荷が軽い順に領域の属性を判定するので、全体として処理負荷を軽減することができる。
また、本発明に係る画像処理装置は、略同色の画素が所定割合以上含まれていても、オブジェクトの画素が所定割合以上含まれているか、または、オブジェクト以外の画素に隣接するオブジェクトの画素が所定割合以下しか含まれていない場合には、文字判定手段にて文字が含まれているかを判定しないことを特徴とする。
このようにすれば、略同色の画素が所定割合以上含まれている場合であっても、その領域が下地のみである場合を除外して文字の有無を判定するので、文字判定に伴う処理負荷を軽減することができる。
また、本発明に係る画像処理装置は、文字が含まれている領域は可逆圧縮し、文字が含まれていない領域は非可逆圧縮することを特徴とする。
このようにすれば、文字を含む領域については展開後の可読性を向上させることができ、かつ、文字を含まない領域については圧縮率を高めることができる。
この場合において、文字が含まれている領域はMMR方式にて圧縮し、文字が含まれていない領域はJPEG方式にて圧縮すれば好適である。
また、本発明に係る画像処理装置は、領域は矩形領域であることを特徴とする。このようにすれば、処理負荷を低減して、処理速度を向上させることができる。
本発明に係る画像処理方法は、画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理方法であって、領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、領域が略同色の画素を所定割合以上含むかを判定する下地判定ステップと、領域が文字を含むかを判定する文字判定ステップと、を含み、領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、または下地判定ステップにて略同色の画素が所定割合以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定することを特徴とする。
このようにすれば、大きな文字が含まれているために領域サイズが大きくなり、従来は非可逆圧縮される領域についても、文字判定を行って可逆圧縮することができるので、大きな文字であっても展開後に判読し易くすることができる。
また、本発明に係る画像処理方法は、画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理方法であって、領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定ステップと、領域が文字を含むかを判定する文字判定ステップと、を含み、領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、または直線判定ステップにて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定することを特徴とする。
このようにすれば、表やグラフといった垂直方向や水平方向の直線を多く含むために領域サイズが大きくなり、従来は非可逆圧縮される領域についても、文字判定を行って可逆圧縮することができるので、表やグラフに含まれる文字についても展開後に判読し易くすることができる。
また、本発明に係る画像処理方法は、画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理方法であって、領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、領域が略同色の画素を所定割合以上含むかを判定する下地判定ステップと、領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定ステップと、領域が文字を含むかを判定する文字判定ステップと、を含み、領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、下地判定ステップにて略同色の画素が所定割合以上含まれていると判定されたか、または直線判定ステップにて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定することを特徴とする。
このようにすれば、大きな文字と表やグラフに含まれる文字の双方について展開後の可読性を向上させることができる。
この場合において、下地判定ステップは、サイズ判定ステップにて所定サイズよりも小さいと判定されなかった領域について判定を行い、直線判定ステップは、下地判定ステップにて略同色の画素が所定以上含まれていると判定されなかった領域について判定を行なえば、判定に要する処理負荷が軽い順に領域の属性を判定するので、全体として処理負荷を軽減することができる。
また、本発明に係る画像処理方法は、略同色の画素が所定割合以上含まれていても、オブジェクトの画素が所定割合以上含まれているか、または、オブジェクト以外の画素に隣接するオブジェクトの画素が所定割合以下しか含まれていない場合には、文字判定ステップにて文字が含まれているかを判定しないことを特徴とする。
このようにすれば、略同色の画素が所定割合以上含まれている場合であっても、その領域が下地のみである場合を除外して文字の有無を判定するので、文字判定に伴う処理負荷を軽減することができる。
また、本発明に係る画像処理方法は、文字が含まれている領域は可逆圧縮し、文字が含まれていない領域は非可逆圧縮することを特徴とする。
このようにすれば、文字を含む領域については展開後の可読性を向上させることができ、かつ、文字を含まない領域については圧縮率を高めることができる。
本発明に係る画像処理プログラムは、画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域をコンピュータに画像圧縮させる画像処理プログラムであって、領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、領域が略同色の画素を所定割合以上含むかを判定する下地判定ステップと、領域が文字を含むかを判定する文字判定ステップと、を含み、領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、または下地判定ステップにて略同色の画素が所定割合以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定することを特徴とする。
このようにすれば、大きな文字が含まれているために領域サイズが大きくなり、従来は非可逆圧縮される領域についても、文字判定を行って可逆圧縮することができるので、大きな文字であっても展開後に判読し易くすることができる。
また、本発明に係る画像処理プログラムは、画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域をコンピュータに画像圧縮させる画像処理プログラムであって、領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定ステップと、領域が文字を含むかを判定する文字判定ステップと、を含み、領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、または直線判定ステップにて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定することを特徴とする。
このようにすれば、表やグラフといった垂直方向や水平方向の直線を多く含むために領域サイズが大きくなり、従来は非可逆圧縮される領域についても、文字判定を行って可逆圧縮することができるので、表やグラフに含まれる文字についても展開後に判読し易くすることができる。
また、本発明に係る画像処理プログラムは、画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域をコンピュータに画像圧縮させる画像処理プログラムであって、領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、領域が略同色の画素を所定割合以上含むかを判定する下地判定ステップと、領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定ステップと、領域が文字を含むかを判定する文字判定ステップと、を含み、領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、下地判定ステップにて略同色の画素が所定割合以上含まれていると判定されたか、または直線判定ステップにて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定することを特徴とする。
このようにすれば、大きな文字と表やグラフに含まれる文字の双方について展開後の可読性を向上させることができる。
この場合において、下地判定ステップは、サイズ判定ステップにて所定サイズよりも小さいと判定されなかった領域について判定を行い、直線判定ステップは、下地判定ステップにて略同色の画素が所定以上含まれていると判定されなかった領域について判定を行なえば、判定に要する処理負荷が軽い順に領域の属性を判定するので、全体として処理負荷を軽減することができる。
また、本発明に係る画像処理プログラムは、略同色の画素が所定割合以上含まれていても、オブジェクトの画素が所定割合以上含まれているか、または、オブジェクト以外の画素に隣接するオブジェクトの画素が所定割合以下しか含まれていない場合には、文字判定ステップにて文字が含まれているかを判定しないことを特徴とする。
このようにすれば、略同色の画素が所定割合以上含まれている場合であっても、その領域が下地のみである場合を除外して文字の有無を判定するので、文字判定に伴う処理負荷を軽減することができる。
また、本発明に係る画像処理プログラムは、文字が含まれている領域は可逆圧縮し、文字が含まれていない領域は非可逆圧縮することを特徴とする。
このようにすれば、文字を含む領域については展開後の可読性を向上させることができ、かつ、文字を含まない領域については圧縮率を高めることができる。
以下、本発明に係る画像処理装置の実施の形態について、複合機(MFP: Multi- Function Peripheral)を例にとり、図面を参照しながら説明する。
(1) 複合機の構成
先ず、本発明の実施の形態に係る複合機の構成について説明する。
図1は、本発明の実施の形態に係る複合機の外観図である。図1に示されるように、複合機1は画像形成装置100、画像読取装置101、ペーパーフィーダ102、フィニッシャ103、及びマルチトレイ104を備えている。画像読取装置101は自動原稿搬送装置にて原稿を自動的に搬送し、フルカラー24ビット、解像度300dpiで読み取る。
因みに、A4サイズの原稿を解像度300dpiで読み取ると一辺が略2500画素、もう一辺が略3500画素の画像データが得られる。
画像形成装置100は、ペーパーフィーダ102が供給する記録紙に、読み取った画像データに基づいて画像を形成する。また、画像形成装置100は当該画像データを圧縮してファイルを生成し、電子メールに添付してネットワークを介して接続された外部の装置に送信する。画像を形成した記録紙はフィニッシャ103又はマルチトレイ104に排出される。
(2) 画像形成装置100の構成
次に、画像形成装置100の構成について説明する。
図2は、画像形成装置100の主要なハードウェア構成を示すブロック図である。図2に示されるように、画像形成装置100は、入力画像処理回路201、記憶部202、CPU203、出力画像処理回路204、プリントエンジン205、ネットワークインタフェース206、モデム207、操作パネル208及びプログラム記憶部209を備えている。
入力画像処理回路201は、画像読取装置101から画像データを受け付けて、入力画像の色変換、色補正、解像度変換、領域判別等の処理を行う。
記憶部202は、入力画像処理回路201が処理した画像データを保持する。DRAM(Dynamic Random Access Memory)等の半導体メモリやハードディスク等の磁気メモリからなる。
プログラム記憶部209は、CPUが実行する各種処理の処理プログラムを記憶する。
CPU203は、プログラム記憶部209に記憶されたプログラムを読み出して、画像形成装置100全体の制御や操作パネルにおけるキー入力の検出、表示、画像データのファイル形式(JPEG(Joint Photographic Experts Group)、PDF、TIFF(Tagged Image File Format)、高圧縮PDF等)の変更、電子メールの作成等を行なう。
出力画像処理回路204は、スクリーン制御やスムージング処理、PWM(Pulse Width Modulation)制御等を行なって出力画像データを生成する。
プリントエンジン205は、出力画像データに従って記録紙に画像を形成する。カラー画像ならばイエロー、マゼンタ、シアン及びブラックの4色で、モノクロ画像ならばブラックだけで画像を形成する。
ネットワークインタフェース206はネットワークを介して電子メール等を送受信するためのインタフェース装置であり、プロトコル処理等を行う。
モデム207は、NCU(Network Control Unit)を内蔵し、ファクシミリを送受信する際の変復調処理やプロトコル処理、電話回線とのインタフェース処理等を行う。
操作パネル208は、操作キーと表示パネルとを備え、ファクシミリや電子メールの宛先の入力、読み取り条件の選択、画像ファイルのフォーマットの選択、各種処理の開始や中断等、ユーザからの指示入力を受け付ける。
(3) 入力画像処理装置201の構成
図3は、入力画像処理装置201の主要な機能構成を示すブロック図である。図3に示されるように、入力画像処理装置201は前処理部301、領域判別部302、低解像度化部303、非可逆圧縮部304、可逆圧縮部305及びPDF化部306を備えている。
前処理部301は、画像読取装置101から受け付けた画像データに画像形式の変換、解像度変換、下地除去等の処理を施す。前処理部301が受け付ける画像データのフォーマットは例えば、TIFF、JPEG、BMP等である。
領域判別部302は、後述のように、前処理部で上記処理を施されたフルカラー24ビットの画像データにおいて複数の領域を特定し、得られた領域毎に文字が含まれているか否かを判別し、文字を含む領域については文字の代表色を決定する。すなわち、ひとつの領域に含まれる文字は同色として、その色を決定する。
低解像度化部303は、領域判別部302が背景領域と判別した領域に対して低解像度化処理を施す。
非可逆圧縮部304は、低解像度化された背景領域に対して非可逆圧縮処理を施す。非可逆圧縮方式としては、例えば、JPEG方式を用いれば良い。このようにすれば、背景領域を高い圧縮率で圧縮することができる。
可逆圧縮部305は、領域判別部302が文字領域と判別した領域に対して可逆圧縮処理を施す。可逆圧縮方式としては、例えば、MMR(Modified Modified Read)方式を用いれば良い。このようにすれば、圧縮処理に伴って文字領域に含まれる文字が判読し辛くなるのを回避することができる。
PDF化部306は、非可逆圧縮部304と可逆圧縮部305とから圧縮された画像データを受け付けてPDFファイルを作成し、出力する。PDF化部306が出力したPDFファイルは複合機1や他の電子メール端末にて電子メールに添付されて送信される。
(4) 領域判別部302の動作
次に、領域判別部302の動作について説明する。
図4は、領域判別部302の動作を示すフローチャートである。図4に示されるように、領域判別部302は先ず1枚の画像データから複数の領域を特定し(領域抽出処理:S401)、得られた領域毎に文字が含まれているか否かを判別し(文字判定処理:S402)、文字を含む領域については文字の代表色を決定する(代表色判定処理:S403)。
(a) 領域抽出処理(S401)
次に、領域判別部302が実行する領域抽出処理(S401)について詳述する。図5は、領域抽出処理(S401)の詳細を示すフローチャートである。
図5に示されるように、領域判別部302は、カラー24ビットの画像データを明度データ(階調値)に変換する(S501)。すなわち、カラー24ビットの画像データの明度を算出して8ビットグレースケールの画像データを生成する。これによって、判別精度を向上させると共に、処理負荷を低減することができる。
また、領域判別部302は更に平滑化処理を施す。これによって、画像データに含まれる孤立点やごみといったノイズが除去され、領域の誤検出を低減することができる。
次に、領域判別部302は、判別すべき矩形領域を特定する矩形領域特定処理を実行する(S502)。そして、特定した矩形領域ごとにラベリング率を求める(S503)。ラベリング率とは矩形領域内の全画素数に対する黒画素数の割合である。
図6は、ラベルを同じくする黒画素とそれらの外接矩形とを例示する図である。外接矩形601は黒画素602を囲む最小の矩形となっている。すなわち、外接矩形に囲まれた領域がラベルを同じくする黒画素を含む最小の矩形領域である。矩形領域601は、全画素数が156画素で黒画素数が61画素なので、ラベリング率は39%である。
次に、領域判別部302はすべての矩形領域について個別に以下のような処理を実行する。すなわち、先ず、矩形領域のサイズが所定のサイズよりも小さいか否かを判定する。本実施の形態においては、矩形領域の幅と高さが何れも250ピクセル以下ならば、矩形領域のサイズが小さいと判定して、テキスト領域と判定する(S511)。
矩形領域のサイズが小さくない場合(S504:NO)、領域判別部302は当該矩形領域の下地率を求める(S505)。下地の特徴はラベリング画素がほぼ同じ色からなる点である。
本実施の形態においては、先ず、フルカラー24ビットの画像データに対して8×8の矩形領域ごとに階調値の平均を求める平滑化処理を行った後に、赤、緑、青の色成分毎に階調値のヒストグラムを求める。そして、最頻値の階調値を中心とする階調値±16の範囲内の度数(画素数)の合計を色成分毎に求める。
例えば、最頻値の階調値が50ならば、階調値が34から66までの範囲内にある画素の数を求める。そして、下地率として、色成分毎に求めた合計値を足し合わせた値の矩形領域内の全画素数の3倍に対する割合を求める。
このように1/8圧縮してヒストグラムを作成し、そのピークを検出すれば、網点のように鋭いピークが出難いものや単色の線画を除外することができる。
下地率が66%以上ならば(S506:YES)、当該矩形領域について周辺長率を求める(S512)。ここで、周辺長率とは、当該矩形領域内における黒画素の総数に対する白画素に隣接する黒画素数の割合をいう。
下地と大文字との違いは形状の複雑さにある。このため、大文字は下地よりラベリング率が低く、周辺長率は高い。
図7は、矩形領域を例示する図であって、(a)は矩形全体が黒画素で埋め尽くされている場合、(b)は黒画素で文字「Z」が表わされている場合である。何れも、矩形領域内の画素数は100画素である。
図7(a)では、ラベリング率が100%なので、基準値である67%以上である、また、矩形領域内の黒画素数が100画素なのに対して外周画素数は36画素なので、周辺長率は36%である。一方、図7(b)では、黒画素数と外周画素数とは等しく36画素であり、周辺長率は100%である。
さて、ラベリング率が67%未満で、かつ、周辺長率が50%以上ならば(S513:YES)、領域判別部302は当該矩形領域を大文字領域と判別する(S515)。また、ラベリング率が67%以上、または周辺長率が50%未満ならば(S513:NO)、下地領域と判別する(S514)。
さて、下地率が66%未満ならば(S506:NO)、領域判別部302は、領域毎に主走査方向の直線数と副走査方向の直線数との合計を求める直線数計数処理を実行する(S507)。
得られた直線数が10本以上の場合や(S508:YES)、直線数が4本以上で、かつ、ラベリング率が12%以下である場合には(S509:YES)、エッジ率を求める(S516)。本実施の形態において、エッジ率とは、矩形領域内における黒画素の総数に対する斜め方向のエッジ画素数の割合をいう。
領域判別部302は、エッジ率が5%以上ならば(S517:YES)、表領域と判別する(S519)。また、エッジ率が5%未満ならば(S516:NO)、グラフ領域と判別する(S518)。
直線数が4本未満、または、ラベリング率が12%よりも大きければ(S509:NO)、写真領域と判別して(S510)、判別処理を終了する。
以上のようにして、テキスト領域、大文字領域、グラフ領域及び表領域と判別された矩形領域は、以後、文字領域として処理される。下地領域と写真領域は文字以外の領域として処理される。
このように、矩形領域のサイズが所定のサイズよりも大きいと判定された領域に対しても、さらに下地率や直線数といったパラメータに基づいて文字判定を行なわせるべき領域か否かを判定しているので、文字判定が必要であって文字判定処理の誤判定の可能性が低い領域を抽出することができる。
一方、上記パラメータに基づいて文字判定を行なわせるべき領域、すなわち写真領域と判定された領域に対しては、特に文字判定を行なわせると誤判定する可能性が高く、かつ、誤判定した場合の画質劣化が目立つことから、あえて文字判定自体を行なわせないようにして画質劣化の低減を図ることができる。
(b) 矩形領域特定処理(S502)
次に、矩形領域特定処理(S502)について詳しく説明する。
図8は、矩形領域特定処理(S502)の詳細を示すフローチャートである。図8に示されるように、領域判別部302は、先ず、画像データを適当な閾値を用いて2値化する(S801)。
本実施の形態においては、変動閾値による2値化処理を行う。すなわち、5画素×5画素の正方領域毎にその四隅の画素の階調値の最大値から所定値を減算した値を閾値として2値化する。これによって、黒画素と白画素との2色の画素からなる2値画像を得ることができる。
次に、主走査方向と副走査方向とのそれぞれについて黒画素の間隔を計測する(S802)。そして、隣り合う黒画素の間の白画素数が所定の画素数以下である場合には、当該白画素を黒画素に置き換える。これによって、隣り合う黒画素が連結される(S803)。このようにすれば、単語や行等、一連の文字をまとめてひとつの連結領域とすることができる。
次に、黒画素についてラベリング処理を実行する(S804)。すなわち、隣り合う黒画素に同じラベルを割り振る。そして、ラベルを同じくする黒画素毎に外接する矩形を決定する(S805)。この外接矩形が求める矩形領域を示す。
(c) 直線数計数処理(S507)
次に、直線数計数処理(S507)について詳しく説明する。
表やグラフは写真に比べて水平方向や垂直方向にのびる直線を多く含む傾向がある。したがって、かかる直線の数を検出すれば、表やグラフを写真から区別することができる。
直線を検出する方法としては、微分Iフィルタ等が知られているが、短い線分も直線として検出し易い一方、長い直線は僅かに傾いても検出できない。また、決まった線幅の直線しか検出できないといった問題があり、本発明の目的に適わない。
このため、直線数計数処理(S507)においては、主走査方向や副走査方向に引き続くライン間で黒画素数の差が大きいことを以って直線が存在すると判定し、直線数を計数する。なお、直線の検出精度を向上させるため、予め傾きを補正する。
図9は、直線数計数処理(S507)の内容を示すフローチャートである。図9に示されるように、先ず、矩形領域毎に黒画素部分の傾きを検出する(S901)。この傾きは、外接矩形の長辺側の三角形状の白画素部分の縦横比から求める。
傾きが0度より大きく10度以下である場合には(S902:YES)、黒画素部分の傾きを補正する(S903)。図10は、傾き補正の過程を例示する図であって、(a)から(c)の順に処理が進行する。先ず、図10(a)に示されるように、左上と右下に三角形状の白画素部分があり、その斜辺は主走査方向に対して10度弱傾いている。
先ず、図10(b)に示されるように、黒画素部分を比例伸張して左上の白画素部分を無くす。図10(c)に示されるように、同じく黒画素部分を比例伸張して右下の白画素部分を無くす。このようにして、黒画素部分の傾きが補正される。
次に、矩形領域内の水平線の本数を数える(S904)。すなわち、副走査方向に隣り合う幅1画素のライン間で、黒画素数が外接矩形の主走査方向の画素数の1/4以上異なっている場合に、黒画素数が多いラインを1本の水平線と数える。
また、矩形領域内の垂直線の本数を数える(S905)。すなわち、主走査方向に隣り合う幅1画素のライン間で、黒画素数が外接矩形の副走査方向の画素数の1/4以上異なっている場合に、黒画素数が多いラインを1本の垂直線と数える。
そして、水平線の本数と垂直線の本数とを合計して直線数とし(S906)、直線数計数処理を完了する。
(d) エッジ率について
一般的に、表の矩形領域はグラフの矩形領域よりも文字数が多い傾向があるので、この特徴を利用して表領域とグラフ領域とを判別する。本実施の形態においては、エッジ率を求める際には未だ文字部分が確定していないので、白画素の総数に対するエッジ白画素の割合を以ってエッジ率に代える。
図11は、エッジ率算出処理の内容を示すフローチャートである。図11に示されるように、エッジ率を算出するに際しては、先ず、白画素数の総数を計数する(S1101)。次に、エッジ白画素を検出する(S1102)。図12は、斜めエッジを検出するフィルタを例示する図である。図12に示されるようなフィルタを用いれば、エッジ白画素を検出することができる。
このようにして得られたエッジ白画素数を計数し(S1103)、白画素の総数に対するエッジ白画素数を計算すれば、エッジ率を得ることができる(S1104)。
(e) 文字判定処理(S402)
次に、文字判定処理(S402)について説明する。
図13は、文字判定処理(S402)の内容を示すフローチャートである。図13に示されるように、領域判別部302は、先ず、文字領域についてカラー24ビットの画像データを階調化して8ビットグレースケールの画像データを生成し(S1301)、更に平滑化する(S1302)。
なお、文字判定処理(S402)においては、領域判別処理(S401、S401)におけるよりも弱い平滑化を行なうことによって、文字判定の精度を向上させる。一方、領域判別処理(S401)においては、強い平滑化を行なうことによって画像を連結し易くし、処理の高速化を図る。
次に、領域判別部302は、エッジを抽出し(S1303)、2値化する(S1304)。このエッジ抽出には、例えば、5×5や3×3のガウシアンフィルタを用いれば良い。本実施の形態においては、8ビットグレースケール画像を用いてエッジを抽出するので、2値画像を用いる場合とは異なり、明度の高い領域にある文字や反転文字を検出することができる。
そして、表や下線による文字の誤判定を低減するために、表や下線といった罫線を除去し(S1305)、文字判定を行なう。この文字判定は、所与の画像が文字であるか否かを判定するものであって、如何なる文字であるかは判定しない。
所与の画像が文字であるか否かは、矩形領域から空白部分を除去して、残った部分の縦横比が妥当な範囲内にあるか否かを判定することによって行えば良い。また、文字判定の対象となる部分の特徴量を抽出して、辞書データと比較することによって判定しても良い。
文字判定によって文字であるとされたら(S1306:YES)、領域判別部302はその部分を文字ブロックと判定する(S1307)。さもなければ、文字ブロックでないと判定する(S1308)。
(f) 代表色判定処理(S403)
次に、代表色判定処理(S403)について説明する。
図14は、代表色判定処理(S403)の内容を示すフローチャートである。図14に示されるように、領域判別部302は、先ず、文字ブロックにおいて網点を除去する(S1401)。このようにすれば、文字背景の網点部分が2値化されてゴミとなるのを防ぐことができる。
次に、文字ブロックごとに階調ヒストグラムを作成し(S1402)、このヒストグラムに基づいて閾値を決定し、文字ブロックを2値化する(S1403)。このようにすれば、文字ブロック内で文字と背景とを分離することができると共に、ファイルサイズを小さくすることができる。
そして、この2値化によって残った部分の文字色を参照し、文字ブロックごとに代表色を1色決定する(S1404)。
また、代表色が近く、距離も近い文字ブロックを統合して、一つの文字ブロックとすれば、文字ブロックの総数を減らしてファイルサイズを小さくすることができる。
図15は、高圧縮PDFファイルのデータ構造を例示する図である。図15に示されるように、高圧縮PDFファイルはヘッダ、ボディ、相互参照表及びトレーラからなっている。
ヘッダにはPDF仕様のバージョンが格納され、ボディには文書の内容が格納される。相互参照表にはボディ内におけるオブジェクトの位置が格納されている。トレーラにはPDFファイ内におけるオブジェクトの数や、カタログ辞書のオブジェクト番号が格納される。
ボディには文書の内容として、日付等を含む文書情報や各ページのデータブロック、各ページの子ページ辞書、親ページ辞書及びカタログ辞書が格納されている。カタログ辞書には親ページ辞書の番号が、親ページ辞書には、全体のページ数や子ページ辞書の番号が、また、子ページ辞書にはデータブロックの書式等が格納される。
データブロックは、背景レイヤ、黒の文字レイヤ、赤の文字レイヤ、青の文字レイヤ及びレイヤ情報からなる。背景レイヤにはJPEG圧縮されたデータが格納される。色毎の文字レイヤにはそれぞれ2値化された後にMMR圧縮されたデータが格納される。
レイヤ情報には、各レイヤの位置や、文字レイヤにおける文字の色が格納される。上述ようにして決定した代表色はここに格納される。
高圧縮PDFは以上のようなデータ構造となっているので、文字ブロックを統合すれば、ページ毎のデータブロックを減らして、ファイルサイズを低減することができる。
(変形例)
以上、本発明を実施の形態に基づいて説明してきたが、本発明が上述の実施の形態に限定されないのは勿論であり、以下のような変形例を実施することができる。
(1) 上記実施の形態においては、下地率が66%以上か否かのみで処理を分岐する場合について説明したが、本発明がこれに限定されないのは言うまでもなく、これに代えて次のようにしても良い。
すなわち、矩形領域が小さい場合に、文字が含まれているとヒストグラムが集中し難くなる傾向が見られる。このため、矩形領域のサイズが小さい場合には、下地率が低くても周辺長率を判定する対象とすれば、領域判別の精度を向上させることができる。
(2) 上記実施の形態においては、専ら複合機1が自ら読み取った原稿の画像データを圧縮する場合について説明したが、本発明がこの構成に限定されないのは言うまでもなく、これに代えて次のようにしても良い。
図16は、本変形例に係る画像処理システムの構成を示す図である。
図16に示されるように、画像処理システム16は、画像処理装置1601、画像読取装置1602、外部記憶装置1603及び画像出力装置1604を備え、画像処理装置1601、画像読取装置1602、外部記憶装置1603及び画像出力装置1604は互いに通信回線にて接続されている。
画像読取装置1602は、原稿画像を1ページ単位で読み取って画像データを生成する。画像読取装置1602は、通信回線を介して画像データを画像処理装置に送信する。
画像処理装置1601は、画像読取装置1602から画像データを受信すると、上述の複合機1と同様にして文字領域を判定し、画像データを圧縮する。画像処理装置1601は圧縮した画像データを外部記憶装置1603に送信する。画像処理装置1601としては、例えば、パーソナルコンピュータを用いれば良い。
外部記憶装置1603は、ハードディスクドライブを備え、通信回線を介して画像処理装置1601が圧縮した画像データを受信すると、それらをハードディスクドライブに記憶する。
画像出力装置1604は、通信回線を介して画像処理装置1601から画像データを指定した印刷指示を受信すると、指定された画像データを外部記憶装置1603から読み出す。そして、画像出力装置1604は、画像データを展開した後、記録紙に印刷する。
このような構成においても、本発明によれば、圧縮した画像データのサイズを抑えつつ、画像出力装置1604にて展開する際の処理時間を抑えることができる。
(3) 上記実施の形態においては、専ら複合機1を例にとり、本発明に係る画像処理装置について説明したが、本発明がこれに限定されないのは言うまでもなく、これに代えて次のようにしても良い。
すなわち、本発明は上述のような複合機1や画像処理装置1601が実行する画像処理方法であるとしても良いし、コンピュータを画像処理装置1601として動作させるための画像処理プログラムであるとしても良い。何れの場合においても、本発明の効果を得ることができる。
本発明に係る画像処理装置、画像処理方法及び画像処理プログラムは、文字の判読性を維持しつつ画像ファイルを圧縮する装置として有用である。
本発明の実施の形態に係る複合機の外観図である。 本発明の実施の形態に係る画像形成装置100の主要なハードウェア構成を示すブロック図である。 本発明の実施の形態に係る入力画像処理装置201の主要な機能構成を示すブロック図である。 本発明の実施の形態に係る領域判別部302の動作を示すフローチャートである。 本発明の実施の形態に係る領域判別処理(S401)の詳細を示すフローチャートである。 ラベルを同じくする黒画素とそれらの外接矩形とを例示する図である。 矩形領域を例示する図であって、(a)は矩形全体が黒画素で埋め尽くされている場合、(b)は黒画素で文字「Z」が表わされている場合である。 本発明の実施の形態に係る矩形領域特定処理(S502)の詳細を示すフローチャートである。 本発明の実施の形態に係る直線数計数処理(S507)の内容を示すフローチャートである。 本発明の実施の形態に係る傾き補正の過程を例示する図である。 本発明の実施の形態に係るエッジ率算出処理の内容を示すフローチャートである。 本発明の実施の形態に係る斜めエッジを検出するフィルタを例示する図である。 本発明の実施の形態に係る文字判定処理(S402)の内容を示すフローチャートである。 本発明の実施の形態に係る代表色判定処理(S403)の内容を示すフローチャートである。 高圧縮PDFファイルのデータ構造を例示する図である。 本発明の変形例(2)に係る画像処理システムの構成を示す図である。
符号の説明
1…………複合機
16………画像処理システム
100……画像形成装置
101……画像読取装置
102……ペーパーフィーダ
103……フィニッシャ
104……マルチトレイ
201……入力画像処理回路
202……記憶部
203……CPU
204……出力画像処理回路
205……プリントエンジン
206……ネットワークインタフェース
207……モデム
208……操作パネル
301……前処理部
302……領域判別部
303……低解像度化部
304……非可逆圧縮部
305……可逆圧縮部
306……PDF化部
601……外接矩形
602……黒画素
1601…画像処理装置
1602…画像読取装置
1603…外部記憶装置
1604…画像出力装置

Claims (20)

  1. 画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理装置であって、
    領域が所定サイズよりも小さいかを判定するサイズ判定手段と、
    領域が略同色の画素を所定割合以上含むかを判定する下地判定手段と、
    領域が文字を含むかを判定する文字判定手段と、を備え、
    領域毎に、サイズ判定手段にて所定サイズよりも小さいと判定されたか、または下地判定手段にて略同色の画素が所定割合以上含まれていると判定されたら、文字判定手段にて文字が含まれているかを判定する
    ことを特徴とする画像処理装置。
  2. 画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理装置であって、
    領域が所定サイズよりも小さいかを判定するサイズ判定手段と、
    領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定手段と、
    領域が文字を含むかを判定する文字判定手段と、を備え、
    領域毎に、サイズ判定手段にて所定サイズよりも小さいと判定されたか、または直線判定手段にて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定手段にて文字が含まれているかを判定する
    ことを特徴とする画像処理装置。
  3. 画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理装置であって、
    領域が所定サイズよりも小さいかを判定するサイズ判定手段と、
    領域が略同色の画素を所定割合以上含むかを判定する下地判定手段と、
    領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定手段と、
    領域が文字を含むかを判定する文字判定手段と、を備え、
    領域毎に、サイズ判定手段にて所定サイズよりも小さいと判定されたか、下地判定手段にて略同色の画素が所定割合以上含まれていると判定されたか、または直線判定手段にて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定手段にて文字が含まれているかを判定する
    ことを特徴とする画像処理装置。
  4. 下地判定手段は、サイズ判定手段にて所定サイズよりも小さいと判定されなかった領域について判定を行い、
    直線判定手段は、下地判定手段にて略同色の画素が所定以上含まれていると判定されなかった領域について判定を行なう
    ことを特徴とする請求項3に記載の画像処理装置。
  5. 略同色の画素が所定割合以上含まれていても、オブジェクトの画素が所定割合以上含まれているか、または、オブジェクト以外の画素に隣接するオブジェクトの画素が所定割合以下しか含まれていない場合には、文字判定手段にて文字が含まれているかを判定しない
    ことを特徴とする請求項1または2に記載の画像処理装置。
  6. 文字が含まれている領域は可逆圧縮し、
    文字が含まれていない領域は非可逆圧縮する
    ことを特徴とする請求項1から3の何れかに記載の画像処理装置。
  7. 文字が含まれている領域はMMR方式にて圧縮し、
    文字が含まれていない領域はJPEG方式にて圧縮する
    ことを特徴とする請求項6に記載の画像処理装置。
  8. 領域は矩形領域である
    ことを特徴とする請求項1から3の何れかに記載の画像処理装置。
  9. 画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理方法であって、
    領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、
    領域が略同色の画素を所定割合以上含むかを判定する下地判定ステップと、
    領域が文字を含むかを判定する文字判定ステップと、を含み、
    領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、または下地判定ステップにて略同色の画素が所定割合以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定する
    ことを特徴とする画像処理方法。
  10. 画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理方法であって、
    領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、
    領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定ステップと、
    領域が文字を含むかを判定する文字判定ステップと、を含み、
    領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、または直線判定ステップにて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定する
    ことを特徴とする画像処理方法。
  11. 画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域を画像圧縮する画像処理方法であって、
    領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、
    領域が略同色の画素を所定割合以上含むかを判定する下地判定ステップと、
    領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定ステップと、
    領域が文字を含むかを判定する文字判定ステップと、を含み、
    領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、下地判定ステップにて略同色の画素が所定割合以上含まれていると判定されたか、または直線判定ステップにて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定する
    ことを特徴とする画像処理方法。
  12. 下地判定ステップは、サイズ判定ステップにて所定サイズよりも小さいと判定されなかった領域について判定を行い、
    直線判定ステップは、下地判定ステップにて略同色の画素が所定以上含まれていると判定されなかった領域について判定を行なう
    ことを特徴とする請求項11に記載の画像処理方法。
  13. 略同色の画素が所定割合以上含まれていても、オブジェクトの画素が所定割合以上含まれているか、または、オブジェクト以外の画素に隣接するオブジェクトの画素が所定割合以下しか含まれていない場合には、文字判定ステップにて文字が含まれているかを判定しない
    ことを特徴とする請求項9または10に記載の画像処理方法。
  14. 文字が含まれている領域は可逆圧縮し、
    文字が含まれていない領域は非可逆圧縮する
    ことを特徴とする請求項9から11の何れかに記載の画像処理方法。
  15. 画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域をコンピュータに画像圧縮させる画像処理プログラムであって、
    領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、
    領域が略同色の画素を所定割合以上含むかを判定する下地判定ステップと、
    領域が文字を含むかを判定する文字判定ステップと、を含み、
    領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、または下地判定ステップにて略同色の画素が所定割合以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定する
    ことを特徴とする画像処理プログラム。
  16. 画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域をコンピュータに画像圧縮させる画像処理プログラムであって、
    領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、
    領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定ステップと、
    領域が文字を含むかを判定する文字判定ステップと、を含み、
    領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、または直線判定ステップにて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定する
    ことを特徴とする画像処理プログラム。
  17. 画像中の領域に文字が含まれているか否かによって異なる圧縮方法にて当該領域をコンピュータに画像圧縮させる画像処理プログラムであって、
    領域が所定サイズよりも小さいかを判定するサイズ判定ステップと、
    領域が略同色の画素を所定割合以上含むかを判定する下地判定ステップと、
    領域が垂直方向及び水平方向の直線を所定数以上含むかを判定する直線判定ステップと、
    領域が文字を含むかを判定する文字判定ステップと、を含み、
    領域毎に、サイズ判定ステップにて所定サイズよりも小さいと判定されたか、下地判定ステップにて略同色の画素が所定割合以上含まれていると判定されたか、または直線判定ステップにて垂直方向及び水平方向の直線が所定数以上含まれていると判定されたら、文字判定ステップにて文字が含まれているかを判定する
    ことを特徴とする画像処理プログラム。
  18. 下地判定ステップは、サイズ判定ステップにて所定サイズよりも小さいと判定されなかった領域について判定を行い、
    直線判定ステップは、下地判定ステップにて略同色の画素が所定以上含まれていると判定されなかった領域について判定を行なう
    ことを特徴とする請求項17に記載の画像処理プログラム。
  19. 略同色の画素が所定割合以上含まれていても、オブジェクトの画素が所定割合以上含まれているか、または、オブジェクト以外の画素に隣接するオブジェクトの画素が所定割合以下しか含まれていない場合には、文字判定ステップにて文字が含まれているかを判定しない
    ことを特徴とする請求項15または16に記載の画像処理プログラム。
  20. 文字が含まれている領域は可逆圧縮し、
    文字が含まれていない領域は非可逆圧縮する
    ことを特徴とする請求項15から17の何れかに記載の画像処理プログラム。
JP2006162721A 2006-06-12 2006-06-12 画像処理装置、画像処理方法及び画像処理プログラム Expired - Fee Related JP4135752B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006162721A JP4135752B2 (ja) 2006-06-12 2006-06-12 画像処理装置、画像処理方法及び画像処理プログラム
US11/647,353 US7747089B2 (en) 2006-06-12 2006-12-29 Image processing apparatus, image processing method, and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006162721A JP4135752B2 (ja) 2006-06-12 2006-06-12 画像処理装置、画像処理方法及び画像処理プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008102332A Division JP4861362B2 (ja) 2008-04-10 2008-04-10 画像処理装置、画像処理方法及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2007336000A true JP2007336000A (ja) 2007-12-27
JP4135752B2 JP4135752B2 (ja) 2008-08-20

Family

ID=38822054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006162721A Expired - Fee Related JP4135752B2 (ja) 2006-06-12 2006-06-12 画像処理装置、画像処理方法及び画像処理プログラム

Country Status (2)

Country Link
US (1) US7747089B2 (ja)
JP (1) JP4135752B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009266189A (ja) * 2008-04-21 2009-11-12 Sharp Corp 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
US8792719B2 (en) 2011-07-29 2014-07-29 Brother Kogyo Kabushiki Kaisha Image processing device determining attributes of regions
US8830529B2 (en) 2011-07-29 2014-09-09 Brother Kogyo Kabushiki Kaisha Image processing device for accurately identifying region in image without increase in memory requirement
US8837836B2 (en) 2011-07-29 2014-09-16 Brother Kogyo Kabushiki Kaisha Image processing device identifying attribute of region included in image
US8929663B2 (en) 2011-07-29 2015-01-06 Brother Kogyo Kabushiki Kaisha Image processing device identifying region in image as one of uniform region and nonuniform region
JP2015041957A (ja) * 2013-08-23 2015-03-02 ブラザー工業株式会社 画像処理装置
US9064175B2 (en) 2012-11-27 2015-06-23 Kyocera Document Solutions Inc. Image processing apparatus
US9367923B2 (en) 2013-06-28 2016-06-14 Kyocera Document Solutions, Inc. Image processing apparatus with improved compression of image data of character images and background images using respective different compressing methods

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8041135B2 (en) * 2006-10-20 2011-10-18 Canon Kabushiki Kaisha Image encoding apparatus and control method thereof
JP4847398B2 (ja) * 2007-06-06 2011-12-28 キヤノン株式会社 画像処理装置およびその方法
US9380304B1 (en) * 2015-01-30 2016-06-28 Kyocera Document Solutions Inc. Cell-based compression with edge detection
US11196997B2 (en) * 2015-05-15 2021-12-07 Hewlett-Packard Development Company, L.P. Image compression
GB2550965B (en) * 2016-06-03 2019-11-20 Advanced Risc Mach Ltd Encoding and decoding arrays of data elements
CN105872546B (zh) * 2016-06-13 2019-05-28 上海杰图软件技术有限公司 一种实现全景图像压缩存储的方法和系统
JP6950320B2 (ja) * 2017-07-18 2021-10-13 京セラドキュメントソリューションズ株式会社 画像処理装置
US11409981B1 (en) * 2021-03-31 2022-08-09 Intuit, Inc. Document classification using signal processing
US20220335240A1 (en) * 2021-04-15 2022-10-20 Microsoft Technology Licensing, Llc Inferring Structure Information from Table Images

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63127381A (ja) 1986-11-18 1988-05-31 Sanyo Electric Co Ltd 文書画像処理方法
JPH04320160A (ja) * 1991-04-19 1992-11-10 Matsushita Electric Ind Co Ltd 画像信号圧縮伸長装置および領域識別処理装置
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
JP2005094796A (ja) 1993-12-24 2005-04-07 Seiko Epson Corp 画像処理方法および画像処理装置
JP3636332B2 (ja) * 1993-12-24 2005-04-06 セイコーエプソン株式会社 画像処理方法および画像処理装置
JP3504054B2 (ja) 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
US6137905A (en) * 1995-08-31 2000-10-24 Canon Kabushiki Kaisha System for discriminating document orientation
US6307962B1 (en) * 1995-09-01 2001-10-23 The University Of Rochester Document data compression system which automatically segments documents and generates compressed smart documents therefrom
US6341178B1 (en) * 1995-12-04 2002-01-22 Xerox Corporation Method and apparatus for lossless precompression of binary images
JP3512604B2 (ja) * 1997-09-11 2004-03-31 シャープ株式会社 画像処理装置、および、そのプログラムを記録した記録媒体
US6014464A (en) * 1997-10-21 2000-01-11 Kurzweil Educational Systems, Inc. Compression/ decompression algorithm for image documents having text graphical and color content
US6173073B1 (en) * 1998-01-05 2001-01-09 Canon Kabushiki Kaisha System for analyzing table images
JP3095071B2 (ja) * 1998-04-21 2000-10-03 日本電気株式会社 パタンマッチング符号化装置、及びその符号化方法
JP2001034737A (ja) * 1999-07-16 2001-02-09 Minolta Co Ltd 画像合成装置、画像合成処理方法および画像合成処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001144962A (ja) 1999-11-11 2001-05-25 Fuji Xerox Co Ltd 画像処理装置
US6718059B1 (en) * 1999-12-10 2004-04-06 Canon Kabushiki Kaisha Block selection-based image processing
EP1119186A3 (en) * 2000-01-19 2002-07-31 Xerox Corporation Method for generating anti-aliased text and line graphics in compressed document images
JP2001297303A (ja) * 2000-02-09 2001-10-26 Ricoh Co Ltd 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP4655335B2 (ja) * 2000-06-20 2011-03-23 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
JP2003018412A (ja) 2001-07-03 2003-01-17 Canon Inc 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
US7043080B1 (en) * 2000-11-21 2006-05-09 Sharp Laboratories Of America, Inc. Methods and systems for text detection in mixed-context documents using local geometric signatures
US6690826B2 (en) * 2000-12-21 2004-02-10 Micron Technology, Inc. System and method for detecting text in mixed graphics data
US7254273B2 (en) * 2000-12-28 2007-08-07 Evolvable Systems Research Institute, Inc. Data coding method and device, and data coding program
JP4094240B2 (ja) 2001-02-20 2008-06-04 株式会社リコー 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体
JP4738645B2 (ja) 2001-06-15 2011-08-03 株式会社リコー 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
JP4616522B2 (ja) 2001-07-12 2011-01-19 株式会社リコー 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体
US7397953B2 (en) * 2001-07-24 2008-07-08 Hewlett-Packard Development Company, L.P. Image block classification based on entropy of differences
JP3899872B2 (ja) 2001-08-24 2007-03-28 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
US7003167B2 (en) * 2001-11-01 2006-02-21 Hewlett-Packard Development Company, L.P. Single-pass guaranteed-fit data compression using rate feedback
US7340092B2 (en) * 2001-12-21 2008-03-04 Minolta Co., Ltd. Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored
JP3931651B2 (ja) 2001-12-21 2007-06-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
JP2004188865A (ja) 2002-12-12 2004-07-08 Minolta Co Ltd 画像形成装置およびプログラム
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
JP2004304469A (ja) 2003-03-31 2004-10-28 Minolta Co Ltd 原稿画像の領域分割・圧縮プログラム及び領域分割・圧縮方法
US7302107B2 (en) * 2003-12-23 2007-11-27 Lexmark International, Inc. JPEG encoding for document images using pixel classification
JP4135656B2 (ja) 2004-02-20 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 画像領域判定方法、画像処理装置およびプログラム
JP2005252321A (ja) 2004-03-01 2005-09-15 Canon Inc 画像処理装置及び画像処理方法
JP4569162B2 (ja) 2004-04-30 2010-10-27 コニカミノルタビジネステクノロジーズ株式会社 画像処理方法、画像処理プログラムおよび画像処理装置
JP4089905B2 (ja) 2004-06-22 2008-05-28 株式会社リコー 画像処理装置、画像処理方法、プログラム及び情報記録媒体
US7574055B2 (en) * 2004-09-07 2009-08-11 Lexmark International, Inc. Encoding documents using pixel classification-based preprocessing and JPEG encoding
JP2006115348A (ja) 2004-10-15 2006-04-27 Ricoh Co Ltd 画像情報装置および画像印刷方法
JP4693603B2 (ja) * 2004-11-15 2011-06-01 キヤノン株式会社 画像符号化装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US7783117B2 (en) * 2005-08-12 2010-08-24 Seiko Epson Corporation Systems and methods for generating background and foreground images for document compression
JP4329764B2 (ja) * 2006-01-17 2009-09-09 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および罫線抽出プログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009266189A (ja) * 2008-04-21 2009-11-12 Sharp Corp 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
JP4729601B2 (ja) * 2008-04-21 2011-07-20 シャープ株式会社 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
US8792719B2 (en) 2011-07-29 2014-07-29 Brother Kogyo Kabushiki Kaisha Image processing device determining attributes of regions
US8830529B2 (en) 2011-07-29 2014-09-09 Brother Kogyo Kabushiki Kaisha Image processing device for accurately identifying region in image without increase in memory requirement
US8837836B2 (en) 2011-07-29 2014-09-16 Brother Kogyo Kabushiki Kaisha Image processing device identifying attribute of region included in image
US8929663B2 (en) 2011-07-29 2015-01-06 Brother Kogyo Kabushiki Kaisha Image processing device identifying region in image as one of uniform region and nonuniform region
US9064175B2 (en) 2012-11-27 2015-06-23 Kyocera Document Solutions Inc. Image processing apparatus
US9367923B2 (en) 2013-06-28 2016-06-14 Kyocera Document Solutions, Inc. Image processing apparatus with improved compression of image data of character images and background images using respective different compressing methods
JP2015041957A (ja) * 2013-08-23 2015-03-02 ブラザー工業株式会社 画像処理装置

Also Published As

Publication number Publication date
JP4135752B2 (ja) 2008-08-20
US7747089B2 (en) 2010-06-29
US20070286507A1 (en) 2007-12-13

Similar Documents

Publication Publication Date Title
JP4135752B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4329764B2 (ja) 画像処理装置および罫線抽出プログラム
JP4333708B2 (ja) 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
JP4424309B2 (ja) 画像処理装置、文字判定プログラム、および文字判定方法
JP4753638B2 (ja) 文書圧縮方法、文書を圧縮するためのシステム、及び画像処理装置
JP4861362B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US20090284801A1 (en) Image processing apparatus and image processing method
JP2010161764A (ja) 画像処理装置、画像読取装置、画像送信装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
US7133559B2 (en) Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded
JP2008099149A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5183587B2 (ja) 画像処理装置及び画像処理方法、画像処理方法を実行させるためのプログラム
JP4089736B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4442701B2 (ja) 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム
US8577132B2 (en) Electronic document generation system, electronic document generation method, and program
JP4792835B2 (ja) 画像処理装置
EP1492327A1 (en) Image processing device
JP4396710B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP5517028B2 (ja) 画像処理装置
JP5474222B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP7413751B2 (ja) 画像処理システムおよびプログラム
JP5464157B2 (ja) 画像処理装置及び画像処理プログラム
JP4412339B2 (ja) 画像形成装置および画像データの補正方法
JP2003274080A (ja) 入力画像確認システム
US20090316998A1 (en) Outlining method for properly representing curved line and straight line, and image compression method using the same

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080526

R150 Certificate of patent or registration of utility model

Ref document number: 4135752

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees