JP5312166B2 - 画像処理装置及び制御方法及びプログラム - Google Patents

画像処理装置及び制御方法及びプログラム Download PDF

Info

Publication number
JP5312166B2
JP5312166B2 JP2009097393A JP2009097393A JP5312166B2 JP 5312166 B2 JP5312166 B2 JP 5312166B2 JP 2009097393 A JP2009097393 A JP 2009097393A JP 2009097393 A JP2009097393 A JP 2009097393A JP 5312166 B2 JP5312166 B2 JP 5312166B2
Authority
JP
Japan
Prior art keywords
block
attribute
background
foreground
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009097393A
Other languages
English (en)
Other versions
JP2010251927A (ja
Inventor
暁艶 戴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009097393A priority Critical patent/JP5312166B2/ja
Priority to US12/751,714 priority patent/US8401306B2/en
Publication of JP2010251927A publication Critical patent/JP2010251927A/ja
Application granted granted Critical
Publication of JP5312166B2 publication Critical patent/JP5312166B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、画像データを制御する画像処理装置及び制御方法及びプログラムに関する。
近年、カラー原稿画像をCCDセンサ等により読み取って、デジタルプリンタで出力する複写機が普及している。複写機の概要構成の一例として図1に示す。イメージスキャン部1001から入力された画像データは、画像処理部1002にてスキャン用画像処理を施した後、記憶部1004に一時的に保持される。プリントする際に、記憶部1004に保持された画像データを画像処理部1002に送り、プリント用画像処理を施した後に、プリント部1003に送りプリントする。
具体的には、入力された画像データから文字、網点、下地等の属性データを生成する。生成された属性データはメモリに保持される。また、画像データは属性データに応じてフィルタ処理、ガンマ処理、階調処理等を適応的に施され、メモリに保持される。一旦保持された画像データは属性データをもとに適応処理を施され、プリント部から出力される。上記スキャン用画像処理及びプリント用画像処理は高画質な画像出力を実現するため、高精度な属性データの生成が重要である。また、メモリの効率活用を実現するためには、属性データ量を小さくすることが重要である。
尚、入力画像の属性データの生成方法として、従来から実空間上の画像データに基づいて行う方法が種々考案されていた。例えば、入力画像の所定数の画素からなるブロックの直交変換の周波数成分に基づいて、当該各ブロックが文字領域あるいは網点領域等のいずれであるかを判定する画像処理方式がある(特許文献1参照)。或いは、ブロックの直交変換の周波数成分に基づいて、当該各ブロック中の画素毎に文字画素あるいは網点画素等のいずれであるかを判定して、画素数がもっとも多い属性をブロックの属性にする画像処理方式がある(特許文献2参照)。また、ブロックに一定方向のエッジフィルタで処理した画素値に基づいて、当該ブロック中の画素毎に文字画素或いは網点画素等のいずれであるかを判定する画像処理方式がある(特許文献3参照)。
特開昭64−81080号公報 特開2002−262081号公報 特開2004−350240号公報 特開2002−142128号公報
しかし、上記従来技術においては次のような課題があった。特許文献1及び特許文献2に記載の方式は、所定のブロック毎に文字領域あるいは網点領域等いずれであるかを判定し、当該ブロックの属性に応じて画像処理を適用する。特許文献1に記載の方式は、所定のブロック毎に空間周波数に基づいて属性を判定するが、ブロック属性の誤判定が生じる場合は、適切な画像処理ができないため、画像品質が低下してしまう。特許文献2に記載の方式は、所定のブロックにある画素毎に属性判定し、各属性の画素数の集計でブロックの属性を判定するので、ブロックの属性判定精度が高くなる。しかし、上記の方式はいずれも所定のブロックに異なる属性の画素が混在する場合は、ブロックの属性が混在する画素のいずれか一方にされてしまうことにより、各属性部分を正確に分類して判定することができない。したがって、高画質な画像出力が不可能である。
また、特許文献3に記載の方式は、所定のブロックにある画素毎に文字画素あるいは網点画素等いずれであるかを判定し、当該画素の属性に応じて画像処理を適用する。画素単位の属性判定では、ノイズ等の影響により誤判定が生じやすい。特に、文字領域の場合は、文字のエッジ部分にある画素のみを文字属性と判定され、文字の内部にある画素を文字属性と判定されないので、画像処理の結果に劣化を起こしてしまう。また、特許文献3に記載の方式は、属性データの生成に工夫をしているが、画素毎に属性を保存する方式であるため相当量のメモリを要する。
本発明は、高画質な画像出力の実現及び、属性データ量の削減を目的とする。そのために、所定のブロックにおいて同じ属性の画素からなる場合は、ブロック単位の属性情報を保存し、所定のブロックは違う属性の画素が混在する場合は、各属性の画素の塊で属性情報を保存する。これにより、画素毎に画像処理を切り替える画像処理方法及び画像処理装置を提供することを目的とする。
上記課題を解決するために、本発明に係る画像処理装置は、以下の構成を有する。文書画像における所定数の画素よりなるブロックごとに、当該各ブロックのエッジ特徴に基づいて当該ブロックが有する属性を判定するブロック属性判定手段と、前記文書画像における所定数の画素よりなるブロックにおける前記画素それぞれの色情報を量子化するブロック色量子化手段と、前記ブロック色量子化手段により量子化された前記画素の色情報に基づいて前記ブロックに含まれる、連結した同一の色の画素を含む連結領域を抽出するブロック連結領域抽出手段と、前記ブロック属性判定手段により判定されたブロックの属性と前記ブロック色量子化手段により量子化した色情報と前記ブロック連結領域抽出手段により取得した連結領域とに基づいて、前記連結領域が前景または背景のいずれであるかを判定するブロック背景・前景判定手段と、前記ブロック属性判定手段により判定されたブロックの属性に基づき、前記ブロック背景・前景判定手段により判定されたブロックの前景として判定された連結領域の属性、及びブロックの背景として判定された連結領域の属性をそれぞれ判定するブロック背景・前景属性判定手段と、前記ブロック属性判定手段による前記ブロックの属性と前記ブロック背景・前景判定手段による連結領域の属性との情報を記録して保持するブロック背景・前景属性情報記録手段とを有する。
本発明によれば、複数の画素を含むブロックの属性判定を高精度に行うことができる。また、属性判定の高精度化に伴い、画像処理も高精度に行うことができる。また、ブロックに含まれる画素の属性情報における元画素への可逆性を有しつつ、メモリの使用量を小さくすることができる。
複写機の構成の一例を示すブロック図である。 第一の実施形態に係る画像処理装置の機能構成を示すブロック図である。 本発明を適用可能な画像処理装置の機能構成を例示するブロック図である。 第一の実施形態に係る属性判定処理のフローチャートである。 本実施形態に係る各属性のブロックのエッジ抽出及びエッジ特徴の一例を示す図である。 第一の実施形態に係るブロックの属性判定処理のフローチャートである。 第一の実施形態に係るブロックの背景・前景判定処理のフローチャートである。 第一の実施形態に係るブロックの背景・前景判定処理の結果例を示す図である。 第一の実施形態に係るブロックの背景・前景の連結領域属性判定処理を説明するための図である。 第一の実施形態に係るブロックの背景・前景の連結領域属性保存処理を説明するための図である。 第一の実施形態に係るブロックの背景・前景の連結領域属性の保存形態の例を示す図である。 第二の実施形態に係るブロックの属性判定処理のフローチャートである。 第四の実施形態に係る属性判定処理におけるフローチャートである。 第五の実施形態に係る画像処理装置の機能構成を示すブロック図である。 第五の実施形態に係る属性判定処理の概略のフローチャートである。 第五の実施形態に係るブロックの属性修正処理を説明するための図である。
以下、図面を参照して、本発明に係る画像処理装置を用いた属性判定処理について詳細に説明する。ただし、ここでの実施形態に記載されている構成要素はあくまで例示であり、本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって限定されるわけではない。
<第一の実施形態>
<装置構成>
図2は、本発明の第一の実施形態に係る画像処理装置の構成の一例を示すブロック図である。図2において、ブロック入力部101は、所定数の画素からなるブロックの画像データを入力する。例えば、紙情報に対するスキャン等の画像読み取り手段を介して入力されたモノクロまたはカラー画像が該当する。ブロック属性判定部102は、入力された画像データにおけるブロックが下地領域、網点領域、下地上文字領域、網点上文字領域のいずれであるかを判定する。ブロック色量子化部103は、ブロックの減色処理を行って代表色を求め、各画素の色をそれぞれ近い代表色に変換し、色情報を出力する。ブロック連結領域抽出部104は、ブロックに対する色量子化の結果に基づいて、同じ色で隣接した画素を纏め、連結領域を求める。ブロック背景・前景判定部105は、ブロック属性判定部102及びブロック連結領域抽出部104の出力結果であるブロックの属性及び代表色に基づいて各連結領域が前景か背景かを判定する。ブロック背景・前景属性判定部106は、ブロックの属性に基づいて背景は下地領域、網点領域のいずれであるか、もしくは、前景は下地上文字領域、網点上文字領域のいずれであるかを判定する。ブロック背景・前景属性情報記録部107は、背景と判定された連結領域には属性を、前景と判定された連結領域には属性及び連結領域の座標情報を対応付けて記録する。
図3は、本実施形態を適用可能な画像処理装置としてディジタル複合機(以下、MFP)の主要部構成を示すブロック図の一例である。尚、本実施形態では、画像処理装置として、スキャナ機能やプリンタ機能を有するMFPを用いているが、他の装置でも良い。例えば汎用のスキャナとパーソナルコンピュータとを接続したシステムを当該画像処理装置として用いてもよい。
図3に示すように、MFPは、画像処理装置の制御手段として機能するコントローラユニット2000を備えている。コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095と、デバイスI/F(インタフェース)2020を介して接続する。そして、コントローラユニット2000は、スキャナ2070で原稿画像から読み取られた画像データをプリンタ2095によって印刷出力するコピー機能を実現するための制御を行うことが可能である。また、コントローラユニット2000は、LAN1006や公衆回線(WAN)1008を介して他装置との間でパターン画像やデバイス情報等の入出力を行うための制御を行うことが可能である。
コントローラユニット2000は、図3に示すように、CPU2001を有している。CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(以下、OS)を起動する。そして、このOS上でHDD(ハードディスクドライブ)2004に格納されているアプリケーションプログラムを実行することによって各種処理を実行する。CPU2001の作業領域として、RAM2002が用いられる。RAM2002はまた、CPU2001の作業領域だけでなく、画像データを一時記憶するための画像メモリ領域も提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。
CPU2001には、システムバス2007を介して、ROM2003やRAM2002が接続している。CPU2001には、操作部I/F(インタフェース)2006、ネットワークI/F(インタフェース)2010、モデム2050及びイメージバスI/F(インタフェース)2005が接続されている。操作部I/F2006は、タッチパネルを有する操作部2012とのインタフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された情報をCPU2001に送出する。また、ネットワークI/F2010は、LAN1006に接続され、LAN1006を介してLAN1006に接続された各装置との間で情報の入出力を行う。モデム2050は、公衆回線1008に接続し、公衆回線1008を介して他装置との間で情報の入出力を行う。イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバス又はIEEE1394から構成される。画像バス2008上には、ラスタイメージプロセッサ(RIP)2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、及び画像圧縮部2040が設けられている。
RIP2060は、PDLコードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070及びプリンタ2095が接続され、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対して補正、加工、編集処理を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリンタの補正、解像度変換等を行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、二値画像データをJBIG、MMR、MH等のデータに圧縮するとともに、その伸長処理も行う。
<属性判定処理の流れ>
図4は、第一の実施形態におけるブロックの属性、そして、ブロックに含まれる各連結領域の属性判定の流れを説明するためのフローチャートである。まず、ブロック入力部101において、処理対象画像の所定数の画素からなるブロックの画像データを入力する(S401)。次に、ブロック属性判定部102において、S402〜S404の処理を行う。まず、S401で入力されたブロックからエッジを抽出する(S402)。次に抽出されたエッジからブロックのエッジ特徴を算出する(S403)。そして、算出されたエッジ特徴に基づいてブロックは下地領域、網点領域、下地上文字領域、網点上文字領域のいずれであるかを判定する(S404)。ここでのエッジ抽出は、エッジ強度を示す微分データを生成する処理で、公知のPrewittフィルタ、或いは、Sobelフィルタを利用することが可能である。エッジ特徴算出は、抽出されたエッジからエッジ強度がある所定値以上であるエッジ画素数、エッジ強度がある所定値以上のエッジ画素から繋がる連結エッジ数、各連結エッジにある連結エッジの画素数を求める処理である。各属性のブロックのエッジ抽出及びエッジ特徴の例について後述する。ブロックの属性判定は、算出されたブロックのエッジ特徴に基づいて当該ブロックが下地領域、網点領域、下地上文字領域、網点上文字領域のいずれの属性であるかを判定する。このブロックの属性判定処理の詳細については図6を用いて後述する。
次に、ブロック色量子化部103において、S401で入力されたブロックの減色処理を行い、代表色を求め、画素毎に一番色の近い代表色に量子化する(S405)。尚、この色量子化処理を実現する一例として、特許文献4に記載された方法を用いることができる。また、量子化は二値化としても良いし、複数の色を用いて多値化しても良い。次に、ブロック連結領域抽出部104において、S405にて取得した各画素の色量子化の結果に基づいて、同じ色で隣接した画素を纏め、連結領域を取得する(S406)。なお、この連結領域抽出処理は公知のラベリング処理を利用することが可能である。次に、ブロックの背景・前景判定部105において、S404で判定されたブロックの属性及び、S405で取得したブロックの代表色に基づいて、S406にて抽出した各連結領域が前景もしくは背景のいずれかであるかを判定する(S407)。このブロックの背景・前景判定処理の詳細については図7を用いて後述する。
次に、ブロック背景・前景属性判定部106において、ブロックの属性を元に背景は下地領域、網点領域のいずれであるか、もしくは、前景は下地上文字領域、網点上文字領域のいずれであるかを判定する(S408)。このブロックの背景・前景の連結領域属性判定処理の詳細については図13を用いて後述する。次に、ブロック背景・前景属性情報記録部107において、S408にて背景と判定された連結領域には属性を、前景と判定された連結領域には属性及び座標情報を記録する(S409)。このブロックの背景または、前景の連結領域属性保存処理の詳細については図13を用いて後述する。
<各属性のブロックのエッジ抽出およびエッジ特徴の例>
図5は、第一の実施形態の画像処理において各属性のブロックのエッジ抽出及びエッジ特徴の一例を示す図である。画像処理は下地、網点、下地上の文字、網点上の文字という属性に応じて処理を切り替えるので、ブロックの属性を下地、網点、下地上文字、網点上文字に分ける。図5に示す下地ブロックから抽出されたエッジはほとんどない。そのため、エッジの特徴として、下地ブロックはエッジ強度がある閾値を越えるエッジ画素の数が非常に少ない、エッジ画素に隣接する連結エッジ数が非常に少ない、各連結エッジにおけるエッジの画素数が非常に少ないということが挙げられる。
網点ブロックはモアレによるものなので、抽出されたエッジもパターンのようなものになる。そのため、エッジの特徴として、エッジ画素数が非常に多い、連結エッジ数が非常に多い、各連結エッジにおけるエッジの画素数は極端な大小を示さず中間画素値を有するということが挙げられる。下地上文字ブロックは文字周囲のエッジが取得できる。そのためエッジの特徴として、エッジ画素数が多い、連結エッジ数が少ない、各連結エッジにおけるエッジの画素数が多いということが挙げられる。網点上文字ブロックは文字周囲のエッジも取れるし、網点のパターンのエッジも取得できる。そのため、エッジの特徴として、エッジ画素数が多い、連結エッジ数が多い、各連結エッジにおけるエッジの画素数は多いものもあれば網点ブロックのように中間画素値を有するものもあるということが挙げられる。
<ブロックの属性判定処理>
ブロックの属性判定処理(S404)の詳細について、図6を参照して説明する。まず、S4041では、ブロックのエッジ特徴を入力する。そして、エッジの特徴に基づいて、S4042からS4048では、ブロックの属性を判定する。ここで、エッジ特徴を鑑みて閾値を設定する。予め設定したエッジ画素数の閾値を閾値1(第一の閾値)、連結エッジ数の閾値を閾値2(第二の閾値)、連結エッジの画素数の閾値を閾値3(第三の閾値)と定義する。S4042では、ブロックのエッジ画素数が閾値1以下であれば、S4048へ進み、ブロックを下地属性と判定する。ここで、下地ブロックはエッジ画素数が非常に少ないという特徴を利用するので、閾値1を非常に低い数値を設定する。S4048にて判定した後、S4049へ進む。S4042で、ブロックのエッジ画素数が閾値1より高ければ、ブロックは下地上文字、網点、網点上文字のいずれであるかになるので、S4043へ進み、さらに細かく条件を設定して判定する。
S4043で、連結エッジ数が閾値2より低ければ、S4047へ進み、ブロックを下地上文字と判定する。ここで、下地上文字は連結エッジ数が少ないという特徴を利用するので、閾値2を低い数値を設定する。S4047にて判定した後、S4049へ進む。S4043で、連結エッジ数が閾値2以上であれば、ブロックは網点上文字、網点ブロックのいずれであるかになるので、S4044へ進み、さらに判定する。S4044で、有する画素数が閾値3以上の連結エッジが1つ以上あれば、S4045へ進み、ブロックを網点上文字と判定する。連結エッジの画素数が閾値3以上の連結エッジがなければ、S4046へ進みブロックを網点と判定する。ここで、網点上文字は長いエッジ、即ち、エッジ画素数が多い連結エッジがあるので、閾値3を高い数値を設定する。それぞれの判定の後、S4049へ進む。そして、S4049では、ブロックの属性を出力し、本処理を終了する。なお、ここで示した閾値以上または閾値以下といった判定は閾値の設定により変動するものであり、エッジ特徴に基づいた閾値に応じて判定の整合性をとることになる。すなわち、第三の閾値以下と定義している場合においても、閾値の設定によっては第三の閾値以上と変更する場合も想定される。同様に、第二の閾値以上が”より大きい”に変更になる場合や第一の閾値以下が”より小さい”になることも想定される。
<ブロックの背景・前景判定処理>
ブロックの背景・前景判定処理(S405)の詳細について、図7を参照して説明する。まず、S4051では、ブロックの色量子化処理により取得したブロックの代表色、ブロックの連結領域抽出処理により取得したブロックの連結領域、ブロックの属性判定処理により取得したブロックの属性情報を入力する。そして、S4052からS4054では、ブロックの前景・背景を判定する。S4052では、ブロックの属性が網点あるいは下地であれば、S4053へ進み、ブロック毎に背景と判定する。そして、ブロックの代表色を背景色として取得する。その後、S4055へ進む。ブロックの属性が下地上文字あるいは網点上文字であれば、S4054へ進み、ブロックに背景と前景が混在すると判定する。そして、背景色は連続に変化するという特徴を利用し、ブロックにある各連結領域のうち、既に取得した背景色と近い色を持つ連結領域を背景とし、異なる色を有する連結領域を前景と判定する。その後、S4055へ進む。S4055では、ブロックの背景・前景判定処理の結果を出力し、本処理を終了する。
図8は、このブロックの背景・前景判定処理の結果例を説明する図である。図8に示されたように、下地ブロック、網点ブロックはブロック全体が背景になるが、下地上文字ブロック、網点上ブロックは黒い文字部分は前景と判定され、文字周囲の部分は背景と判定される。
<ブロックの背景・前景の連結領域属性判定処理>
ブロックの背景・前景の連結領域属性判定処理の詳細について、図9を参照して説明する。ここではブロックの属性を示すフラグを定義する。また、フラグの値は1を有効、0を無効とする。ブロックが下地である場合は、当該ブロック全体が背景となり、属性を下地にする。その結果、下地フラグは1、網点フラグと文字フラグは0となる。ブロックが網点である場合は、当該ブロック全体が背景となり、属性を網点にする。その結果、網点フラグは1、下地フラグと文字フラグは0となる。ブロックが下地上文字即ち、ブロックに文字画素を含み、その文字画素の周囲に下地画素があるブロックである場合は、当該ブロックの背景部分は、属性を下地にするが、前景である各連結領域は下地上文字にする。その結果、ブロック内の背景部分の下地フラグは1、網点フラグと文字フラグは0になる。また、ブロック内の前景部分である各連結領域は下地上にある文字なので、下地フラグと文字フラグは1、網点フラグは0となる。ブロックが網点上文字即ち、ブロックに文字画素を含み、その文字画素の周囲に網点画素があるブロックである場合は、当該ブロックの背景部分は、網点属性にするが、前景である各連結領域は網点上文字にする。その結果、ブロック内の背景部分の網点フラグは1、下地ブロックと文字フラグは0になる。また、ブロック内の前景部分である各連結領域は網点上にある文字なので、網点フラグと文字フラグは1、下地フラグは0となる。
以上により、ブロックに含まれる画素に下地フラグ、網点フラグ、文字フラグのうち、いずれかが有効となることにより、各画素が下地画素なのか、網点画素なのか、下地にある文字画素なのか、網点にある文字画素なのかを区別できる。また、画像処理も画素毎の属性に応じて高精度に切り替えることが可能となる。
<ブロックの背景・前景の連結領域属性保存処理>
ブロックの背景・前景の連結領域属性保存処理の詳細について、図10を参照して説明する。ブロックが下地或いは、網点である場合は、ブロックに含まれるすべての画素毎に属性を保存する必要がなく、ブロック単位の背景の属性情報を保存するだけで良い。ブロックにおいて下地上文字或いは、網点上文字のような異なる属性の画素が混在する場合、ブロック単位の背景の属性、ブロックにおける前景の属性、ブロックにおける前景の各連結領域の座標情報を保存する。前景の連結領域の座標情報は、連結領域の開始行の縦軸座標、その行にある連結部分の始点となる横軸座標、終点となる横軸座標、次行の連結部分の始点となる横軸座標、終点となる横軸座標を含む。また、画素単位の情報への可逆性を有した形態によって、以上の順で座標情報を保存する。この処理では、ブロックに同じ属性の画素の集まりである場合、即ちブロックが下地或いは、網点という属性である場合は、ブロックにあるすべての画素毎に属性を保存するのではなく、ブロック全体としての背景の属性を保存するだけで済む。これにより、保存すべき画素の属性情報は全ての画素の属性情報を保存する場合に比べ大幅に削減できる。また、ブロックに異なる属性の画素が混在する場合、即ちブロックが下地上文字、或いは網点上文字という属性である場合も同様に、ブロックにあるすべての画素毎に属性を保存するのではなく、前景にある画素の連結情報を保存することで、画素の属性情報への可逆性も有しつつ、保存すべき画素の属性情報を削減できる。
図11は、このブロックの背景及び、前景の各連結領域属性の保存例を示す図である。ここでは属性情報を下地フラグ、網点フラグ、文字フラグという順で、3bitにより表す例を示しているが、属性情報をより細分化する場合も保存の方法は同じである。図に示されたように、下地ブロックの属性値は100、網点ブロックの属性値は010、で示して属性データを保存する。下地上文字ブロックは最初に背景の属性として100、次に前景の属性として101、そして、連結領域の座標情報に対応する値の順で保存する。例えば、連結領域の座標情報の記述では、連結領域の最初の行番号として3、3行目における連結部分の始点列番号として6、同じ行の連結部分の終点列番号として8、そして、次の行(4行目)における連結部分の始点列番号として5、同じ行の連結部分の終点列番号として9、という順番で座標情報を保存する。
第一の実施形態では、文字を例として処理の流れを説明したが、本処理は文字に限らず、エッジを持つ線等も文字と同じ流れで適用が可能である。
<第二の実施形態>
先に説明した第一の実施形態では、ブロックの属性判定処理は、各ブロックのエッジ特徴に基づいて、独立的に属性を判定するものとした。本実施形態では、ブロックの属性判定において、処理対象ブロックのエッジ特徴のみならず、周囲ブロックのエッジ特徴との差異にも基づいて、属性判定する。第二の実施形態における属性判定処理の詳細について、図12を参照して説明する。ここで、第一の実施形態と同様にエッジ特徴を鑑みて閾値を設定する。予め設定したエッジ画素数の閾値を閾値1(第一の閾値)、連結エッジ数の閾値を閾値2(第二の閾値)、注目した当該ブロックの左に隣接する周囲ブロック(以下、左ブロック)のエッジ特徴との差異の閾値を閾値3(第三の閾値)と定義する。
まず、S40411では、ブロックのエッジ特徴を入力する。そして、処理対象ブロックのエッジ特徴及び周囲ブロックとのエッジ特徴の差異に基づいて、S40412からS40422では、ブロックの属性を判定する。S40412では、ブロックのエッジ画素数が閾値1以下であれば、S40422へ進みブロックの属性を下地と判定する。ここで、下地ブロックはエッジ画素数が非常に少ないという特徴を利用するので、閾値1を非常に低い数値を設定する。その後、S40423へ進む。S40412において、ブロックのエッジ画素数が閾値1より高ければ、S40413へ進む。S40413において、ブロックの連結エッジ数が閾値2以上であれば、S40420へ進み、ブロックの属性を網点と判定する。ここで、網点ブロックはエッジ画素数が多くて、連結エッジ数は非常に多いという特徴を利用するので、閾値2を非常に高い数値を設定する。その後、S40423へ進む。S40413において、連結エッジ数が閾値2より小さい場合は、S40414へ進み、ブロックを周囲ブロックのエッジ特徴との差異に基づいて、属性判定する。
閾値1、2の値は、下地や網点等の画像のサンプルにおいてエッジ数を実験的に求めることができる。例えば、下地と網点の画像それぞれについて、複数の異なる画像を用意し、エッジ数の平均及び分散等の統計値を求める。その値を基に、一定の確率で画像が下地や網点と判定できるエッジ数を閾値として設定すればよい。
S40414では、処理対象ブロックと左ブロックとのエッジ特徴の差異を求め、差異が閾値3以下であれば、S40418へ進む。差異が小さければ場合、当該ブロックと左ブロックとが同じ属性のものと想定される。そこで、S40418において、処理対象ブロックを左ブロックと同一の属性に設定する。即ち、左ブロックが下地ブロックであれば、処理対象ブロックも下地ブロックとなる。左ブロックが網点ブロックであれば、処理対象ブロックも網点ブロックとなる。左ブロックが下地上文字のブロックであれば、処理対象ブロックも下地上文字のブロックとなる。左ブロックが網点上文字のブロックであれば、処理対象ブロックも網点上文字のブロックとなる。その後、S40423へ進む。S40414において、処理対象ブロックと左ブロックとのエッジ特徴の差異が閾値3より大きければ、S40415からS40422の処理に基づいて、左ブロックの属性に応じて処理対象ブロックの属性を判定する。
S40415において、左ブロックが網点ブロックであれば、S40419へ進み、ブロックを網点上文字と判定する。その後、S40423へ進む。S40415において、左ブロックは網点ではない場合は、S40416へ進む。S40416において、左ブロックが網点上文字ブロックであれば、S40420へ進み、ブロックを網点と判定する。その後、S40423へ進む。S40416において、左ブロックが網点上文字でもない場合は、S40417へ進む。S40417において、左ブロックが下地であれば、S40421へ進み、ブロックを下地上文字ブロックと判定する。その後、S40423へ進む。S40417において、左ブロックが下地でない場合は、S40422へ進み、ブロックを下地ブロックと判定する。その後、S40423へ進む。そして、S40423では、判定したブロックの属性を出力する。
なお、本実施形態においては処理対象のブロックの左隣に隣接するブロックとの差異を用いたが、上隣のブロックを用いても構わない。また、一つの周囲ブロックを対象として扱ったが、複数の周囲ブロックを用いて、実現しても構わない。
<第三の実施形態>
先に説明した第一、第二の実施形態においては、ブロックの背景・前景判定処理は、文書画像の最初にあるブロック(処理対象画像において、一番左上のブロック)は背景部分のみが含まれるブロック(下地ブロックもしくは網点ブロック)であるとの前提で処理を行っている。本実施形態では、文書画像の最初にあるブロックに文字部分と背景部分が混在する場合(下地上文字ブロックもしくは網点上文字ブロック)は、ブロックの背景・前景判定処理は、当該ブロックに含まれる各連結領域の包含関係により判定する。すなわち、当該ブロックに文字部分と背景部分が混在する場合において、ある連結領域に囲まれた連結領域(以下、内包連結領域)に対しては、背景とみなして、内包連結領域の色を背景色にするが、内包連結領域以外の連結領域を前景として判定する。
<第四の実施形態>
第一乃至第三の実施形態では、ブロックの属性に問わず、処理画像中のすべてのブロックに対して連結領域抽出処理を行っている。本実施形態において、ブロックの連結領域抽出処理は、ブロックの属性が下地上文字、或いは網点上文字である場合のみ連結領域抽出処理を適用する。ブロックの属性が下地、或いは網点である場合は連結領域抽出処理を行わず、当該ブロックを一つの連結領域として扱う。
図13は、第四の実施形態におけるブロックの属性、及びブロックに含まれる各連結領域の属性判定の概略を説明するためのフローチャートである。まず、ブロック入力部101にて、処理対象画像における所定数の画素からなるブロックの画像データを入力する(S1301)。次に、ブロック属性判定部102にて、S1301で入力されたブロックからエッジを抽出する(S1302)。S1302にて抽出されたエッジから各ブロックのエッジ特徴を算出する(S1303)。そして、算出されたエッジ特徴に基づいてブロックの属性が下地領域、網点領域、下地上文字領域、網点上文字領域のいずれであるかを判定する(S1304)。本処理は第一の実施形態において、図6を用いて述べた処理と同様である。
ブロック属性判定部102における処理とは別にブロック色量子化部103において、S1301で入力されたブロックの減色処理を行い、代表色を求め、画素毎に一番色の近い代表色へ量子化する(S1305)。ブロック属性判定部102及びブロック色量子化部103での処理の後、ブロック連結領域抽出部104において、S1304にて取得したブロックの属性とS1305にて取得した各画素の色量子化の結果とに基づき、ブロックの主要色は1色、もしくは、ブロックの属性が下地または網点であるかの判定を行う(S1306)。ここでの主要色とは色量子化によって取得した代表色のうち、配色上重要な色を指す。S1306の条件に合致する場合、当該ブロックは背景ブロックであると考えられるため、ブロック毎に一つの連結領域にする(S1307)。ブロックの属性は下地或いは網点以外であれば、ブロックに対し同じ色で連結する画素で構成される連結領域を取得する(S1309)。
S1306の条件に合致し、S1307にて連結領域を取得した場合には、ブロックの背景・前景判定部105において、S1307で取得したブロックの連結領域を背景に設定する。S1306の条件に合致せず、S1309にて連結領域を抽出した場合には、S1309で取得した各ブロックの連結領域及びS1304で判定した属性情報に基づいて前景と背景を判定する(S1310)。本処理は第一の実施形態において、図7を用いて述べた処理と同様である。ブロック背景・前景属性判定部106において、ブロックに背景のみを含む場合(S1307の処理を行った場合)は、背景が下地、網点のいずれであるかを判定し、属性を決定する(S1308)。ブロックに前景と背景を含む場合(S1310の処理を行った場合)は、背景は下地、網点のいずれであるか、及び前景は下地上文字、網点上文字のいずれであるかを判定する(S1311)。次に、ブロック背景・前景属性情報記録部107において、背景と判定された連結領域には属性を、前景と判定された連結領域には属性及びブロックにおける座標情報を記録する(S1312)。
<第五の実施形態>
第一乃至第四の実施形態では、ブロックの属性は処理対象ブロックのエッジ特徴、もしくは周囲ブロックのエッジ特徴との差異に基づいて判定するものとした。本実施形態では、ブロックの属性判定の後、ブロックの色量子化の結果に基づいてブロックの属性修正を加える。
図14は、第五の実施形態に係る属性判定機能を有する画像処理装置の構成を示すブロック図である。図14において、ブロック入力部111は、所定数の画素からなるブロックの画像データを入力する。例えば、紙情報に対するスキャン等の画像読み取り手段を介して入力されたモノクロまたはカラー画像が該当する。ブロック属性判定部112は、入力された画像データにおける当該ブロックが下地領域、網点領域、下地上文字領域、網点上文字領域のいずれであるかを判定する。ブロック色量子化部113は、ブロックの減色処理を行い、代表色を求め、各画素の色をそれぞれ近い代表色に変換する。ブロック属性修正部114は、ブロック属性判定部112及びブロック色量子化部113の結果に基づいて、ブロックの属性を修正する。
ブロック連結領域抽出部115は、ブロックの色量子化の結果に基づいて、同じ色で隣接した画素を纏め、連結領域を求める。ブロック背景・前景判定部116は、ブロック属性修正部114及びブロック連結領域抽出部115の出力結果であるブロックの属性及び代表色に基づいて、各連結領域が前景か背景かを判定する。ブロック背景・前景属性判定部117は、ブロックの属性に基づいて背景は下地領域、網点領域のいずれであるか、もしくは前景は下地上文字領域、網点上文字領域のいずれであるかを判定する。その後、ブロック背景・前景属性情報記録部118は、背景と判定された連結領域に属性を、前景と判定された連結領域に属性及び連結領域の座標情報を記録する。
<処理の流れ>
図15は、第五の実施形態に係るブロックの属性、及びブロックに含まれる各連結領域の属性判定の流れを説明するためのフローチャートである。
まず、ブロック入力部111にて、処理対象画像における所定数の画素からなるブロックの画像データを入力する(S1501)。次に、ブロック属性判定部112において、S1501で入力されたブロックからエッジを抽出する(S1502)。続いて、抽出されたエッジからブロックのエッジ特徴を算出する(S1503)。そして、算出されたエッジ特徴に基づいてブロックの属性が下地領域、網点領域、下地上文字領域、網点上文字領域のいずれであるかを判定する(S1504)。本処理は第一の実施形態において、図6を用いて述べた処理と同様である。ブロック属性判定部112における処理とは別に、ブロック色量子化部113において、S1501で入力されたブロックの減色処理を行い、代表色を求め、画素毎に一番色の近い代表色へ量子化する(S1505)。
次に、ブロック属性修正部114において、S1504で判定されたブロックの属性とS1505で求めたブロックの色量子化の結果に基づいて、ブロックの属性を修正する(S1506)。このブロックの属性修正処理については次の項目において詳しく述べる。S1506の処理とは別にブロック連結領域抽出部115において、S1505にて取得した各画素の色量子化の結果に基づいて、同じ色で連結する画素で構成された連結領域を取得する(S1507)。続いて、ブロックの背景・前景判定部116において、S1506にて取得したブロックの属性情報及びS1507にて取得したブロックの連結領域に基づいて前景部分と背景部分とを判定する(S1508)。本処理は第一の実施形態において、図7を用いて述べた処理と同様である。次に、ブロック背景・前景属性判定部117において、ブロックの背景は下地領域、網点領域のいずれであるか、そして、前景は下地上文字領域、網点上文字領域のいずれであるかを判定する(S1509)。本処理は第一の実施形態において、図12を用いて述べた処理と同様である。次に、ブロック背景・前景属性情報記録部118において、背景に属性、前景に属性及び連結領域の座標情報を記録する(S1510)。本処理は第一の実施形態において、図13を用いて述べた処理と同様である。
<ブロックの属性修正処理>
ブロックの属性修正処理(S1506)の詳細について、図16を参照して説明する。S1505におけるブロックの色量子化の結果により、主要色数が1である場合は、当該ブロックは背景部分のみを含むブロックである。よって、S1504におけるブロックの属性判定において下地上文字、あるいは網点上文字と判定されている場合、ブロックの属性をそれぞれ下地、網点に修正する。S1505におけるブロックの色量子化の結果により、で主要色数が2以上である場合は、当該ブロックは背景部分と前景部分とを含むブロックである。よって、ブロックの属性判定において下地、あるいは、網点と判定されている場合、ブロックの属性をそれぞれ下地上文字、網点上文字に修正する。このように、ブロックの色量子化の結果に基づいてブロックの属性を修正することで、ブロックの属性をより正確に判定することが可能である。
以上説明したように本実施形態によれば、ブロックに異なる属性の画素が混在する場合でも、ブロックの属性及び画素の属性を精度良く判定することが可能になる。また、それにより、画素毎の属性に応じて切り替える画像処理の精度は高まり、高画質の実現が可能になる。また、ブロックにある画素毎の属性を保存するではなく、画素の連結領域毎に画素の属性情報への可逆性を保持したままデータを保存するため、属性情報量の削減も可能になる。
<その他の実施形態>
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムをコンピュータ(またはCPUやMPU)が読出し実行することによっても、達成される。この場合、プログラムは図示したフローの手順を実現するためのものを含む。

Claims (13)

  1. 文書画像における所定数の画素よりなるブロックごとに、当該各ブロックのエッジ特徴に基づいて当該ブロックが有する属性を判定するブロック属性判定手段と、
    前記文書画像における所定数の画素よりなるブロックにおける前記画素それぞれの色情報を量子化するブロック色量子化手段と、
    前記ブロック色量子化手段により量子化された前記画素の色情報に基づいて前記ブロックに含まれる、連結した同一の色の画素を含む連結領域を抽出するブロック連結領域抽出手段と、
    前記ブロック属性判定手段により判定されたブロックの属性と前記ブロック色量子化手段により量子化した色情報と前記ブロック連結領域抽出手段により取得した連結領域とに基づいて、前記連結領域が前景または背景のいずれであるかを判定するブロック背景・前景判定手段と、
    前記ブロック属性判定手段により判定されたブロックの属性に基づき、前記ブロック背景・前景判定手段により判定されたブロックの前景として判定された連結領域の属性、及びブロックの背景として判定された連結領域の属性をそれぞれ判定するブロック背景・前景属性判定手段と、
    前記ブロック属性判定手段による前記ブロックの属性と前記ブロック背景・前景判定手段による連結領域の属性との情報を記録して保持するブロック背景・前景属性情報記録手段と
    を有することを特徴とする画像処理装置。
  2. 前記エッジ特徴は、前記ブロックに含まれるエッジ画素数とエッジ画素から構成される連結エッジ数とエッジ画素から構成される連結領域に含まれるエッジ画素数であることを特徴とする請求項1に記載の画像処理装置。
  3. 前記ブロックの属性は、前記ブロックが網点画素から構成される網点ブロック、または下地画素から構成される下地ブロック、または下地画素と文字画素から構成される下地上文字ブロック、または網点画素と文字画素から構成される網点上文字ブロックのいずれかであることを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記ブロック属性判定手段は、
    前記ブロックに含まれるエッジ画素数に対する第一の閾値と、
    前記ブロックに含まれる連結エッジ数に対する第二の閾値と、
    前記ブロックに含まれる連結エッジが有する画素数に対する第三の閾値とを有し、
    前記ブロックに含まれるエッジ画素数が第一の閾値以下の場合、下地と判定し、
    前記ブロックに含まれるエッジ画素数が前記第一の閾値より小さく、且つ、連結エッジ数が前記第二の閾値より小さい場合、下地上文字と判定し、
    前記ブロックに含まれるエッジ画素数が前記第一の閾値より小さく、且つ、連結エッジ数が前記第二の閾値以上、且つ、前記連結エッジが有する画素数において前記第三の閾値以上の連結エッジがない場合、網点と判定し、
    前記ブロックに含まれるエッジ画素数が前記第一の閾値より小さく、且つ、連結エッジ数が前記第二の閾値以上、且つ、前記連結エッジが有する画素数において前記第三の閾値以上の連結エッジがある場合、網点上文字と判定する
    ことを特徴とする請求項3に記載の画像処理装置。
  5. 前記ブロック属性判定手段は、
    前記ブロックに含まれるエッジ画素数に対する第一の閾値と、
    前記ブロックに含まれる連結エッジ数に対する第二の閾値と、
    前記ブロックと隣接する周囲ブロックとのエッジ特徴の差異に対する第三の閾値とを有し、
    前記ブロックに含まれるエッジ画素数が前記第一の閾値以下の場合、下地と判定し、
    前記ブロックに含まれるエッジ画素数が前記第一の閾値より大きく、且つ、連結エッジ数が前記第二の閾値以上の場合、網点ブロックと判定し、
    前記ブロックに含まれるエッジ画素数が前記第一の閾値より大きく、且つ、連結エッジ数が前記第二の閾値より小さい場合、前記ブロックのエッジ特徴と前記周囲ブロックのエッジ特徴との差異を求め、前記差異が前記第三の閾値以下である場合に、前記ブロックの属性を前記周囲ブロックの属性と同一にし、
    前記ブロックに含まれるエッジ画素数が前記第一の閾値より大きく、且つ、連結エッジ数が前記第二の閾値より小さく、且つ、前記差異が前記第三の閾値より大きい場合において、前記周囲ブロックの属性が網点の場合、前記ブロックの属性を網点上文字と判定し、
    前記ブロックに含まれるエッジ画素数が前記第一の閾値より大きく、且つ、連結エッジ数が前記第二の閾値より小さく、且つ、前記差異が前記第三の閾値以上である場合において、前記周囲ブロックの属性が網点上文字の場合、前記ブロックの属性を網点と判定し、
    前記ブロックに含まれるエッジ画素数が前記第一の閾値より大きく、且つ、連結エッジ数が前記第二の閾値より小さく、且つ、前記差異が前記第三の閾値以上である場合において、前記周囲ブロックの属性が下地の場合、前記ブロックの属性を下地上文字と判定し、
    前記ブロックに含まれるエッジ画素数が前記第一の閾値より大きく、且つ、連結エッジ数が前記第二の閾値より小さく、且つ、前記差異が前記第三の閾値以上である場合において、前記周囲ブロックの属性が下地上文字の場合、前記ブロックの属性を下地と判定する
    ことを特徴とする請求項3に記載の画像処理装置。
  6. 前記周囲ブロックは、処理対象ブロックの左隣に隣接するブロック、或いは、上隣に隣接するブロックであることを特徴とする請求項5に記載の画像処理装置。
  7. 前記ブロック色量子化手段は、前記ブロックにおける画素を二値化、あるいは、多値化の減色処理をすることを特徴とする請求項1乃至6のいずれか一項に記載の画像処理装置。
  8. 前記ブロック背景・前景判定手段は、
    前記ブロック属性判定手段により前記属性が下地、または網点と判定されたブロックが有する色を背景色として取得し、
    前記属性が下地上文字、または網点上文字と判定されたブロックに含まれる前記連結領域が有する色が前記背景色と異なる色の場合に、前記連結領域を前景と判定する
    ことを特徴とする請求項1乃至7のいずれか一項に記載の画像処理装置。
  9. 前記ブロック背景・前景属性判定手段は、
    前記ブロック属性判定手段により判定されたブロック属性及び前記ブロック背景・前景判定手段により判定された前記連結領域の結果に基づいて、
    前記ブロックの属性が網点、或いは網点上文字であれば、前記ブロックの背景を網点と判定し、
    前記ブロックの属性が下地、或いは下地上文字であれば、前記ブロックの背景を下地と判定し、
    前記ブロックの属性が下地上文字であれば、前記ブロックの前景として判定された連結領域を下地上文字と判定し、
    前記ブロックの属性が網点上文字であれば、前記ブロックの前景として判定された連結領域を網点上文字と判定する
    ことを特徴とする請求項1乃至8のいずれか一項に記載の画像処理装置。
  10. 前記ブロック属性判定手段は、前記エッジ特徴と前記ブロック色量子化手段により取得した前記色情報とに基づいて前記ブロックの属性を補正するブロック属性修正手段を更に有することを特徴とする請求項1乃至9のいずれか一項に記載の画像処理装置。
  11. 前記ブロック属性修正手段は、
    前記ブロックが有する色量子化の主要色数が1で、且つ、前記ブロックの属性が下地上文字の場合、前記ブロックの属性を下地に修正し、
    前記ブロックが有する色量子化の主要色数が1で、且つ、前記ブロックの属性が網点上文字の場合、前記ブロックの属性を網点に修正する
    ことを特徴とする請求項10に記載の画像処理装置。
  12. 画像処理装置のブロック属性判定手段が、文書画像における所定数の画素よりなるブロックごとに、当該ブロックのエッジ特徴に基づいて当該ブロックが有する属性を判定するブロック属性判定工程と、
    前記画像処理装置のブロック色量子化手段が、前記文書画像における所定数の画素よりなるブロックにおける前記画素それぞれの色情報を量子化するブロック色量子化工程と、
    前記画像処理装置のブロック連結領域抽出手段が、前記ブロック色量子化工程により量子化された前記画素の色情報に基づいて前記ブロックに含まれる、連結した同一の色の画素を含む連結領域を抽出するブロック連結領域抽出工程と、
    前記画像処理装置のブロック背景・前景判定手段が、前記ブロック属性判定工程により判定されたブロックの属性と前記ブロック色量子化工程により量子化した色情報と前記ブロック連結領域抽出工程により取得した連結領域とに基づいて、前記連結領域が前景または背景のいずれであるかを判定するブロック背景・前景判定工程と、
    前記画像処理装置のブロック背景・前景属性判定手段が、前記ブロック属性判定工程により判定されたブロックの属性に基づき、前記ブロック背景・前景判定工程により判定されたブロックの前景として判定された連結領域の属性、及びブロックの背景として判定された連結領域の属性をそれぞれ判定するブロック背景・前景属性判定工程と、
    前記画像処理装置のブロック背景・前景属性情報記録手段が、前記ブロック属性判定工程による前記ブロックの属性と前記ブロック背景・前景判定工程による連結領域の属性との情報を記録して保持するブロック背景・前景属性情報記録工程と
    を有することを特徴とする制御方法。
  13. コンピュータを、
    文書画像における所定数の画素よりなるブロックごとに、当該ブロックのエッジ特徴に基づいて当該ブロックが有する属性を判定するブロック属性判定手段と、
    前記文書画像における所定数の画素よりなるブロックにおける前記画素それぞれの色情報を量子化するブロック色量子化手段と、
    前記ブロック色量子化手段により量子化された前記画素の色情報に基づいて前記ブロックに含まれる、連結した同一の色の画素を含む連結領域を抽出するブロック連結領域抽出手段と、
    前記ブロック属性判定手段により判定されたブロックの属性と前記ブロック色量子化手段により量子化した色情報と前記ブロック連結領域抽出手段により取得した連結領域とに基づいて、前記連結領域が前景または背景のいずれであるかを判定するブロック背景・前景判定手段と、
    前記ブロック属性判定手段により判定されたブロックの属性に基づき、前記ブロック背景・前景判定手段により判定されたブロックの前景として判定された連結領域の属性、及びブロックの背景として判定された連結領域の属性をそれぞれ判定するブロック背景・前景属性判定手段と、
    前記ブロック属性判定手段による前記ブロックの属性と前記ブロック背景・前景判定手段による連結領域の属性との情報を記録して保持するブロック背景・前景属性情報記録手段と
    して機能させるためのプログラム。
JP2009097393A 2009-04-13 2009-04-13 画像処理装置及び制御方法及びプログラム Expired - Fee Related JP5312166B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009097393A JP5312166B2 (ja) 2009-04-13 2009-04-13 画像処理装置及び制御方法及びプログラム
US12/751,714 US8401306B2 (en) 2009-04-13 2010-03-31 Image processing apparatus and control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009097393A JP5312166B2 (ja) 2009-04-13 2009-04-13 画像処理装置及び制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2010251927A JP2010251927A (ja) 2010-11-04
JP5312166B2 true JP5312166B2 (ja) 2013-10-09

Family

ID=42934445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009097393A Expired - Fee Related JP5312166B2 (ja) 2009-04-13 2009-04-13 画像処理装置及び制御方法及びプログラム

Country Status (2)

Country Link
US (1) US8401306B2 (ja)
JP (1) JP5312166B2 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5455038B2 (ja) * 2009-12-28 2014-03-26 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP5500996B2 (ja) * 2010-01-06 2014-05-21 キヤノン株式会社 画像処理装置及び画像処理方法
JP5645612B2 (ja) * 2010-11-09 2014-12-24 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP5796392B2 (ja) 2011-07-29 2015-10-21 ブラザー工業株式会社 画像処理装置、および、コンピュータプラグラム
JP5776419B2 (ja) 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5842441B2 (ja) * 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
JP5853470B2 (ja) * 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
TWI462576B (zh) * 2011-11-25 2014-11-21 Novatek Microelectronics Corp 固定圖案的邊緣偵測方法與電路
JP5962083B2 (ja) * 2012-03-14 2016-08-03 オムロン株式会社 領域抽出結果の表示方法及び画像処理装置
JP5974589B2 (ja) * 2012-03-30 2016-08-23 ブラザー工業株式会社 画像処理装置およびプログラム
JP5983858B2 (ja) * 2013-03-08 2016-09-06 株式会社島津製作所 分析対象領域設定装置
US9269126B2 (en) * 2013-07-24 2016-02-23 Georgetown University System and method for enhancing the legibility of images
US9525802B2 (en) 2013-07-24 2016-12-20 Georgetown University Enhancing the legibility of images using monochromatic light sources
AU2013248213A1 (en) 2013-10-24 2015-05-14 Canon Kabushiki Kaisha Method, apparatus and system for generating an attribute map for processing an image
US9715735B2 (en) * 2014-01-30 2017-07-25 Flipboard, Inc. Identifying regions of free space within an image
JP6489761B2 (ja) * 2014-05-14 2019-03-27 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
JP2017108309A (ja) * 2015-12-10 2017-06-15 オリンパス株式会社 撮像装置および撮像方法
JP6896413B2 (ja) * 2016-12-16 2021-06-30 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4742551A (en) * 1985-10-07 1988-05-03 Fairchild Camera & Instrument Corporation Multistatistics gatherer
JP2621879B2 (ja) 1987-09-24 1997-06-18 キヤノン株式会社 画像処理方法
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP4057662B2 (ja) * 1996-01-30 2008-03-05 富士ゼロックス株式会社 画像処理装置および画像処理方法
US6873436B1 (en) 2000-09-05 2005-03-29 Fuji Xerox Co., Ltd. Image processing device and recording medium
JP2002262081A (ja) 2001-03-06 2002-09-13 Matsushita Electric Ind Co Ltd 画像処理装置と画像処理方法
US7013439B2 (en) * 2002-01-31 2006-03-14 Juan Andres Torres Robles Contrast based resolution enhancing technology
JP4105539B2 (ja) * 2002-12-27 2008-06-25 シャープ株式会社 画像処理装置およびそれを備えた画像形成装置ならびに画像処理方法、画像処理プログラムおよび記録媒体
EP1616275A1 (en) * 2003-04-14 2006-01-18 Koninklijke Philips Electronics N.V. Method and apparatus for summarizing a music video using content analysis
JP2004350240A (ja) 2003-05-26 2004-12-09 Canon Inc 画像処理装置及び画像処理方法
JP3806704B2 (ja) * 2003-06-30 2006-08-09 京セラミタ株式会社 画像処理装置
JP4446797B2 (ja) * 2004-05-24 2010-04-07 株式会社リコー 文書復元装置、文書復元方法、文書復元プログラムおよび記録媒体
US7809197B2 (en) * 2004-12-09 2010-10-05 Eastman Kodak Company Method for automatically determining the acceptability of a digital image
US7783117B2 (en) * 2005-08-12 2010-08-24 Seiko Epson Corporation Systems and methods for generating background and foreground images for document compression
JP4305431B2 (ja) * 2005-09-06 2009-07-29 ソニー株式会社 画像処理装置、マスク作成方法及びプログラム
CN100517374C (zh) * 2005-12-29 2009-07-22 佳能株式会社 从复杂背景文档图像提取文本的装置、方法
US7911538B2 (en) * 2006-04-06 2011-03-22 Samsung Electronics Co., Ltd. Estimation of block artifact strength based on edge statistics
JP4829835B2 (ja) * 2006-06-12 2011-12-07 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記憶媒体
US8170280B2 (en) * 2007-12-03 2012-05-01 Digital Smiths, Inc. Integrated systems and methods for video-based object modeling, recognition, and tracking
US8532374B2 (en) * 2007-12-05 2013-09-10 Canon Kabushiki Kaisha Colour document layout analysis with multi-level decomposition
JP5049921B2 (ja) * 2008-08-26 2012-10-17 キヤノン株式会社 画像処理装置及び画像処理方法

Also Published As

Publication number Publication date
JP2010251927A (ja) 2010-11-04
US20100260417A1 (en) 2010-10-14
US8401306B2 (en) 2013-03-19

Similar Documents

Publication Publication Date Title
JP5312166B2 (ja) 画像処理装置及び制御方法及びプログラム
JP5875637B2 (ja) 画像処理装置、画像処理方法
JP5132530B2 (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
JP4333708B2 (ja) 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
JP5132517B2 (ja) 画像処理装置および画像処理方法
JP4586891B2 (ja) 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム
US8384964B2 (en) Image processing apparatus and image processing method
JP4498233B2 (ja) 画像処理装置および画像処理方法
JP2006319682A (ja) 画像処理装置、画像処理方法、及びコンピュータ読み取り可能な記録媒体
US11818319B2 (en) Information processing apparatus, image processing method, and medium
US8620081B2 (en) Image processing apparatus, method, and storage medium for determining attributes
JP6362632B2 (ja) 画像処理装置、画像処理方法
US8768051B2 (en) Image processing method, image processing apparatus, and computer-readable medium
JP6923037B2 (ja) 画像処理装置、画像処理方法およびプログラム
US8971647B2 (en) Image compression apparatus, image compression method, and storage medium
JP2011193394A (ja) 画像処理装置、画像処理方法、及びプログラム
US8274515B2 (en) Vector image generation method, image processing apparatus, and computer-readable storage medium for computer program
US10931852B2 (en) Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region
JP2012231261A (ja) 画像処理装置およびその制御方法
JP3927543B2 (ja) インテリジェント・ダブル・ドッティングを使用するバイレベル・プリンタ上で2ビット/ペル印刷をシミュレートするための方法及び装置
US20100188670A1 (en) Image processing apparatus, image processing method and program executing the image processing method
JP2010218106A (ja) 画像処理装置、画像処理方法及びプログラム
JP2010118919A (ja) 画像処理システム
JP4089481B2 (ja) 画像処理装置
JP2023111408A (ja) 画像処理装置及びその制御方法とプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120411

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130702

R151 Written notification of patent or utility model registration

Ref document number: 5312166

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees