JP4266030B2 - デジタル画像の領域を検知する方法およびシステム - Google Patents

デジタル画像の領域を検知する方法およびシステム Download PDF

Info

Publication number
JP4266030B2
JP4266030B2 JP2007044490A JP2007044490A JP4266030B2 JP 4266030 B2 JP4266030 B2 JP 4266030B2 JP 2007044490 A JP2007044490 A JP 2007044490A JP 2007044490 A JP2007044490 A JP 2007044490A JP 4266030 B2 JP4266030 B2 JP 4266030B2
Authority
JP
Japan
Prior art keywords
pixel
photographic
region
area
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007044490A
Other languages
English (en)
Other versions
JP2007235953A (ja
Inventor
ジョン キャンベル リチャード
マフィット ファーマン アーメット
豊久 松田
シャオーシェン チェン ローレンス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/367,244 external-priority patent/US7889932B2/en
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2007235953A publication Critical patent/JP2007235953A/ja
Application granted granted Critical
Publication of JP4266030B2 publication Critical patent/JP4266030B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、デジタル画像の領域を検知する方法およびシステムに関するものである。
デジタル画像の内容は、当該デジタル画像の圧縮に対して、圧縮率及び圧縮による副作用(compression artifacts)の点で大きな影響を与えるものである。画像の写真領域は、文字領域用に設計された圧縮アルゴリズムを用いて圧縮された場合、効率的に圧縮されない。同様に、文字画像は、写真領域用に設計され最適化された圧縮アルゴリズムを用いて圧縮された場合、効率的に圧縮されない。画像の特定の種別用に設計された圧縮アルゴリズムを他の種別の画像に用いた場合、圧縮率に悪影響があるだけでなく、伸張後の画像に圧縮による副作用が視認可能な状態で表れることがある。
さらに、文字をくっきりさせるために設計された画像強調アルゴリズムを写真画像に適用した場合、写真画像の中に、視認を悪化させるような作用を生じさせることもある。特に、はっきりとしたエッジを含む写真領域に悪影響がある。スムージング処理は、自然画像を強調するものであり、文字領域に対して行われることはほとんどないない。
デジタル画像において特定の種別の領域を検知し、当該特定の種別の領域に適した圧縮アルゴリズムや画像強調アルゴリズムを適宜組み合わせて用いることにより、圧縮率の改善、圧縮による副作用の低減、画像品質の向上を図ることができる。
画像データの内容に基づいた画像領域の意味ラベリング(a semantic labeling)は、ドキュメント管理システムや画像データベースにおいても役に立つ。
デジタル画像において、写真領域および他の領域を確実かつ効率的に検知できることが望まれている。
特許文献1には、処理対象画像のエントロピーを求め、これに基づいて処理対象画像の種類を識別する技術が開示されている。詳細には、入力画像を2値化し、2値画像に対してラベリング処理(矩形化処理)を行う。サイズが所定の大きさよりも大きい矩形領域について、各矩形領域ごとにエントロピーを算出し、各矩形領域が写真領域であるか図形領域であるかを判定する。
また、特許文献2には、画像データから得られた階調数についてのヒストグラムのエントロピーを求め、当該エントロピーの値に基づいて自然画像であるかテキスト画像であるかを識別する技術が開示されている。
特開2004−110606(2004年4月8日公開) 特開2003−123072(2003年4月25日公開)
しかしながら、特許文献1に記載された構成では、ラベリング処理および矩形領域のサイズの判定を行った後に矩形領域のエントロピーを求めている。そのため、ラベリング処理や矩形領域のサイズの判定に誤りが生じた場合に、エントロピーによる領域の種類の判定精度が低下する。
また、画像全体に対するラベリング処理を行った後にエントロピーを求めているため、画像データ全体がなければ処理を開始することができない。そのため、スキャン等で画像データを順次読み込む場合、処理時間が長くなってしまう。
また、特許文献2に記載された構成は、ワープロソフトが表計算などのソフトウェアで作成されたデジタル画像データ、あるいは、デジタルカメラやDVDなどのデジタル画像データの全体についてエントロピーを求めている。しかしながら、スキャナ等で読み込んだ画像では、スキャナの光学上の特性によりテキストのエッジ部分が鈍り、テキストであってもエントロピーが大きくなることにより、写真領域とテキスト領域との識別が困難になるという問題が生じる。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、スキャナ等で読み込んだ画像データであっても、効率的かつ精度よく領域の種別を検知することが可能なデジタル画像の領域検知方法およびシステムを実現することにある。
本発明に係る方法は、上記の課題を解決するために、デジタル画像の写真領域を検知する方法であって、a)デジタル画像の複数の画素の各々について、所定のマスキング条件に基づいてエントロピー量を計算する第1ステップと、b)上記エントロピー量に基づいて、上記複数の画素毎に信頼度レベルを決定する第2ステップと、c)上記エントロピー量に基づいて、上記複数の画素のシード領域画素からなるシード領域を決定する第3ステップと、d)上記信頼度レベルに基づいて上記シード領域を成長させ、上記複数の画素のうちの写真領域画素からなる写真領域を生成する第4ステップと、を含むことを特徴とする。
また、本発明に係るシステムは、デジタル画像の写真領域を検知するシステムであって、a)デジタル画像の複数の画素の各々について、所定のマスキング条件に基づいてエントロピー量を計算する計算処理部と、b)上記エントロピー量に基づいて、上記複数の画素毎に信頼度レベルを決定する第1決定処理部と、c)上記エントロピー量に基づいて、上記複数の画素のうちのシード領域画素からなるシード領域を決定する第3決定処理部と、d)上記信頼度レベルに基づいて上記シード領域を成長させ、上記複数の画素のうちの写真領域画素からなる写真領域を生成する領域成長処理部と、を備えることを特徴とする。
ここで、「マスキング条件」とは、各画素に対する1以上の画像条件であり、予め設定されているものである。例えば、マスキング条件には、エッジ強度が含まれている。具体的には、エッジ強度が所定範囲内である、等の条件である。
また、「信頼度レベル」とは、画素が写真領域である信頼性を示すレベルである。一般に、エントロピー量が高いほど写真領域である確率が高くなる。そこで、例えば、エントロピー量の値の大きさに応じて信頼度レベルが決定される。
また、「シード領域画素」とは、写真領域としての信頼度が一定レベル以上である画素のことである。エントロピー量が高いほど写真領域である信頼性が高くなる。そこで、例えば、エントロピー量の高い方から10%の画素がシード領域画素として決定される。
上記構成によれば、デジタル画像の複数の画素の各々について、マスキング条件に基づいて、エントロピー量を計算する。そして、当該エントロピー量に基づいて、信頼度レベルおよびシード領域が決定される。そして、信頼度レベルに基づいてシード領域を成長させ、写真領域を生成する。これにより、デジタル画像の中の写真領域を検出することができる。
まず最初にデジタル画像に対してマスキング条件によりマスク画素と、それ以外(非マスク画素)とに識別される。その後、マスク画素の寄与が非マスク画素の寄与よりも小さくなるようにして、デジタル画像のエントロピー量を計算し、当該エントロピー量に基づいて、デジタル画像の近傍画素、つまり、注目画素を中心とする所定のサイズのブロックの種別(例えば、写真領域など)が分類される。
画像データによっては、エントロピーによる領域分類を行う際に、当該分類を誤らせる要因となる画素(誤判定の要因となる画素)が含まれる場合がある。例えば、上述したように、スキャナ等で読み込んだ画像では、スキャナの光学上の特性により文字のエッジ部分が鈍り、文字であってもエントロピーが大きくなることにより、写真領域と文字領域との識別が困難になる。
そこで、このような誤判定の要因となる画素が満たす条件を上記マスキング条件として設定することにより、当該画素の寄与をなくした状態でエントロピー量を計算することができる。その結果、デジタル画像の写真領域の検出を精度よく行うことができる。
当該誤判定の要因となる画素が満たす条件は、予め様々な解析により求められている。例えば、上記のように、文字のエッジ部分が鈍り、文字であってもエントロピーが大きくなることにより、写真領域と文字領域との識別が困難になるような場合には、マスキング条件にエッジ強度を含めればよい。これにより、誤判定の要因となるエッジ強度の高い文字領域の寄与を低くした状態でエントロピー量が計算される。その結果、写真領域の検知を精度よく行うことができる。
また、マスキング条件を満たすか否かの判定は、スキャンされた画像データから順次行うことができる。その結果、処理を効率的に実行することができる。
また、デジタル画像の近傍画素、つまり、注目画素を中心とする所定のサイズのブロックごとに分類を行うことにより、スキャンされた画像データから順次処理を行うことができる。その結果、処理を効率的に実行することができる。なお、ブロックには、注目画素のみを含む場合と、注目画素とその周辺画素とを含む場合とがある。
なお、上記マスク画素の寄与が上記マスキング条件によって識別されない画素の寄与よりも小さくなるようにしてエントロピー量を計算する際、上記マスク画素を除外して上記エントロピー量を計算してもよい。これにより、マスク画素の影響を完全に排除した状態で領域の分類を行うことができる。
また、上記マスキング条件には、信頼度が含まれていてもよい。ここで、信頼度とは、マスキング条件を満たすレベル(程度)を示すものである。上述したように、マスキング条件は、誤判定の要因となる画素が満たす条件が設定される。しかしながら、誤判定の要因となる画素と、そうでない画素とを完全に分離可能がマスキング条件を設定することは困難である。そのため、ある画素が当該マスキング条件を満たしたとしても、当該画素が誤判定の要因となる画素である確率は100%ではない。そこで、上記信頼度を用いる。信頼度は、マスキング条件を満たすものの、誤判定の要因となる画素であるかどうかの信頼性を示すものであるともいえる。
そして、上記マスク画素の寄与の程度は、上記信頼度に基づいている。例えば、信頼度の高い画素については、エントロピーに対する寄与を低くし、信頼度の高い画素については、エントロピーに対する寄与を高くする。その結果、エントロピー量による領域の検知の精度を一層高くすることができる。
さらに、本発明の方法は、上記の構成に加えて、上記写真領域を補正し、補正写真領域を生成する第5ステップを含んでいてもよい。また、本発明のシステムは、上記の構成に加えて、写真領域を補正し、補正写真領域を生成する補正処理部を備えていてもよい。
ここで、「補正」とは、例えば、領域成長によって生成された写真領域の内部の穴を埋める、あるいは、写真領域の形状を矩形等の形状に補正することを言う。
上記の構成によれば、写真領域が補正されるので、より精度良く写真領域を検出することができる。当該補正としては、例えば、上記写真領域の内部の穴および凹状の矩形領域のうち少なくとも1つを写真領域として補正することが挙げられる。
さらに、本発明の方法は、上記の構成に加えて、上記写真領域を検証し、検証された写真領域を生成する第6ステップを含んでいてもよい。また、本発明のシステムは、上記の構成に加えて、上記写真領域を検証し、検証された写真領域を生成する検証処理部を備えていてもよい。
エントロピーに基づいて生成された写真領域には誤認識が存在する。そこで、写真であるのに写真として検知されない画素(False negative)については補正処理にて補正を行うこと誤認識を正すことができる。一方、写真ではないのに写真として検知された画素(False positive)については上記検証処理で除去する。ここで、検証処理は、一般的な原稿にみられる写真領域の傾向に基づいて行われる。例えば、原稿内の写真領域はある程度のサイズを有している。従って、写真領域のサイズは検証処理にための有効な特徴の1つとなる。また、原稿内の写真領域は四角、楕円、円などまとまった形状をしている。従って、写真領域の形状も検証処理にための有効な特徴の1つである。
なお、検証において、上記写真領域のサイズ、上記写真領域の形状、第1矩形形状内の上記写真領域の面積、および第2矩形形状内の上記写真領域の分布の少なくとも1つを測定してもよい。
さらに、本発明の方法の上記第3ステップは、第1信頼度レベル閾値を設定するステップと、上記複数の画素の1つである対象画素の信頼度レベルが上記第1信頼度レベルよりも大きい場合に、当該対象画素を上記シード領域画素として決定するステップと、を含んでいてもよい。また、本発明のシステムにおいて、上記第2決定処理部は、第1信頼度レベル閾値を設定する第1信頼度レベル閾値設定部と、上記第1信頼度レベルよりも大きい信頼度レベルを有する画素を上記シード領域画素として決定するシード領域画素決定処理部と、を備えていてもよい。
ここで、「第1信頼度レベル閾値」とは、シード領域画素を決定するための信頼度レベルの閾値である。
なお、上記第1信頼度レベル閾値は、上記信頼度レベルの範囲に基づいて設定されてもよい。信頼度レベル閾値を入力画像に応じて設定するステップを設けることにより、例えば線数の異なる網点原稿などについても適応的に処理することができる。新聞など低線数原稿内写真領域のエントロピーは、雑誌など高線数原稿内写真領域のエントロピーに比べ低い傾向がある。また、入力画像に応じて信頼度レベルを変る。そのため、信頼度レベルの範囲に応じて第1信頼度レベル閾値を設定することにより、入力画像に適したシード領域画素を確実に抽出することができる。
また、本発明の方法において、上記第4ステップは、第2信頼度レベル閾値を設定するステップと、上記シード領域に連結しており、かつ、上記第2信頼度レベル閾値より大きい信頼度レベルを有する画素を、写真領域画素として決定することで、写真領域を成長させるステップと、を含んでいてもよい。また、本発明のシステムにおいて、上記領域成長処理部は、第2信頼度レベル閾値を設定する第2信頼度レベル閾値設定部と、上記シード領域に連結しており、かつ、上記第2信頼度レベル閾値より大きい信頼度レベルを有する画素を、写真領域画素として決定することで、写真領域を成長させる第1写真領域設定部とを備えていてもよい。
ここで、「第2信頼度レベル閾値」とは、写真領域を成長させる際に用いられる信頼度レベルの閾値である。上記と同様に、信頼度レベル閾値を入力画像に応じて設定することにより、例えば線数の異なる網点原稿などについても適応的に処理することができる。実際に、新聞など低線数原稿内写真領域のエントロピーは、雑誌など高線数原稿内写真領域のエントロピーに比べ低い傾向がある。
また、本発明の方法は、上記の構成に加えて、上記デジタル画像のラベル付けされた背景マップを取得するステップと、上記第2信頼度レベル閾値より小さい信頼度レベルを有し、かつ、上記ラベル付けされた背景マップにおいて写真としてラベル付けされた画素を、写真領域画素として決定することで、写真領域を成長させるステップと、を含んでいてもよい。また、本発明のシステムは、上記の構成に加えて、上記デジタル画像のラベル付けされた背景マップを取得する取得部と、上記第2信頼度レベル閾値より小さい信頼度レベルを有し、かつ、上記ラベル付けされた背景マップにおいて写真としてラベル付けされた画素を、写真領域画素として決定することで、写真領域を成長させる第2写真領域設定部とを備えていてもよい。
ここで、「背景マップ」とは、デジタル画像の各画素について、背景領域に属することを示すマップラベルが付けられた情報のことである。なお、背景マップには、写真領域に属することを示す写真ラベルや、どの領域に属するか不明であることを示す不定ラベルが含まれていても良い。
上記の構成によれば、エントロピー以外の特徴である色分布情報を用いることにより、写真領域の検知精度を向上させることができる。
また、本発明の方法は、デジタル画像の写真領域を検知する方法であって、a)デジタル画像の複数の画素の各々について、所定のマスキング条件に基づいてエントロピー量を計算する第1ステップと、b)上記エントロピー量に基づいて、上記複数の画素毎に信頼度レベルを決定する第2ステップと、c)上記エントロピー量に基づいて、上記複数の画素のシード領域画素からなるシード領域を決定する第3ステップと、d)写真に対応するラベルを含む上記デジタル画像の背景マップを取得する第4ステップと、e)上記信頼度レベルおよび上記背景マップに基づいて上記シード領域を成長させ、上記複数の画素のうちの写真領域画素からなる写真領域を生成する第5ステップと、f)上記写真領域を補正し、補正写真領域を生成する第6ステップと、g)上記補正写真領域を検証し、検証された写真領域を生成する第7ステップと、を含むことを特徴とする。
さらに、本発明の方法は、上記の構成に加えて、h)第1信頼度レベル閾値を設定する第8ステップと、i)上記複数の画素の1つである対象画素の信頼度レベルが上記第1信頼度レベルよりも大きい場合に、当該対象画素を上記シード領域画素として決定する第9ステップと、j)第2信頼度レベル閾値を設定する第10ステップと、k)上記シード領域に連結しており、かつ、上記第2信頼度レベル閾値より大きい信頼度レベルを有する画素を写真領域画素として決定するとともに、上記第2信頼度レベル閾値より小さい信頼度レベルを有し、かつ、上記ラベル付けされた背景マップにおいて写真としてラベル付けされた画素を写真領域画素として決定することで、写真領域を成長させる第11ステップと、を含んでいてもよい。
本発明に係る方法は、デジタル画像の写真領域を検知する方法であって、a)デジタル画像の複数の画素の各々について、所定のマスキング条件に基づいてエントロピー量を計算する第1ステップと、b)上記エントロピー量に基づいて、上記複数の画素毎に信頼度レベルを決定する第2ステップと、c)上記エントロピー量に基づいて、上記複数の画素のシード領域画素からなるシード領域を決定する第3ステップと、d)上記信頼度レベルに基づいて上記シード領域を成長させ、上記複数の画素のうちの写真領域画素からなる写真領域を生成する第4ステップと、を含む。これにより、スキャナ等で読み込んだ画像データであっても、効率的かつ精度よく領域の種別を検知することができるという効果を奏する。
本発明の実施形態は、図面を参照することにより、より理解が深まるであろう。図面において、同じ構成については、同じ符号を付けている。
図面に開示されているような本発明の構成要素は、様々な変形形態で変形可能であることは容易に理解できるであろう。このように、本発明の方法及びシステムに係る実施形態のさらなる詳細な説明は、本発明の目的を限定するものではなく、本発明の好ましい形態を示しているにすぎない。
本発明の実施形態の構成要素は、ハードウェア、ファームウェアおよび/またはソフトウェアにより実現されてもよい。ここで明示する具体的な実施形態は、これらの形式の一例を述べるものであり、当業者であれば、本発明の目的の範囲内でこれらの形式のいずれかにおいて構成要素を実現することができる。
図1は、写真領域12、文字領域14およびグラフ領域16の3つの領域を含む画像10を示している。多くの画像処理、圧縮、ドキュメント管理および他のアプリケーションにとって、画像の様々な領域を検知することが望まれている。このような領域としては、写真領域、文字領域、グラフ領域、網点領域、連続階調領域、カラー領域、白黒領域、JPEG(Joint Photographic Experts Group)形式により最も効率的に圧縮可能な領域(JPEGによる圧縮が適した領域)、JBIG(Joint Bi-level Image Experts Group)形式により最も効率的に圧縮可能な領域(JBIGによる圧縮が適した領域)、背景領域、前景領域などが含まれる。
図2は、具体的な領域検知システム20を示している。領域検知システム20は、特徴抽出部22および分類処理部24を含んでいる。特徴抽出部22は、デジタル画像21から特徴量を、測定、算出またはある種の方法を用いて抽出する。分類処理部24は、抽出された特徴量23に基づいて、画像21の各部分を分類する。分類処理部24により生成された分類25は、画像領域の検知およびデジタル画像21の領域分離のために用いられる。
領域検知システムの効率性および信頼性は、分類処理に用いられる特徴量に依存する。図3は、異なる2つの画像領域における、特徴量の度数を標準化したプロットの一例を示している。実線32は、ある特定の領域に属するサンプル画像から抽出された特徴量の度数を示している。破線34は、別の領域に属するサンプル画像から抽出された特徴量の度数を示している。これら2つの曲線が重なり度合いが大きいことは、当該特徴量が、サンプル画像をこれら2つの領域に分離するために有効ではないことを示している。
図4は、異なる2つの画像領域における、特徴量の度数を標準化したプロットの他の例を示している。実線42は、ある特定の領域に属するサンプル画像から抽出された特徴量の度数を示している。破線44は、別の領域に属するサンプル画像から抽出された特徴量の度数を示している。これら2つの曲線が大きく分離されていることは、当該特徴量が、サンプル画像をこれら2つの領域に分離するために有効であることを示している。
本発明の目的のために、「ヒストグラム」は、フォーマットの出現頻度情報を参照するために使用される。ここで、フォーマットとは、例えば、配列、プロット、関連表、および、値(または値の集合)と当該値の度数(または、当該値の集合)とを対応付けた他のデータ構造などである。当該値または値の集合は、例えば、色(輝度または色度)、エッジ強度、エッジ方向、テキスチャ(周波数情報)、その他の全ての画像特徴に関連するものであってもよい。
本発明の実施形態は、デジタル画像における領域識別の方法またはシステムを含むものである。その中の1つの実施形態では、特徴量抽出の前に、マスキング条件を満たす画像の画素をマスキングすることにより、画像領域に対応する特徴量間の分離を行われる。マスキング条件を満たすマスク画素の値は、画像から特徴量を抽出する際に使用されない。
図5に示した本発明の一実施形態では、マスクされた画像51は、入力画像50から形成される(S52)。マスクされた画像51は、入力画像50の各画素に対してマスキング条件を確認することにより形成される。図6は、マスクされた画像の形成手順を示している。入力画像の画素60がマスキング条件を満たす場合(62)、マスクされた画像における対応する位置の画素の値として、マスキング条件が入力画像における画素位置で満足することを示すマスク画素値が割り当てられる(66)。入力画像の画素60がマスキング条件を満たさない場合(64)、マスクされた画像における対応する位置の画像の値として、入力画像における入力画素の値が割り当てられる(68)。このようにして、マスクされた画像は、マスキング条件を満たす入力画像の画素をマスクすることとなる。すなわち、本発明のシステムは、デジタル画像に対してマスキング条件を適用して、上記マスキング条件を満たすマスク画素を識別する識別処理部を備えている。
図5に示した本発明の実施形態では、マスクされた画像51を形成した後(52)、ヒストグラム53がマスクされた画像のブロックに対して生成される(54)。このヒストグラム53は、マスクされた画像の区分、セクション、その他の分割ともみなされる。なお、ヒストグラム53が必ずしも長方形でなくてもよい。本発明の目的のために、「ブロック」は、画像データの一部を示すために使用されるものであり、当該画像データの一部の形状としては、正方形、長方形、円、楕円、ほぼ円形などの様々な形状がある。
図7は、ヒストグラムの形成手順の一例(54)を示すフローチャートである。マスクされた画像が取り得る画素値に対応する複数のビン(区分)を持つヒストグラムが、図7に従って形成される。本実施形態では、全てのビンが、初期値として「0」が設定される。マスクされた画像のブロックにおける画素70の値は、マスク画素値と比較される(71)。画素70の値がマスク画素値と等しい場合(72)、当該画素は、ヒストグラムに累積されない。つまり、どのヒストグラムのビンも加算されないことを意味する。ブロック内に調査すべき画素が残っている場合、ブロック内の次の画素が調査される(71)。画素70の値がマスク画素値と同じではない場合(73)、当該画素は、ヒストグラムに累積される(74)。つまり、画素値に対応するヒストグラムのビンが加算されることを意味する。ブロックに調査すべき画素が残っている場合(77)、ブロックの次の画素が調査される(71)。
画素がヒストグラム74に累積される場合(S74)、マスクされた画像のブロックにおける非マスク画素のカウント数が増やされる(S75)。ブロックの全ての画素が調査されると(78,79)、ヒストグラムの標準化が実行される(S69)。マスクされた画像のブロックにおける非マスク画素のカウント数によって、各ビンの総計を分離することにより、当該ヒストグラムは標準化される。また、ヒストグラムが標準化されず、非マスク画素のカウント数をカウントするカウンターが存在しない形態も考えられる。このように、本実施形態のシステムは、注目画素の周辺領域の複数の画素について、上記マスク画素を累積しないようにして、各画素の値のヒストグラムを生成するヒストグラム生成部を備える。
マスクされた画像は、2つの成分で表現される。第1の成分は、マスクされた画素がビット値の一方で表現され、マスクされていない画素が他方のビット値で表現される2値画像であり、マスクとも考えられる。第2の成分は、デジタル画像である。マスクとデジタル画像との論理的組み合わせは、マスクされた画像を形成する。ヒストグラムの形成は、マスクされた画像の上記2つの成分を組み合わせて使用することで、実行される。
エントロピー量55(図5参照)は、マスクされた画像のブロックのヒストグラム53に対して計算される。エントロピー量55は、入力画像の画像特徴としてみなされる。エントロピー量55は、以下の形式の値としてみなされてもよい。本実施形態のシステムは、ヒストグラムのエントロピー量を計算し、注目画素のエントロピー量を求めるエントロピー量計算部を備える。
Figure 0004266030
数1において、Nはヒストグラムのビンの数であり、h(i)はビンiの累積数またはカウント数であり、f(・)は対数関数に似た数学的指標を持つ関数である。ビンにカウントされる画素、つまり、マスクされたものを除く画素の割合によって、エントロピー量55は重み付けされる。エントロピー量は、次の形式である。
Figure 0004266030
数2において、w(i)は、重み付け関数である。本発明のいくつかの実施形態では、関数f(h(i))はlog(h(i))である。
図5に示された本発明の実施形態では、注目画素を中心とする画像のブロックに対応するヒストグラム53に対してエントロピー量55を算出した後(S56)、当該注目画素は、エントロピー量(エントロピー特徴)55に従って分類される(57)。分類処理(S57)は、閾値に基づいて行われる。閾値は、予め適切に決められている、もしくは、多くの方法によって決められている。注目画素は、エントロピー量55と閾値との比較によって、2つの領域のうちの一方に属するものとして分類される。
図8に示した本発明の実施形態では、デジタル画像80および対応するマスク画像81が、マスクされたデータ83を形成するために結合される。マスクされたデータ83は、量子化される(84)。そして、マスクされた量子化データ85となる。マスクされた量子化データ85のヒストグラム87が生成され(86)、そして、エントロピー量89が、当該ヒストグラム87を用いて計算される(88)。ヒストグラムの生成(86)およびエントロピー量の計算(88)に要する手間は、マスクされたデータの量子化レベルまたは度合いに依存する。ヒストグラムのビンの数は、量子化レベルの数に依存する。すなわち、ヒストグラムのビンの数は、ヒストグラムの生成(86)およびエントロピー量の算出(88)に要する手間に影響を与える。スキャンする際のノイズや他の要因のために、ドキュメントにおける平坦エリア(均一なエリア)は、当該ドキュメントのデジタル画像において単一の色の値に対応していない。図8に示した実施形態では、量子化の度合いは、ドキュメントにおける均一の色のエリアに対して予期されるノイズ量に関連している。量子化幅は固定であっても、非固定であってもよい。また、量子化は、2の累乗で示されてもよい。この場合、量子化は、シフト演算(shifting)を用いて実行される。このように、本実施形態のシステムは、注目画素の周辺領域の複数の画素の値を量子化する量子化部を備えている。
また、マスクされたデータは、量子化されなくてもよい。しかしながら、ヒストグラムのビンの数は、マスクされたデータ値の数よりも小さい方がよい。これらの実施形態では、ヒストグラムのビンは、マスクされたデータ値の範囲を示している。
図9に示される実施形態のように、量子化90・91、ヒストグラムの生成92、およびエントロピー計算94は、デジタル画像80および対応するマスク画像81の組み合わせ82により生成された、マスクされたデータ83に対して、複数回実施されてもよい。マスクされたデータは、異なる量子化方法90、91を用いて量子化される。異なる量子化方法は、例えば、量子化のレベルが異なっている。もしくは、異なる量子化方法は、量子化レベルが同じであるが、ヒストグラムのビンの境界が変化するものであってもよい。例えば、ヒストグラムのビンの境界は、ビンの幅の1/2ごとに変化していてもよい。ヒストグラムは、各量子化方法90、91によって生成されたデータから作成される。そして、エントロピー計算94は、各ヒストグラムに対して行われる。生成された複数のエントロピー量は、組み合わせされて、一つのエントロピー量に変換される。一つのエントロピー量とは、平均値、最大値、最小値、分散値など、複数のエントロピー量の結合により導出可能なものである。
また、図10に示される形態であってもよい。すなわち、デジタル画像80と対応するマスク画像81との組み合わせによって形成されたデータ83が、異なる量子化方法90・91を用いて量子化される。そして、複数のヒストグラム100・101が複数のマスクされた量子化データ102・103に基づいて作成される。複数のヒストグラム100・101の中から、エントロピー計算105のために1つのヒストグラム106が選択される。例えば、最大のビンの度数をもつヒストグラムを用いて、エントロピー計算が行われる。もしくは、最大の度数和となる極大部分をもつヒストグラムが用いられてもよい。
また、画像の各画素を順に中心としていく、画素値の移動ウィンドウ(a moving window)が、中心画素(注目画素)を含むブロックのためのエントロピー量を計算するために使用されてもよい。エントロピー量は、マスクされた画像の対応するブロックから算出される。エントロピー値は、上記移動ウィンドウの中心の位置の画素を分類するために使用される。図11に示される実施形態のように、画素のブロックが、エントロピー量の算出のために使用される。エントロピー量は、ブロックにおける単一の画素を分類するために使用される。図11において、ブロック111が画像110のために示されている。ブロック111におけるマスクされた画像の画素が、エントロピー量を計算するために使用される。当該エントロピー量は、画素112におけるエントロピー量としてみなされる。ブロックの中心画素112は、エントロピー量に従って分類される。
エントロピー量は、画像のブロックに対して算出されてもよい。当該ブロックの中の全ての画素は、当該エントロピー量に従って同じ種別に分類される。図12は、ブロックが、当該ブロックの全ての画素を分類するために使用されるエントロピー量を計算するために使用される実施形態を示している。図12において、ブロック121は、画像120に対して示されている。当該ブロックのマスクされた画像の画素が、エントロピー量を計算するために使用される。ブロック121の全ての画素122は、エントロピー量に従って分類される。
図13に示される実施形態のように、エントロピー量は、ヒストグラムの選択された極大部分を考慮して計算されてもよい。もしくは、エントロピー量は、ヒストグラムのピークに基づいて計算されてもよい。デジタル画像80および対応するマスク画像81は、マスクされたデータ83を形成するために組み合わされる(82)。マスクされたデータ83は、量子化される。これにより、マスクされた量子化データ85が生成される。そして、マスクされた量子化データ85のヒストグラム87が生成される(86)。次に、ヒストグラム87の選択された極大部分を考慮するために、変更されたヒストグラム131が生成される(130)。その後、マスクされた量子化データの変更されたヒストグラム131を用いて、エントロピー量133が計算される(132)。なお、ヒストグラム87の単一の極大部分が考慮されてもよい。当該単一の極大部分は、ヒストグラムが形成される画像データのウィンドウの中心画素の画像値を含む極大部分であってもよい。
また、図14に示される実施形態のように、デジタル画像140が画素選択モジュール141の出力142と結合することにより、エントロピー計算で考慮されるデータ144が生成されてもよい。データ144は、量子化される(145)。ヒストグラム148は、量子化されたデータ146から作成される(147)。そして、エントロピー量139がヒストグラム148から計算される(149)。画素選択モジュール141は、入力として複数のマスク137・138を用いる画素選択ロジックを備えている。マスク137・138は、画像構造に対応している。画像構造には、例えば、文字、網点、下地、およびエッジが含まれる。画素選択ロジック141は、デジタル画像140と結合される選択マスク142を生成する。当該選択マスクは、エントロピー計算においてマスクされる画像画素を選択するためのものである。
なお、マスキング条件は、画素のエッジ強度に基づいていてもよい。例えば、マスキング条件:エッジ強度が所定値以上である、などが予め設定されている。一般に、文字領域ではエッジ強度が大きい。そこで、文字領域を抽出可能な程度に当該所定値を設定しておく。これにより、文字領域の画素をマスク画素としてマスクすることが可能となる。
また、マスキング条件が満たされる程度の信頼度が計算されてもよい。当該信頼度は、画素をヒストグラムに累積させるときに使用される。図15は、信頼度が使用される形態の一例を示している。
図15に示される実施形態では、マスクされた画像151が入力画像150から形成される(152)。マスクされた画像151は、入力画像150の各画素でのマスキング条件を確認することにより形成される。図16に示される形態のように、マスクされた画像151の形成が行われてもよい。すなわち、入力画像の画素160がマスキング条件を満足するとき(162)、マスクされた画像の対応する画素に、当該画素においてマスキング条件が満たされることを示す値(マスク画素値)が割り当てられる(166)。入力画像の画素160がマスキング条件を満足しないとき(164)、マスクされた画像の対応する画素に、入力画像168における対応する画素の値が割り当てられる。マスキング条件が満たされる画素では、さらに、マスク特性信号(a mask signature signal)での信頼性を反映した信頼度が割り当てられる(165)。信頼度の割り当ては、マスク画素に対する分離値であってもよい。また、マスク画素値が、信頼性を示すレベルを持ったマルチレベルであってもよい。マスクされた画像は、入力画像における、マスキング条件を満たす画素をマスクし、さらに、マスキング条件を満足するレベルを識別する。
図15に示した実施形態では、マスクされた画像151を形成した(152)後、ヒストグラム153が当該マスクされた画像151のブロックに対して生成される(154)。図17は、ヒストグラム形成(154)の手順の一例(104)を示すフローチャートである。マスクされた画像の取りうる画素値に対応するビンを有するヒストグラムが、図17に従って生成される。この例では、全てのビンにおいて、初期値0が設定される。まず、マスクされた画像のブロックにおける画素の値170が、マスク画素値と対比される(171)。画素の値170がマスク画素値と同じである場合(172)、当該画素は、信頼度に基づいたわずかな(fractional)カウント数でヒストグラムに累積される。そして、調査すべき画素がブロックに残っている場合(176)、当該ブロックの次の画素が調査される(171)。画素の値170がマスク画素値と同じではない場合(174)、当該画素は、ヒストグラムに累積される(175)。すなわち、画素値に対応するヒストグラムのビンが加算される。そして、調査すべき画素がブロックに残っている場合(176)、当該ブロックの次の画素が調査される(171)。
画素がヒストグラム175に累積されるとき、マスクされた画像のブロックにおける非マスク画素のカウント数が増大される(178)。ブロックの全ての画素が調査されると(180,179)、ヒストグラムは標準化される(169)。ヒストグラムの標準化は、各ビンのカウント数を、マスクされた画像のブロックにおける非マスク画素の数で割ることにより行われてもよい。なお、ヒストグラムは、必ずしも標準化されなくてもよく、マスクされた画像のブロックにおける非マスク画素のカウント数をカウントするカウンターが存在しなくてもよい。
そして、上記実施形態でも述べたように、マスクされた画像の近傍画素のヒストグラムの対して、エントロピー量155が計算される(156)。図15に示す実施形態では、画素を中心とする画像のブロックに対応するヒストグラム153に対してエントロピー量155を計算した(156)後、当該画素は、エントロピー量155に従って、分類される(157)。図15に示される分類処理(157)は、閾値に基づいて行われる。閾値は、予め適切に定められていてもよく、多くの方法によって定められていてもよい。画素は、エントロピー量と閾値との大小関係に従って、2つの領域のいずれかに属するものとして分類される。
マスキング条件は、単一の画像条件のみを備えていても良い。また、マスキング条件は、マスキング条件を形成するために結合される複数の画像条件を備えていても良い。
エントロピー量は、画像を2つの領域に分離するために使用される。または、エントロピー特徴は、画像を2つ以上の領域に分離するために使用されてもよい。
さらに、データのダイナミックレンジ全体が使用されなくてもよい。ヒストグラムは、ダイナミックレンジの上下限の間の値を持つ画素のみを考慮して生成されてもよい。もちろん、ダイナミックレンジヒストグラムを用いても良い。
また、統計上のエントロピー量は、次式によって求められる。
Figure 0004266030
数3において、Nはビンの数を示している。また、h(i)は、ビンiに対して下記の数4のように標準化されたヒストグラムにおけるカウント数を示している。また、log(0)=1は、空(empty)のビンを示している。
Figure 0004266030
最大エントロピーは、均一のヒストグラム分布に対して得られる。例えば、各ビンに対して、h(i)=1/N である場合には、最大エントロピーは以下の数5のようになる。
Figure 0004266030
エントロピー計算は、固定少数点演算に変換され、符号なし8ビット、UNIT8の評価値を導出してもよい。この評価値では、0がエントロピーなしを示し、255が最大エントロピーを示している。固定小数点演算は、2つのテーブルを使用する。第1のテーブルは、対数計算に取って代わるものであり、以下のlog_tableで示される。第2のテーブルは、ヒストグラム標準化ステップにおける割算を実行するためのものであり、rev_tableとして示される。9つのビンを有するヒストグラムの場合、次のような手順により、整数(integer)エントロピー計算が実現される。
Figure 0004266030
数6において、log_shift,rev_shift,accum_shiftは、それぞれ、対数、割算、累算処理の精度に対応している。
ハードウェアにより実現する場合には、標準化されたヒストグラムのビンの値であるnを算出するための整数除算回路を使用してもよい。
Figure 0004266030
この例では、ビンの数が9(N=9)であり、標準化乗数が255/Emax=81である。
各算出ステップの固定小数点の精度は、アプリケーションや分析対象のデータの性質に依存して調整される。同様に、ビンの数も調整される。
画像を最初に解析する段階的な補正処理(a staged refinement process)、および、写真領域と見込まれる領域を決定するために引出された画像特徴、を用いながら、画像から写真領域が検知される。検証(verification)および補正(refinement)の段階は、写真領域と見込まれる領域の初期の決定の後に行われる。マスクされたエントロピーは、まず第一に、非写真領域から写真領域を分離するために使用される。デジタル画像の下地領域および局所背景領域の均一(平坦)な性質のために、このような領域は低いエントロピー量となる。均一な背景領域に比べると、写真領域では、輝度および色度の情報が変化するため、より大きなエントロピー量となる。しかしながら、文字領域も文字のエッジ構造のために大きなエントロピー量を有する。画像における写真領域を識別するためのエントロピー量を決定するときには、文字画素をマスクすることが好ましい。その代わり、全ての強いエッジ構造をマスクすると、当該構造には、文字に加えて、写真領域における建物、看板、および他の人工物が含まれるため、文字領域を写真領域として識別することが低減されるとともに、写真領域の識別があまり低減されない。写真領域が概してより大きなエントロピー量を有しているとしても、例えば空(sky)の領域のように均一な写真領域は低いエントロピー量を有する。このような領域は、エントロピーまたはマスクされたエントロピーに基づいた写真領域の検知において間違った検知がされてしまう。
図18に示した実施形態では、デジタル画像181におけるマスクされたエントロピー量に基づいて最初の段階で検知された(182)写真マップ183の補正処理184が行われる。また、検証処理186が、補正処理184の後に行われる。
最初の段階の写真マップ183は、図19に示されるように生成される。最初の段階の写真マップ183は、領域成長処理(a region growing process)192によって生成される。
例えば、エントロピー量が256で表される場合、エントロピー量が200以上の範囲(信頼度レベル3)、80以上200未満の範囲(信頼度レベル2)、80未満の範囲(信頼度レベル1)の3つの信頼度レベルを生成する。この範囲は、種々の画像サンプルを用いて適切な値が設定される。
また、領域成長プロセス192は、画像のマスクされたエントロピー量191に基づいた写真検知処理190の出力である写真領域のシード(seeds)193を用いている。写真領域のシード193は、マスクされたエントロピー量191が信頼できるものとみなされる、デジタル画像の画素であり、マスクされたエントロピーが高い画素は、マスクされたエントロピー量が最も信頼できる画素としてみなされる。このような画素は、図19に示される実施形態の領域成長処理192で使用されるシード193となる。閾値が、写真領域のシードを決定するために使用されてもよい。領域の知識が、当該閾値を決定するために使用される。一例としては、画像においてマスクされたエントロピー量の高い方から10%のエントロピー量を有する画素が、写真領域のシード193として使用される。
なお、本実施形態のシステムは、第1信頼度レベル閾値を設定する第1信頼度レベル閾値設定部と、上記第1信頼度レベルよりも大きい信頼度レベルを有する画素を上記シード領域画素として決定するシード領域画素決定処理部と、を備えていてもよい。例えば、上記の信頼度レベル1〜3の例では、第1信頼度レベル閾値設定部は、信頼度レベル3と信頼度レベル2の間の信頼度レベルを第1信頼度レベル閾値として設定する。これにより、シード領域画素決定処理部は、信頼度レベル3の画素(エントロピー量が200以上の画素)をシード領域画素として決定する。
なお、このとき、第1信頼度レベル閾値を、上記信頼度レベルの範囲に基づいて設定すればよい。例えば、画像においてマスクされたエントロピー量の高い方から10%のエントロピー量を有する画素を、写真領域のシード193として使用する。
写真領域のシード193からの領域成長処理192は、矩形化条件(bounding condition)によって制御される。ここでは、写真領域を、信頼性の高い写真領域のシードから、それよりも低い信頼性の写真特徴応答エリアに成長させる。写真領域は、低い信頼度の画素に直面するまで、成長される。このようにして、写真領域を、強い写真特徴応答を持つ画素との連結性に基づいた画素を含むように成長させる。
具体的には、本実施形態のシステムは、所定の第2信頼度レベル閾値を設定する第2信頼度レベル閾値設定部を備えていてもよい。そして、シード領域に連結しており、かつ、第2信頼度レベル閾値より大きい信頼度レベルを有する画素を、写真領域画素として決定し、写真領域を成長させる第1写真領域設定部を備えていてもよい。例えば、上記の信頼度レベル1〜3の例では、第2信頼度レベル閾値設定部は、信頼度レベル2と信頼度レベル1の間の信頼度レベルを第2信頼度レベル閾値として設定する。これにより、第1写真領域設定部は、シード領域画素(ここでは、エントロピー量が200以上の画素)連結しており、信頼度レベル2の画素(ここでは、エントロピー量が80以上200未満)を写真領域画素として領域成長させる。
また、追加情報が、領域成長プロセスにおいて使用されてもよい。追加情報は、背景領域の識別に関連している。背景領域であることを示す、ラベル付けされた背景マップは、領域成長において使用される。ラベル付けされた背景マップは、背景領域に属することを示すとともに、背景色のパレットを示すインデックスに加えて、2つの予備のラベルを含んでいても良い。この2つの予備ラベルの1つは、背景色の解析(background color analysis)および検知によって識別されるような写真候補画素を示している。他の予備ラベルは、信頼度の低い背景色の解析およびラベリングをもつ画素を示している。マップラベル「1」は、画素が写真候補領域に属していることを示している。マップラベル「2」〜「254」は、背景領域を示しており、マップラベル「255」は、不定または信頼度の低い領域を示している。
領域成長は、背景色解析およびラベリングにより写真候補領域としてラベルされた場合、低い信頼度の領域に向かう。写真領域は、背景としてラベルされた領域には成長しない。不定または信頼度の低い領域としてラベル付けされた画素に直面するとき、成長プロセスは、不定または信頼度の低い画素への成長するために、より保守的な矩形化条件、または、より強固な連結可能な制限を使用する。より保守的な矩形化条件は、より高い信頼度の閾値に対応する。画素が背景色解析によって写真候補としてラベルされた場合、1つの近傍画素だけが写真領域に属するように要求され、写真領域が当該画素まで成長する。すなわち、画素が背景色解析によって写真候補としてラベルされた場合、比較的ゆるい条件で領域を成長させる。一方、背景色解析によって、画素が不定または信頼度の低い領域としてラベル付けされると、少なくとも2つの近傍画素が写真領域に属するように要求され、写真領域が当該画素まで成長する。すなわち、画素が背景色解析によって不定としてラベルされた場合、比較的保守的な条件で領域を成長させる。近傍画素は、特定の走査方向に隣接するものであり、例えば、4または8の最も近い近傍画素、もしくは、他に定義付けされた近傍画素である。連結制限は適宜変更可能である。
そして、本発明のシステムは、上記第2信頼度レベル閾値より小さい信頼度レベルを有し、かつ、上記ラベル付けされた背景マップにおいて写真を示すマップラベルがラベル付けされた画素を、写真領域画素として決定することで、写真領域を成長させる第2写真領域設定部とを備えていてもよい。
ここで、上記背景色解析の一例について説明する。なお、本実施形態のシステムは、背景色解析部を備えている。図21は、背景色解析処理の流れを示すフローチャートである。
図21に示されるように、まず、背景色解析部は、入力画像についてヒストグラムを生成する(211)。図22は、生成されたヒストグラムの一例であり、画素の輝度値を用いた一次元ヒストグラムを示している。図22において、横軸は入力画像の各画素の輝度値であり、縦軸は各輝度値における画素の度数を示している。
次に、背景色解析部は、生成したヒストグラムを解析し、ピークを抽出する(212)。図23は、当該ヒストグラムの解析処理の一例を示す図である。図23に示されるように、背景色解析部は、度数が所定閾値以上の輝度値をピーク候補とし、連続して度数が所定閾値以上となる輝度値の範囲を1つのピークとして抽出する。その後、背景色解析部は、抽出した各ピークにラベルを割り当てる。
その後、背景色解析部は、抽出したピークの輝度値を有する各画素に、当該ピークに割り当てたラベルと同じラベルを割り当てるラベル割り当て処理を行う(213)。図24は、ラベル割り当て処理が行われた画像の一例を示す図である。ここで、図23のラベルと図24のラベルとは相互に対応している。すなわち、図23において「ラベル1」と記されたピークの輝度値を有する画素は、図24における「ラベル1」と表記された領域に属している。
そして、ラベルの割り当てがされた領域を背景領域として設定し、ラベルの割り当てが行われていない領域を非背景領域として設定する。このようにして、背景色解析部は、ローカル背景マップを生成する。
なお、例えば、背景色解析において、非背景領域を写真画素として、文字と判定された画素を不定画素として扱ってもよい。
補正処理は、上述したような、最初の段階の領域成長処理の後に実行される。図20は、領域成長202の結果である写真領域200の一例を示している。2つの領域204、206は、最初の段階の領域成長では誤って判定される。そのこ、最初の段階の写真マップを補正することで、このような誤った領域を検知することができる。図20に示される写真領域の一例の206のように、写真領域の内部の穴は、ホールフィリング(穴埋め)方法(例えば、フラッディング・アルゴリズムや、連結成分アルゴリズム)を用いて、写真領域として検知され、ラベル付けされる。凹状の領域204は、写真領域に対して計算された矩形に基づいて、穴埋めされる。均一な色又はほぼ均一な色が写真領域に対して測定されたバウンディング形状(矩形化形状)を囲んでいる場合、写真領域の境界上の凹状の領域は、写真領域に属するものとしてラベル付けされる。バウンディング形状は、各領域に対して計算される。バウンディング形状は、領域に対するバウンディングボックスを形成する矩形であってもよい。
次に、補正された写真マップの検証が行われる。写真マップの検証は、写真領域のサイズに基づいて行われてもよい。写真領域として識別された小領域は、取り除かれ(removed)、再ラベリングされてもよい。写真領域として識別された領域は、領域の形状、バウンディング形状の中の領域の面積、バウンディング形状の中の領域の分布、または、ドキュメントレイアウト尺度(ドキュメントレイアウトの複雑度)に基づいた検証プロセスにより、写真領域分類から除去される。検証プロセスは、補正プロセスなしに実行されてもよい。ホールフィリング方法による補正プロセスは、凹状領域のフィリング処理の後に処理される小領域検証の後に実行されてもよい。
エントロピーに基づいて生成された写真領域には誤認識が存在する。写真であるのに写真として検知されない画素(False negative)については補正処理にて補正を行うことにより、誤認識を正すことができる。一方、写真ではないのに写真として検知された画素(False positive)については検証処理で除去する。検証処理は、一般的な原稿にみられる写真領域の傾向に基づいて行われる。例えば、原稿内の写真領域がある程度のサイズを有しているため、写真領域のサイズは検証処理にための有効な特徴の1つである。また、原稿内の写真領域は四角、楕円、円など大抵まとまった形状をしている。従って、写真領域の形状も検証処理にための有効な特徴の1つである。
サイズに関しては、単純に1つのラベルに属する画素数(サイズ)と所定閾値を比較することにより、写真領域を除去するか否かの判定を行う。
形状に関しては、例えば、1つのラベルに属する(同じラベルが付けられた)領域の周囲長と矩形形状周囲長の比率、あるいは、円形度(4π×S/L2:但し、Sは上記画素数、Lは周囲長)、オイラー数(領域に穴があいているか否かを示す数値)などにより、写真領域を除去するか否かの判定を行う。
矩形形状内の写真領域の面積・分布に関しては、単純に1つのラベルに属する画素数と矩形形状面積との比率により、写真領域を除去するか否かの判定を行う。
発明の詳細な説明の項においてなされた具体的な実施形態または実施例は、あくまでも、本発明の技術内容を明らかにするものであって、そのような具体例にのみ限定して狭義に解釈されるべきものではなく、本発明の精神と次に記載する特許請求事項の範囲内で、いろいろと変更して実施することができるものである。
最後に、領域検知システム20の各ブロックは、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
すなわち、領域検知システム20は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである領域検知システム20の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記領域検知システム20に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、領域検知システム20を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は、複合機などの画像形成装置に適用できる。
異なる複数の種別の領域を含む画像の一例を示す図である。 領域検知システムを示すブロック図である。 特徴量の分離度を示すヒストグラムの一例である。 特徴量の分離度を示すヒストグラムの他の例である。 本発明の一実施形態を示すものであり、マスクされた画像のヒストグラムからエントロピー量を計算する処理の流れを示す図である。 マスクされた画像の生成処理を示す図である。 ヒストグラムの生成処理の一例を示す図である。 本発明の他の実施形態を示すものであり、マスキング、量子化、ヒストグラム生成およびエントロピー計算を含む処理の流れを示す図である。 本発明の他の実施形態を示すものであり、選択データに対して複数の量子化を行い、複数のエントロピー計算を行う場合の処理の流れを示す図である。 本発明の他の実施形態を示すものであり、選択データに対して複数の量子化を行う場合の処理の流れを示す図である。 画像ウィンドウにおける画素の分類を示す図である。 画像ウィンドウにおけるブロックの分類を示す図である。 極大部分に基づいたヒストグラムの変形処理を含む実施形態の処理の流れを示す図である。 複数のマスク入力を用いた画素選択ロジックを含む実施形態の処理の流れを示す図である。 信頼度を用いたヒストグラムからのマスクエントロピー量計算を含む実施形態の処理の流れを示す図である。 信頼度を用いたときのマスクされた画像の生成処理の一例を示す図である。 信頼度を用いたヒストグラム生成処理の一例を示す図である。 補正および検証を含む実施形態の処理の流れを示す図である。 写真領域の種からの領域成長の処理を含む実施形態の処理の流れを示す図である。 写真領域の一例を示す図である。 背景色解析処理の流れを示すフローチャートである。 入力画像に対して生成されたヒストグラムの一例であり、画素の輝度値を用いた一次元ヒストグラムを示している。 ヒストグラムの解析処理の一例を示す図である。 ラベル割り当て処理が行われた画像の一例を示す図である。
符号の説明
20 領域検知システム
22 特徴抽出部
24 分類処理部

Claims (16)

  1. デジタル画像の写真領域を検知する方法であって、
    a)デジタル画像に含まれる注目画素を、写真領域の分類を行う際に当該分類の誤判定の要因となる画素が満たす所定のマスキング条件を満たすマスク画素、および、当該マスキング条件を満たさない非マスク画素の何れかに分類する第1ステップと、
    b)上記注目画素毎に、当該注目画素を含む所定サイズのブロック内の複数の画素の画素値について、度数に対する非マスク画素の寄与がマスク画素の寄与よりも大きくなるようにヒストグラムを作成し、当該ヒストグラムに対してエントロピー量を計算する第ステップと、
    )上記エントロピー量に基づいて、上記注目画素毎に信頼度レベルを決定する第ステップと、
    )上記エントロピー量に基づいて、上記デジタル画像における、シード領域画素からなるシード領域を決定する第ステップと、
    )上記信頼度レベルに基づいて上記シード領域を成長させ、上記デジタル画像における、写真領域画素からなる写真領域を生成する第ステップと、
    を含むことを特徴とする方法。
  2. さらに、上記写真領域を補正し、補正写真領域を生成する第ステップを含むことを特徴とする請求項1に記載の方法。
  3. 上記第ステップにおいて、上記写真領域の内部の穴および凹状の矩形領域のうち少なくとも1つを写真領域として補正することを特徴とする請求項2に記載の方法。
  4. さらに、上記写真領域を検証し、検証された写真領域を生成する第ステップを含むことを特徴とする請求項1に記載の方法。
  5. 上記第ステップは、
    記複数の画素の1つである対象画素の信頼度レベルが、予め定められた第1信頼度レベルよりも大きい場合に、当該対象画素を上記シード領域画素として決定するステップを含むことを特徴とする請求項1に記載の方法。
  6. 上記第ステップは、
    記シード領域に連結しており、かつ、予め定められた第2信頼度レベル閾値より大きい信頼度レベルを有する画素を、写真領域画素として決定することで、写真領域を成長させるステップを含むことを特徴とする請求項1に記載の方法。
  7. 上記デジタル画像のラベル付けされた背景マップを取得するステップと、
    上記第2信頼度レベル閾値より小さい信頼度レベルを有し、かつ、上記ラベル付けされた背景マップにおいて写真としてラベル付けされた画素を、写真領域画素として決定することで、写真領域を成長させるステップと、
    を含むことを特徴とする請求項に記載の方法。
  8. デジタル画像の写真領域を検知するシステムであって、
    a)デジタル画像に含まれる注目画素を、写真領域の分類を行う際に当該分類の誤判定の要因となる画素が満たす所定のマスキング条件を満たすマスク画素、および、当該マスキング条件を満たさない非マスク画素の何れかに分類し、上記注目画素毎に、当該注目画素を含む所定サイズのブロック内の複数の画素の画素値について、度数に対する非マスク画素の寄与がマスク画素の寄与よりも大きくなるようにヒストグラムを作成し、当該ヒストグラムに対してエントロピー量を計算する計算処理部と、
    b)上記エントロピー量に基づいて、上記注目画素毎に信頼度レベルを決定する第1決定処理部と、
    c)上記エントロピー量に基づいて、上記デジタル画像における、シード領域画素からなるシード領域を決定する第2決定処理部と、
    d)上記信頼度レベルに基づいて上記シード領域を成長させ、上記デジタル画像における、写真領域画素からなる写真領域を生成する領域成長処理部と、
    を備えることを特徴とするシステム。
  9. 上記写真領域を補正し、補正写真領域を生成する補正処理部を備えることを特徴とする請求項に記載のシステム。
  10. 上記補正処理部は、上記写真領域の内部の穴および凹状の矩形領域のうち少なくとも1つを写真領域として補正することを特徴とする請求項に記載のシステム。
  11. 上記写真領域を検証し、検証された写真領域を生成する検証処理部を備えることを特徴とする請求項に記載のシステム。
  12. 上記第2決定処理部は、
    予め定められた第1信頼度レベルよりも大きい信頼度レベルを有する画素を上記シード領域画素として決定するシード領域画素決定処理部と、
    を備えることを特徴とする請求項に記載のシステム。
  13. 上記領域成長処理部は、
    記シード領域に連結しており、かつ、予め定められた第2信頼度レベル閾値より大きい信頼度レベルを有する画素を、写真領域画素として決定することで、写真領域を成長させる第1写真領域設定部を備えることを特徴とする請求項に記載のシステム。
  14. 上記デジタル画像のラベル付けされた背景マップを取得する取得部と、
    上記第2信頼度レベル閾値より小さい信頼度レベルを有し、かつ、上記ラベル付けされた背景マップにおいて写真としてラベル付けされた画素を、写真領域画素として決定することで、写真領域を成長させる第2写真領域設定部とを備えることを特徴とする請求項13に記載のシステム。
  15. デジタル画像の写真領域を検知する方法であって、
    a)デジタル画像に含まれる注目画素を、写真領域の分類を行う際に当該分類の誤判定の要因となる画素が満たす所定のマスキング条件を満たすマスク画素、および、当該マスキング条件を満たさない非マスク画素の何れかに分類する第1ステップと、
    b)上記注目画素毎に、当該注目画素を含む所定サイズのブロック内の複数の画素の画素値について、度数に対する非マスク画素の寄与がマスク画素の寄与よりも大きくなるようにヒストグラムを作成し、当該ヒストグラムに対してエントロピー量を計算する第2ステップと、
    c)上記エントロピー量に基づいて、上記注目画素毎に信頼度レベルを決定する第ステップと、
    )上記エントロピー量に基づいて、上記デジタル画像における、シード領域画素からなるシード領域を決定する第ステップと、
    )写真に対応するラベルを含む上記デジタル画像の背景マップを取得する第ステップと、
    )上記信頼度レベルおよび上記背景マップに基づいて上記シード領域を成長させ、上記デジタル画像における、写真領域画素からなる写真領域を生成する第ステップと、
    )上記写真領域を補正し、補正写真領域を生成する第ステップと、
    )上記補正写真領域を検証し、検証された写真領域を生成する第ステップと、
    を含むことを特徴とする方法。
  16. )上記複数の画素の1つである対象画素の信頼度レベルが、予め定められた第1信頼度レベルよりも大きい場合に、当該対象画素を上記シード領域画素として決定する第9ステップと、
    )上記シード領域に連結しており、かつ、予め定められた第2信頼度レベル閾値より大きい信頼度レベルを有する画素を写真領域画素として決定するとともに、上記第2信頼度レベル閾値より小さい信頼度レベルを有し、かつ、上記ラベル付けされた背景マップにおいて写真としてラベル付けされた画素を写真領域画素として決定することで、写真領域を成長させる第10ステップと、
    を含むことを特徴とする請求項15に記載の方法。
JP2007044490A 2006-03-02 2007-02-23 デジタル画像の領域を検知する方法およびシステム Expired - Fee Related JP4266030B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/367,244 US7889932B2 (en) 2006-03-02 2006-03-02 Methods and systems for detecting regions in digital images
US11/424,296 US8630498B2 (en) 2006-03-02 2006-06-15 Methods and systems for detecting pictorial regions in digital images

Publications (2)

Publication Number Publication Date
JP2007235953A JP2007235953A (ja) 2007-09-13
JP4266030B2 true JP4266030B2 (ja) 2009-05-20

Family

ID=38556006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007044490A Expired - Fee Related JP4266030B2 (ja) 2006-03-02 2007-02-23 デジタル画像の領域を検知する方法およびシステム

Country Status (2)

Country Link
US (1) US8630498B2 (ja)
JP (1) JP4266030B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7792359B2 (en) 2006-03-02 2010-09-07 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US8630498B2 (en) 2006-03-02 2014-01-14 Sharp Laboratories Of America, Inc. Methods and systems for detecting pictorial regions in digital images
US7889932B2 (en) 2006-03-02 2011-02-15 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US7864365B2 (en) 2006-06-15 2011-01-04 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
US8437054B2 (en) 2006-06-15 2013-05-07 Sharp Laboratories Of America, Inc. Methods and systems for identifying regions of substantially uniform color in a digital image
US7876959B2 (en) 2006-09-06 2011-01-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
JP4947136B2 (ja) 2009-12-25 2012-06-06 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
US8655071B2 (en) * 2011-02-24 2014-02-18 Sharp Laboratories Of America, Inc. Methods and systems for determining a document region-of-interest in an image
JP2014528224A (ja) * 2011-09-29 2014-10-23 ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. アクティビティマップに基づいてイメージの新しい色値を求める

Family Cites Families (147)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH646788A5 (de) 1978-11-28 1984-12-14 Hell Rudolf Dr Ing Gmbh Verfahren und schaltungsanordnung zum erkennen von farben.
US4741046A (en) * 1984-07-27 1988-04-26 Konishiroku Photo Industry Co., Ltd. Method of discriminating pictures
US5001767A (en) * 1987-11-30 1991-03-19 Kabushiki Kaisha Toshiba Image processing device
JPH02100583A (ja) * 1988-10-07 1990-04-12 Toshiba Corp 画像処理方法およびその装置
US5353132A (en) 1989-02-06 1994-10-04 Canon Kabushiki Kaisha Image processing device
JP3223512B2 (ja) * 1990-12-19 2001-10-29 ソニー株式会社 画像表示方法及び装置
US5157740A (en) 1991-02-07 1992-10-20 Unisys Corporation Method for background suppression in an image data processing system
JP2852390B2 (ja) * 1991-02-16 1999-02-03 株式会社半導体エネルギー研究所 表示装置
US5265173A (en) 1991-03-20 1993-11-23 Hughes Aircraft Company Rectilinear object image matcher
JPH06121161A (ja) * 1991-05-14 1994-04-28 Fuji Xerox Co Ltd カラー画像処理装置の文字処理方式
US5280367A (en) * 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
JP3276985B2 (ja) * 1991-06-27 2002-04-22 ゼロックス・コーポレーション イメージピクセル処理方法
US5696842A (en) 1991-07-04 1997-12-09 Ricoh Company, Ltd. Image processing system for adaptive coding of color document images
US5436981A (en) * 1992-06-24 1995-07-25 Canon Kabushiki Kaisha Image processing method, and apparatus therefor
US5379130A (en) * 1992-12-02 1995-01-03 Industrial Technology Research Institute Text/image separation method
US5339172A (en) * 1993-06-11 1994-08-16 Xerox Corporation Apparatus and method for segmenting an input image in one of a plurality of modes
US5362796A (en) * 1993-08-09 1994-11-08 Isp Investments Inc. Molded crosslinked vinyl lactam polymer gel and method of preparation
US5689575A (en) 1993-11-22 1997-11-18 Hitachi, Ltd. Method and apparatus for processing images of facial expressions
US5546474A (en) * 1993-12-21 1996-08-13 Hewlett-Packard Company Detection of photo regions in digital images
US5588072A (en) 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JPH07220091A (ja) * 1994-02-04 1995-08-18 Canon Inc 画像処理装置及び方法
US5481622A (en) * 1994-03-01 1996-01-02 Rensselaer Polytechnic Institute Eye tracking apparatus and method employing grayscale threshold values
DE69523970T2 (de) * 1994-04-15 2002-07-04 Canon K.K., Tokio/Tokyo Dokumentspeicher- und Wiederauffindungssystem
EP0677817B1 (en) * 1994-04-15 2000-11-08 Canon Kabushiki Kaisha Page segmentation and character recognition system
JPH07322252A (ja) * 1994-05-23 1995-12-08 Canon Inc 画像符号化装置
US5917945A (en) * 1994-06-15 1999-06-29 Metanetics Corporation Recognizing dataforms in image areas
US5903363A (en) * 1994-08-04 1999-05-11 Canon Kabushiki Kaisha Image processing apparatus and method
US5694228A (en) 1994-08-09 1997-12-02 Ricoh Company,Ltd. Document image processor with defect detection
US5987171A (en) 1994-11-10 1999-11-16 Canon Kabushiki Kaisha Page analysis system
US6215904B1 (en) * 1994-11-30 2001-04-10 Xerox Corporation Apparatus and method for selecting encoding schemes based upon image content
US5581667A (en) 1994-12-23 1996-12-03 Xerox Corporation Electronic trapping system for digitized text and images
DE69523135T2 (de) 1994-12-28 2002-05-02 Canon K.K., Tokio/Tokyo Bildverarbeitungsvorrichtung und Verfahren
US5649025A (en) * 1995-02-03 1997-07-15 Xerox Corporation Multithresholding for document image segmentation
JPH08305846A (ja) 1995-03-07 1996-11-22 Matsushita Electric Ind Co Ltd ニューロフィルターと像域分割方法とフィルター装置
US5682249A (en) 1995-05-11 1997-10-28 Xerox Corporation Method of encoding an image at full resolution for storing in a reduced image buffer
US5995665A (en) 1995-05-31 1999-11-30 Canon Kabushiki Kaisha Image processing apparatus and method
US5923775A (en) * 1996-04-04 1999-07-13 Eastman Kodak Company Apparatus and method for signal dependent noise estimation and reduction in digital images
US5946420A (en) * 1996-05-10 1999-08-31 Hewlett-Packard Company Printing with text enhancement: recognition by sensing paired edges, or by disqualification in pictorial regions
JP2973944B2 (ja) * 1996-06-26 1999-11-08 富士ゼロックス株式会社 文書処理装置および文書処理方法
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
US5960104A (en) 1996-08-16 1999-09-28 Virginia Polytechnic & State University Defect detection system for lumber
US5778092A (en) * 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
US5767978A (en) * 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system
US5900953A (en) * 1997-06-17 1999-05-04 At&T Corp Method and apparatus for extracting a foreground image and a background image from a color document image
US6222932B1 (en) * 1997-06-27 2001-04-24 International Business Machines Corporation Automatic adjustment of image watermark strength based on computed image texture
US6298173B1 (en) * 1997-10-03 2001-10-02 Matsushita Electric Corporation Of America Storage management system for document image database
US6014464A (en) * 1997-10-21 2000-01-11 Kurzweil Educational Systems, Inc. Compression/ decompression algorithm for image documents having text graphical and color content
US6347153B1 (en) * 1998-01-21 2002-02-12 Xerox Corporation Method and system for classifying and processing of pixels of image data
US6175650B1 (en) * 1998-01-26 2001-01-16 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
US6252994B1 (en) * 1998-01-26 2001-06-26 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
JP4662584B2 (ja) * 1998-01-27 2011-03-30 イーストマン コダック カンパニー 画像センサのライン毎ノイズ除去装置及び方法
US6020979A (en) * 1998-03-23 2000-02-01 Xerox Corporation Method of encoding high resolution edge position information in continuous tone image information
US6175427B1 (en) * 1998-04-20 2001-01-16 Xerox Corporation System and method of tonal correction of independent regions on a compound document
AUPP400998A0 (en) 1998-06-10 1998-07-02 Canon Kabushiki Kaisha Face detection in digital images
US6233353B1 (en) * 1998-06-29 2001-05-15 Xerox Corporation System for segmenting line drawings from text within a binary digital image
JP3453085B2 (ja) * 1998-07-23 2003-10-06 ジーイー横河メディカルシステム株式会社 X線ct装置
US6308179B1 (en) 1998-08-31 2001-10-23 Xerox Corporation User level controlled mechanism inter-positioned in a read/write path of a property-based document management system
US6360009B2 (en) * 1998-09-23 2002-03-19 Xerox Corporation Image segmentation apparatus and method
US6782129B1 (en) * 1998-09-23 2004-08-24 Xerox Corporation Image segmentation apparatus and method
US6389164B2 (en) * 1998-09-23 2002-05-14 Xerox Corporation Image segmentation apparatus and method
US6272240B1 (en) * 1998-09-23 2001-08-07 Xerox Corporation Image segmentation apparatus and method
US6178260B1 (en) * 1998-09-23 2001-01-23 Xerox Corporation Image segmentation apparatus and method
US6400844B1 (en) * 1998-12-02 2002-06-04 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6373981B1 (en) * 1998-12-21 2002-04-16 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6360007B1 (en) * 1998-12-22 2002-03-19 Xerox Corporation Dynamic optimized color lut transformations based upon image requirements
US6731789B1 (en) * 1999-01-29 2004-05-04 Canon Kabushiki Kaisha Image processing apparatus and method, and storage medium
IL131282A (en) * 1999-08-05 2009-02-11 Orbotech Ltd Apparatus and methods for inspection of objects
US6487321B1 (en) * 1999-09-16 2002-11-26 Applied Science Fiction Method and system for altering defects in a digital image
US6668080B1 (en) 1999-09-21 2003-12-23 Microsoft Corporation Automated layer extraction and pixel assignment from image sequences
US6535633B1 (en) * 1999-09-24 2003-03-18 Bank One Method and apparatus for re-classifying color image pixels classified by single channel segmentation
US6594401B1 (en) * 1999-10-20 2003-07-15 Xerox Corporation Detection and elimination of scanning artifacts
US6577762B1 (en) * 1999-10-26 2003-06-10 Xerox Corporation Background surface thresholding
US6728391B1 (en) * 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
US6718059B1 (en) * 1999-12-10 2004-04-06 Canon Kabushiki Kaisha Block selection-based image processing
US7015978B2 (en) * 1999-12-13 2006-03-21 Princeton Video Image, Inc. System and method for real time insertion into video with occlusion on areas containing multiple colors
GB2357649A (en) * 1999-12-22 2001-06-27 Nokia Mobile Phones Ltd Image enhancement using inverse histogram based pixel mapping
EP1119186A3 (en) * 2000-01-19 2002-07-31 Xerox Corporation Method for generating anti-aliased text and line graphics in compressed document images
JP3814456B2 (ja) * 2000-02-07 2006-08-30 キヤノン株式会社 画像処理装置及びその方法
US6473522B1 (en) 2000-03-14 2002-10-29 Intel Corporation Estimating text color and segmentation of images
US6901164B2 (en) * 2000-04-14 2005-05-31 Trusight Ltd. Method for automated high speed improvement of digital color images
JP4496602B2 (ja) 2000-05-17 2010-07-07 コニカミノルタビジネステクノロジーズ株式会社 画像処理方法および画像処理装置
US6778291B1 (en) * 2000-06-12 2004-08-17 Hewlett-Packard Development Company, L.P. Fast page analyzer for proper selection of compression engine for rendered data
JP3986732B2 (ja) 2000-06-21 2007-10-03 パイオニア株式会社 映像信号の輝度レベル補正装置
JP3715905B2 (ja) 2001-06-26 2005-11-16 キヤノン株式会社 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
US6766053B2 (en) * 2000-12-15 2004-07-20 Xerox Corporation Method and apparatus for classifying images and/or image regions based on texture information
US6941014B2 (en) * 2000-12-15 2005-09-06 Xerox Corporation Method and apparatus for segmenting an image using a combination of image segmentation techniques
US6522791B2 (en) * 2001-01-23 2003-02-18 Xerox Corporation Dynamic user interface with scanned image improvement assist
US6853755B2 (en) 2001-03-28 2005-02-08 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive compression of scanned documents
JP2002325182A (ja) 2001-04-25 2002-11-08 Sharp Corp 画像処理方法および画像処理装置並びにそれを備えた画像形成装置
GB2375908B (en) 2001-05-23 2003-10-29 Motorola Inc Image transmission system image transmission unit and method for describing texture or a texture-like region
CN1213592C (zh) * 2001-07-31 2005-08-03 佳能株式会社 采用自适应二值化的图象处理方法和设备
US6983068B2 (en) * 2001-09-28 2006-01-03 Xerox Corporation Picture/graphics classification system and method
JP4029316B2 (ja) 2001-10-18 2008-01-09 日本電気株式会社 画像種別識別方法および装置と画像処理プログラム
US7194140B2 (en) * 2001-11-05 2007-03-20 Canon Kabushiki Kaisha Image processing apparatus and method which compresses image data of each region using a selected encoding method
WO2003043306A1 (fr) * 2001-11-13 2003-05-22 Seiko Epson Corporation Dispositif et procede de conversion de couleurs, programme de modification de couleurs et support d'enregistrement.
US7424129B2 (en) * 2001-11-19 2008-09-09 Ricoh Company, Ltd Printing system with embedded audio/video content recognition and processing
EP1318665B1 (en) * 2001-12-06 2015-02-25 Canon Kabushiki Kaisha Image processing apparatus and method, program, and storage medium
US7221805B1 (en) * 2001-12-21 2007-05-22 Cognex Technology And Investment Corporation Method for generating a focused image of an object
US7027647B2 (en) * 2001-12-31 2006-04-11 Hewlett-Packard Development Company, L.P. Coder matched layer separation for compression of compound documents
US8103104B2 (en) * 2002-01-11 2012-01-24 Hewlett-Packard Development Company, L.P. Text extraction and its application to compound document image compression
US6941024B2 (en) * 2002-01-14 2005-09-06 Hewlett-Packard Development Company, L.P. Coder matched layer separation and interpolation for compression of compound documents
US7085422B2 (en) * 2002-02-20 2006-08-01 International Business Machines Corporation Layer based compression of digital images
US20040205568A1 (en) 2002-03-01 2004-10-14 Breuel Thomas M. Method and system for document image layout deconstruction and redisplay system
JP2003303346A (ja) 2002-04-09 2003-10-24 Nippon Telegr & Teleph Corp <Ntt> 目標追跡方法、目標追跡装置、目標追跡プログラム、並びにこのプログラムを記録した記録媒体
US7181086B2 (en) * 2002-06-06 2007-02-20 Eastman Kodak Company Multiresolution method of spatially filtering a digital image
US7085420B2 (en) 2002-06-28 2006-08-01 Microsoft Corporation Text detection in continuous tone image segments
US6987882B2 (en) * 2002-07-01 2006-01-17 Xerox Corporation Separation system for Multiple Raster Content (MRC) representation of documents
JP4194336B2 (ja) * 2002-07-25 2008-12-10 富士通マイクロエレクトロニクス株式会社 半導体集積回路、欠陥画素補正方法、及び画像プロセッサ
US6993185B2 (en) * 2002-08-30 2006-01-31 Matsushita Electric Industrial Co., Ltd. Method of texture-based color document segmentation
JP2004110606A (ja) 2002-09-20 2004-04-08 Pfu Ltd 画像処理装置及び方法並びにプログラム
US6918706B2 (en) * 2002-10-31 2005-07-19 Canon Kabushiki Kaisha Reducing a difference in picture quality between deteriorated and non-deteriorated images using a printing apparatus
US7400770B2 (en) * 2002-11-06 2008-07-15 Hrl Laboratories Method and apparatus for automatically extracting geospatial features from multispectral imagery suitable for fast and robust extraction of landmarks
US20040096102A1 (en) * 2002-11-18 2004-05-20 Xerox Corporation Methodology for scanned color document segmentation
US7079687B2 (en) * 2003-03-06 2006-07-18 Seiko Epson Corporation Method and apparatus for segmentation of compound documents
US7139433B2 (en) 2003-03-13 2006-11-21 Sharp Laboratories Of America, Inc. Compound image compression method and apparatus
US20040190028A1 (en) 2003-03-31 2004-09-30 Foster Thomas J. Post RIP image rendering in an electrographic printer in order to minimize electrophotographic process nonuniformities
US7330288B2 (en) 2003-03-31 2008-02-12 Eastman Kodak Company Post RIP image rendering in a MICR electrographic printer to improve readability
JP3984936B2 (ja) 2003-08-08 2007-10-03 キヤノン株式会社 撮像装置および撮像方法
US7483484B2 (en) * 2003-10-09 2009-01-27 Samsung Electronics Co., Ltd. Apparatus and method for detecting opaque logos within digital video signals
JP3775409B2 (ja) * 2003-10-29 2006-05-17 ブラザー工業株式会社 画像読取装置
US7912291B2 (en) * 2003-11-10 2011-03-22 Ricoh Co., Ltd Features for retrieval and similarity matching of documents from the JPEG 2000-compressed domain
JP4050220B2 (ja) 2003-11-21 2008-02-20 シャープ株式会社 画像処理方法及び画像処理装置並びに画像形成装置、プログラム、記録媒体
US7317829B2 (en) * 2003-12-12 2008-01-08 Microsoft Corporation Background color estimation for scanned images
CN100573439C (zh) 2004-01-06 2009-12-23 汤姆逊许可证公司 用于检测、分析和使用可见认证图样的改进技术
JP4182891B2 (ja) 2004-01-26 2008-11-19 富士ゼロックス株式会社 画像処理装置
US7379594B2 (en) * 2004-01-28 2008-05-27 Sharp Laboratories Of America, Inc. Methods and systems for automatic detection of continuous-tone regions in document images
US7343046B2 (en) * 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
SE0400325D0 (sv) 2004-02-13 2004-02-13 Mamea Imaging Ab Method and arrangement relating to x-ray imaging
US7324711B2 (en) * 2004-02-26 2008-01-29 Xerox Corporation Method for automated image indexing and retrieval
US7542082B2 (en) 2004-03-30 2009-06-02 Canon Kabushiki Kaisha Method and apparatus for correcting a defective pixel
EP1594308A1 (en) 2004-05-07 2005-11-09 Dialog Semiconductor GmbH Single line Bayer filter RGB bad pixel correction
EP1605403A1 (en) 2004-06-08 2005-12-14 STMicroelectronics S.r.l. Filtering of noisy images
JP2005354278A (ja) * 2004-06-09 2005-12-22 Seiko Epson Corp 撮像手段の撮像した画像の画像データを処理する画像データ処理
US7376265B2 (en) 2004-06-17 2008-05-20 Seiko Epson Corporation Segmentation-based hybrid compression scheme for scanned documents
US7324687B2 (en) 2004-06-28 2008-01-29 Microsoft Corporation Color segmentation-based stereo 3D reconstruction system and process
JP4166744B2 (ja) * 2004-10-18 2008-10-15 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
DE602005026862D1 (de) * 2004-12-21 2011-04-21 Canon Kk Segmentierung eines digitalen bildes und herstellung einer kompakten repräsentation
US7433513B2 (en) * 2005-01-07 2008-10-07 Hewlett-Packard Development Company, L.P. Scaling an array of luminace values
JP2006260401A (ja) 2005-03-18 2006-09-28 Toshiba Corp 画像処理装置、方法、およびプログラム
US7233867B2 (en) 2005-04-06 2007-06-19 General Electric Company Eddy current inspection method and system
KR101108435B1 (ko) 2005-05-31 2012-02-16 서강대학교산학협력단 의사윤곽 제거 방법 및 이 방법이 적용되는 디스플레이장치
JP2005353101A (ja) 2005-08-25 2005-12-22 Ricoh Co Ltd 画像特徴抽出方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US8630498B2 (en) 2006-03-02 2014-01-14 Sharp Laboratories Of America, Inc. Methods and systems for detecting pictorial regions in digital images
US8437054B2 (en) 2006-06-15 2013-05-07 Sharp Laboratories Of America, Inc. Methods and systems for identifying regions of substantially uniform color in a digital image
US20080310721A1 (en) 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image

Also Published As

Publication number Publication date
US8630498B2 (en) 2014-01-14
JP2007235953A (ja) 2007-09-13
US20070206857A1 (en) 2007-09-06

Similar Documents

Publication Publication Date Title
JP4340701B2 (ja) デジタル画像のテキストを識別する方法およびシステム
JP4266030B2 (ja) デジタル画像の領域を検知する方法およびシステム
US8744208B2 (en) Image binarization based on grey membership parameter of pixels
JP4745296B2 (ja) デジタル画像の領域分離方法および領域分離システム
JP4498422B2 (ja) 画素の分類方法および画像処理装置
JP4745430B2 (ja) デジタル画像のテキストの位置決定を行う方法およびシステム
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
JP4745297B2 (ja) デジタル画像における均一な色の領域を特定する方法およびシステム
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
JP4527127B2 (ja) デジタル画像の領域を検知するシステム
JP4522468B2 (ja) 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体
CN114897806A (zh) 缺陷检测方法、电子设备及计算机可读存储介质
CN111507344A (zh) 从图像中识别出文字的方法和装置
US6269186B1 (en) Image processing apparatus and method
JP4649498B2 (ja) 画像データの色補正方法及びシステム
US8472716B2 (en) Block-based noise detection and reduction method with pixel level classification granularity
JP4285640B2 (ja) オブジェクト識別方法および装置ならびにプログラム
CN117218672A (zh) 一种基于深度学习的病案文字识别方法及系统
Boiangiu et al. Local thresholding algorithm based on variable window size statistics
JP4285644B2 (ja) オブジェクト識別方法および装置ならびにプログラム
CN111739014B (zh) 基于图像处理的图像质量检测方法及相关装置
Vu Building extraction from high-resolution satellite image for tsunami early damage estimation
AU2007249099B2 (en) Block-based noise detection and reduction method with pixel level classification granularity
CN115984864A (zh) 电子卷宗处理方法及装置
CN118608845A (zh) 一种隐写图像分析方法和系统

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090210

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090212

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees