JP4416365B2 - スキャンした文書の自動式検出 - Google Patents

スキャンした文書の自動式検出 Download PDF

Info

Publication number
JP4416365B2
JP4416365B2 JP2001376710A JP2001376710A JP4416365B2 JP 4416365 B2 JP4416365 B2 JP 4416365B2 JP 2001376710 A JP2001376710 A JP 2001376710A JP 2001376710 A JP2001376710 A JP 2001376710A JP 4416365 B2 JP4416365 B2 JP 4416365B2
Authority
JP
Japan
Prior art keywords
background
sub
full page
region
statistic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001376710A
Other languages
English (en)
Other versions
JP2002208007A (ja
Inventor
ナガラヤン ラメッシュ
リ シン
ケイ ツェ フランシス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2002208007A publication Critical patent/JP2002208007A/ja
Application granted granted Critical
Publication of JP4416365B2 publication Critical patent/JP4416365B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/407Control or modification of tonal gradation or of extreme levels, e.g. background level
    • H04N1/4072Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original
    • H04N1/4074Control or modification of tonal gradation or of extreme levels, e.g. background level dependent on the contents of the original using histograms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Input (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、広くいえば、スキャンした文書に対して自動式背景(background)検出を行うことに関する。
【0002】
【従来の技術】
従来の自動式背景検出処理では、輝度(intensity)情報を収集して、スキャンしたイメージのヒストグラム(histogram)を生成する。この後、この処理では、上記ヒストグラムから背景ピークを確認し、該ピークを含む曲線を推定し、平均偏差および標準偏差を計算する。この後、この標準偏差を用いて、文書についての利得因子(gain factor)を決定する。この利得因子を用いて、スキャンした文書のイメージの背景濃度(background gray level)を補償する。この方法では、濃度ヒストグラムによって、背景値を容易に生成可能なイメージコントラストを、簡単に測定することができる。しかしながら、この背景値の精度が、この背景値を生成するヒストグラムの精度と同程度にすぎない、ということに留意しなくてはならない。したがって、スキャンしたイメージの背景レベルを決定するためにヒストグラムを生成する際には、文書領域内にあるそれらのピクセルのみを確実にサンプリングしなくてはならない。
【0003】
【発明が解決しようとする課題】
従来のシステムでは、背景検出は、文書のサブ領域(典型的にはリーディングエッジ(leading edge))内のピクセル値、または、文書全体(ページ)にわたるピクセル値のいずれかをサンプリングすることにより、実行される。これらの手法は、典型的には、スキャンした文書の実際の大きさおよび形状を反映しないであろう、スキャンしたイメージの大きさおよび形状を、事前に測定することに頼っている。よって、この事前の測定が、スキャンした文書の大きさおよび形状を正確に反映する際に、これらの手法によって適当な結果が生成される間においては、スキャンした文書が事前の測定によるもの(predetermined measure)と同一の大きさでなければ、または、スキャンした文書が、事前の測定が上記文書の背景以外の背景(例えば、圧胴(platen))を含むように配置されれば、これらの手法では、背景を正確に測定することができない。
【0004】
例えば、白色のまたはライトグレー(light gray)の圧胴カバーを有する圧胴から文書をスキャンすることを考える。スキャンしようとする文書が事前の測定によるもの(predetermined measure)より小さければ、生成されるヒストグラムは、文書の濃度値に加えて、白色の圧胴カバーに対応する濃度値を含むかもしれない。ヒストグラムに圧胴カバーが十分に含まれていれば、検出される背景値は不正確となろう。したがって、非文書エリアより取得した濃度情報と、文書の背景に対応する濃度情報と、を区別することが可能な背景検出処理を用いることが望ましい。このような処理を用いる際には、背景値は、非文書領域の濃度値ではなく文書の値を反映するので、印字装置からの出力コピーには、イメージ品質の損失が表現されない。
【0005】
【課題を解決するための手段】
本発明の一態様によれば、スキャンした文書についての背景統計値を生成する方法が提供される。この方法は、(a)文書エリア内で選択されたピクセルからフルページ背景統計値を決定する工程と、(b)上記文書エリアにおけるサブ領域内で選択されたピクセルからサブ領域背景統計値を決定する工程と、(c)上記サブ領域背景統計値が非文書エリアからのイメージデータに対応するかどうかを決定する工程と、(d)上記フルページ背景統計値が破損しているかどうかを決定する工程と、(e)上記フルページ背景統計値が破損していれば有効フルページ背景統計値を生成する工程と、を含む。
【0006】
本発明の別態様によれば、文書エリアからの濃度情報と非文書エリアからの濃度情報とを区別する背景統計値を生成する方法が提供される。この方法は、文書エリア内のピクセルからフルページ背景統計値を生成する工程と、上記文書エリアにおける第1サブ領域内のピクセルから第1サブ領域背景統計値を生成する工程と、上記文書エリアにおける第2サブ領域内のピクセルから第2サブ領域背景統計値を生成する工程と、上記第1サブ領域背景統計値が非文書エリアからの濃度値に対応するかどうかを決定する工程と、上記フルページ背景統計値が破損しているかどうかの第1決定を行い、上記フルページ背景統計値が破損していれば有効フルページ背景統計値を生成する工程と、第2サブ領域背景統計値が非文書エリアからの濃度値に対応するかどうかを決定する工程と、上記フルページ背景統計値が破損しているかどうかの第2決定を行い、上記フルページ背景統計値が破損していれば有効フルページ背景統計値を生成する工程と、を含む。
【0007】
【発明の実施の形態】
以下の説明では、高速スキャン検出および低速スキャン検出という文言を用いる。高速スキャン検出とは、走査線(scanline)またはラスタ(raster)に沿ってピクセルをスキャンすることをいう。これは、スキャニングが光電子センサのアレイからのイメージデータを収集することの結果であるので、大まかに電子スキャンともよばれる。一方、低速スキャンは、文書とスキャニングシステムとの間における相対的な動作方向のことをいう。これは、スキャニングシステムにイメージデータの走査線を生成させる機械的動作である。
【0008】
従来の背景検出手法では、スキャンしようとする文書が普通の文書または期待される文書の大きさおよび/または位置を正確に反映しない場合には、背景を正確に測定することができないかもしれない。かかる課題を解決するために、本発明は、非文書領域から得られる濃度情報と、文書の背景に対応する濃度情報とを区別する手法を提案する。本発明の手法では、予め設定したエリア(事前設定エリア)がスキャンした文書を正確に表現しない場合に圧胴を検出することができる、端のような予め設定したエリア内における1つ以上のサブ領域についてのヒストグラム情報だけでなく、標準的なフルページ文書(例えば、8.5×11サイズのA4等)の大きさおよび形状を定める事前設定エリアについてのヒストグラム情報をも収集する。ページ全体をスキャンした後、本手法では、サブ領域についてのヒストグラムを分析して、ヒストグラムのピーク値が圧胴カバーの濃度値内にあるかどうかを決定する。上記ピーク値が圧胴カバーの濃度値内にあれば、本手法では、上記フルページヒストグラムのピーク値を比較して、このピーク値がどちらかのサブ領域からのピーク値のしきい値範囲内にあるかどうかを決定する。フルページピークがどちらかのサブ領域ピークのしきい値範囲内にあれば、本手法では、フルページエリアにおける第1ピーク値の範囲を超えた検索を行い、別のピークを探す。
【0009】
ここで図1を参照するに、スキャンした文書のオリエンテーション(orientation)、および、本発明の議論に用いられるスキャンした文書内におけるサブ領域を表現した図が示されている。図1において、エリア10は、標準的なフルページ文書の大きさ、形状およびオリエンテーションを定める、事前設定エリアを表す。なお、ヒストグラムデータは、入力文書のスキャンを行う際にこのフルページ文書から収集される。圧胴からスキャンを行う際には、入力文書は、通常、この圧胴の左上角の(top left corner)(レジストレーションコーナー)に配置される。このオリエンテーションを用いると、入力文書が標準的なフルページ文書(エリア10)より小さければ、圧胴カバーは、この入力文書が高速スキャン方向20における事前設定エリアより小さい際には下端(bottom edge)に、または、この入力文書が低速スキャン方向22における事前設定エリアより小さい際には右端(right edge)にさらされる。よって、圧胴カバーに対応する濃度値情報と文書エリアの濃度値情報とを区別するために、本手法では、フルページエリア10に加えて、右端近くのサブ領域すなわちサンプルウィンドウ12、および、下端近くのサブ領域すなわちサンプルウィンドウ14についてのヒストグラムを収集する。さらには、詳細については後述するように、第2背景ピークの検出を援助するために、本手法では、文書の中央におけるサブ領域、すなわち、サンプルウィンドウ16からヒストグラム情報を収集する。
【0010】
サンプルウィンドウ12、14および16は、説明を目的として示したものであり、図1に示すような領域のみに限定されるものではない、ということに注意されたい。すなわち、サンプルウィンドウの1つ以上の任意の大きさ、形状および位置を、所定のアプリケーションについて、変更することができる。例えば、右端サンプルウィンドウ12を、下端サンプルウィンドウ14に隣接するように、下方に延長させることができる。加えて、サンプルウィンドウ12および14を互いに排他性を持ったものにする必要はない(すなわち、これら2つの領域は重なり合ってもよい)。さらには、サンプルウィンドウ12および14を結合させて1つのサンプルウィンドウとみなすことかできることを認識されたい。
【0011】
左上ハンドコーナー(hand corner)がレジストレーションコーナーを定めるような圧胴を参照して、本発明を説明しているが、他のレジストレーションポジションを用いてスキャンを行うように本発明を容易に適合させることが可能であることを認識されたい。
【0012】
ここで図2を参照するに、本発明にかかるスキャニング処理の一実施形態における工程を表すフロー図が示されている。工程100では、フルページ入力文書に対応する事前設定エリア10についてのスキャンしたイメージデータを用いて、ヒストグラムピーク値、標準偏差、文書についての利得因子や背景濃度値等のような、フルページ背景統計値を決定する。
【0013】
工程110では、サンプルウィンドウ12または14のような文書エリア10におけるサブ領域からのイメージデータを用いて、背景統計値を決定する。ここで、入力文書が予め設定した文書エリア(事前設定文書エリア)10と等価でなければ、圧胴カバーまたは他の非文書媒体が検出される。説明のために、ここでの処理については、サンプルウィンドウ12内のピクセルの上での動作として記載する。すなわち、工程110では、サンプルウィンドウ12に対応するビデオイメージデータにおけるピクセルを用いて、ヒストグラムピーク値、標準偏差、文書についての利得因子や背景濃度値等のような、背景統計値を生成する。
【0014】
工程120では、圧胴カバーが、サンプルウィンドウ12について生成された統計値において検出されるかどうかを決定する。具体的には、工程120では、ウィンドウ12について生成された背景統計値を、圧胴カバーについての統計値と比較する。ウィンドウ12からの統計値が圧胴カバー統計値に匹敵(comparable)しなければ、本処理は、圧胴カバーがウィンドウ12において検出されていないことを確定し、かつ、工程100で収集されたフルページ統計値がこの後の背景検出処理のために用いられる、工程130を引き続き実行する。サンプルウィンドウ12からの背景統計値が圧胴カバーの背景統計値に匹敵(comparable)すれば、工程120は、圧胴カバーがウィンドウ12において検出されていることを決定し、かつ、工程140を引き続き実行する。
【0015】
工程140では、工程100からのフルページ統計値が圧胴カバーについての対応する統計値と比較されて、フルページ統計値が圧胴カバーまたは他の非文書エリアに対応するイメージデータによって破損したかどうかの決定がなされる。フルページ統計値が圧胴カバー統計値のしきい値範囲内にあれば、本処理は、フルページ統計値が破損していると判断し、かつ、工程150における処理を引き続き実行する。フルページ統計値が圧胴カバー統計値のしきい値範囲内になければ、本処理は、フルページ統計値が有効であると判断し、かつ、工程130を引き続き実行する。工程150では、本処理は、フルページ統計値を分析して、有効(validated)フルページ統計値を生成する。
【0016】
図3は、図2における工程100で実行される、スキャンしたイメージデータからフルページ背景統計値を生成する処理を、より詳細に示している。この処理では、工程101は、始動して、スキャンしたエリア10内からのイメージ値より、ヒストグラムを生成する。より詳細には、工程101では、ヒストグラムデータの収集元となるであろう、スキャンしたエリア10を確認する。工程101は、さらに、エリア10内のすべてのピクセルが必ずしもヒストグラム生成の際に用いられないのであれば、サンプリングしようとするエリア内のピクセルのサブセットを確認する。工程103では、文書エリア10からのスキャンしたイメージデータ内で選択されたピクセルから、ヒストグラムデータが収集される。工程105は、工程103で収集されたヒストグラムデータから、フルページ背景ピークPfおよび標準偏差Sfを決定する。ピークPfおよび標準偏差Sfからの利得因子のような付加的な統計値を生成するために、工程107を含めることができる。本明細書で用いられるように、ピークPfすなわちピーク値Pfは、このピークを含むヒストグラム2進数(histogram bin)における2進数(濃度値)を確認する。
【0017】
簡潔に述べると、文書の背景値を決定するための従来の手法では、文書エリア内で選択されるピクセルからのイメージ輝度値のヒストグラムを作り上げる。ヒストグラムデータを取得すると同時に、背景ピークおよび白色しきい値が決定される。背景ピーク値は、スキャンしようとするイメージの背景(白色)値に関連した輝度を持った、最大数のピクセルを有する濃度値である。
【0018】
一旦ヒストグラムデータが作り上げられると、各2進数値は、特定の濃度値(2進数値は8ビットシステムについては0〜255の範囲をとる)と関連付けられ、高輝度(白色)の2進数〜低輝度(黒色)の2進数値から読み取られる。各2進数でのピクセル数(頻度)は、第1ピークを検出するために、現在格納されている最大値と比較される。さらに、小さなピークを背景として誤って認識することを防ぐために、濃度2進数の頻度、および/または、ピークの濃度値を、しきい値と比較することができる。さらには、一旦ピークがヒストグラムにおいて検出されれば、ヒストグラムデータの検索では、隣接するより大きなピークを探索する。谷に遭遇することなくより大きなピークが検出されれば、この大きなピークは、背景ピークに指定される。
【0019】
背景ピークが認識されたので、ヒストグラム分布における中間点またはピーク点からの標準偏差が決定される。1つの方法としては、ヒストグラムの近似的な形状は、最高発生頻度を有する2進数における頻度値、最高発生頻度を有する2進数における各側の2進数における頻度値を含む、少なくとも3点を通る曲線を定めることにより、推定される。この後、ヒストグラム分布曲線の標準偏差を既知の方法により決定することができる。あるいは、3つ以上のサンプル点を曲線に適合させ、かつ、この結果を正規分布に近似化するのではなく、サンプル点の重み付け平均を用いて、平均値を決定することができる。計算された平均カン(can)を有し、かつ、正規分布を仮定して、標準偏差を従来の方法により取得することができる。
【0020】
あるいは、典型的なヒストグラム分布は、ほとんど正規ガウス分布に似ているので、1/4ピーク値を決定することにより、ヒストグラムにおいて平均値(ピーク)からの2つのシグマ点の適当な推定値が表現される。別言すれば、ピーク頻度の1/4以下の頻度を有する濃度は、ヒストグラム分布における平均値またはピーク点から離れた2つの標準偏差である点を表す。あるいは、1/4ピーク頻度の位置を決定できなければ、背景ピークのピーク頻度の5/8に等しいピーク頻度を有する濃度値を、ヒストグラムにおける平均値またはピーク値から離れた1つの標準偏差である濃度値を認識する際に、用いることができる。
【0021】
ヒストグラムデータはノイジー(noisy)となる傾向があるので、データの平滑化を行うことは効果的である。ヒストグラムに対して平滑化を行う1つの手法では、N個の隣接する2進数における頻度を加算し、加算値をNで割り、かつ、この結果を新しい2進数に配置する。N=4とした場合におけるこの方法では、256の2進数を有するヒストグラムは、64の2進数のヒストグラムに圧縮される。最終的には、一旦標準偏差が得られれば、この標準偏差は、背景濃度値を決定付ける利得因子を決定するために用いられる。
【0022】
図4は、図2の工程110で実行される、スキャンしたイメージデータからのサブ領域から背景統計値を生成する処理を、より詳細に示している。この処理では、工程111は、始動して、文書エリア10内の少なくとも1つのサブ領域(例えばサンプルウィンドウ12または14)からのイメージ値から、ヒストグラムを生成する。より詳細には、工程111では、サンプリングしようとする多数の走査線により定められるような、サンプルしようとするサンプルウィンドウ、サンプリングの前に低速スキャン方向にスキップされる多数の先行走査線(leading scanline)、サンプリング開始前に高速スキャン方向にスキップするための多数の先行ピクセル、および、サンプルしようとする走査線内の多数のピクセルを認識することができる。さらには、サンプルウィンドウにおけるピクセル数がヒストグラムバッファの容量より大きい場合には、工程111では、選択されたピクセルを認識するか、または、工程113で処理しようとするサンプルウィンドウ内のサブサンプルウィンドウを生成する。
【0023】
工程113では、ヒストグラムデータが、認識されたサンプルウィンドウからのスキャンしたイメージデータ内のピクセルから収集される。工程115では、工程113で収集したヒストグラムデータから、サンプルウィンドウヒストグラムピークPsおよび標準偏差Ssを決定する。PsおよびSsに基づく利得因子および背景濃度のような背景統計値をさらに生成する際に、工程117を含めることができる。
【0024】
図5は、図2の工程150で実行される、検査済みフルページ背景統計値の生成を、より詳細に示すフロー図である。この処理において、工程151では、第1ページピークを再度検索(looking back)することにより、工程100で収集したフルページヒストグラムデータから、新しいフルページ背景統計値(例えばピークP'f)を決定する。すなわち、工程151では、上述したものと同様の方法によりピークP'fを認識し、ピークPfの輝度より低い(黒い)輝度を関連付けられた濃度を有する2進数値を検索し始める。新しいページピークP'fは認識されているので、工程151では、標準偏差を認識し、必要となるかもしれない任意の背景統計値をさらに生成する。
【0025】
工程153では、新しいフルページ背景統計値(例えばピークP'f)を1つ以上のしきい値と比較して、新しい統計値が有効であるかどうかを決定する。このしきい値は、具体的には、圧胴カバーまたは文書イメージよりも、新しい背景ピークP'fの方が、文書背景に関連しそうであることを確実とするように、選択される。新しい背景統計値がしきい値内にあれば、この新しい統計値は有効な統計値とされ、処理は、新しい背景統計値(例えばピークP'f)がこの後の背景検出処理のために用いられる工程155を引き続き実行する。あるいは、工程153において、新しい背景統計値がしきい値範囲外にあることが分かれば、処理は、新しい有効な統計値が生成されなかったことを確定し、工程157を引き続き実行する。工程157では、処理は、この後の背景検出処理のために用いられる有効化統計値のような、工程100で収集したフルページ統計値を再度検索する。
【0026】
好ましい実施形態では、工程153で用いたしきい値は、サンプルウィンドウ16を含む1つ以上のサブ領域から収集したヒストグラムデータからだけでなく、フルページヒストグラムデータから生成された背景統計値に基づいている。この実施形態では、工程110では、2つのサブ領域(例えばサンプルウィンドウ12または14だけでなくサンプルウィンドウ16)についての背景統計値を生成する必要があろう。
【0027】
具体的には、上記実施形態によれば、文書エリアの1つのサブ領域についての第1サンプルウィンドウ(例えばウィンドウ12)、および、第2サブ領域についての第2サンプルウィンドウ(例えばウィンドウ16)を確認するために、工程110が変更されよう。第1サンプルウィンドウおよび第2サンプルウィドウのそれぞれについては、サンプリングしようとする多数の走査線、サンプリング前に低速スキャン方向にスキップされる多数の先行走査線、サンプリング開始前に高速スキャン方向にスキップするための多数の先行ピクセル、および、サンプリングしようとする走査線内の多数のピクセル、により、定めることができる。さらには、変更させた工程110は、第1サンプルウィンドウ内のピクセルからの第1ヒストグラム、および、第2サンプルウィンドウ内のピクセルからの第2ヒストグラムを生成する。
【0028】
以下、図2〜図5に示したような本発明の一実施形態に基づいて、非文書エリアの濃度値を文書エリアの濃度値から分離する、スキャンしたイメージの背景値を認識するための処理についての詳細例を説明する。この詳細例の説明に用いる背景統計値は、ピクセル輝度値の統計値、ヒストグラムから決定される背景ピーク、および、ピーク値の標準偏差である。
【0029】
この例では、ヒストグラムデータが、文書エリア10内、右端近くのサブ領域(サンプルウィンドウ12)内、および、文書の中央におけるサブ領域(サンプルウィンドウ16)内、における選択されたピクセルから収集され、かつ、イメージ値のヒストグラムが、これら3つの領域のそれぞれについて生成される。ヒストグラムは生成されているので、本処理では、各ヒストグラムについて背景ピーク値および標準偏差を決定する。すなわち、工程100では、文書エリア10から作り上げたヒストグラムより、フルページ背景ピーク値Pfおよび標準偏差Sfを決定する一方、ウィンドウ12より作り上げたヒストグラムから右端背景ピーク値Prおよび標準偏差Sr、ならびに、ウィンドウ16より作り上げたヒストグラムから中央背景ピーク値Pcおよび標準偏差Scが工程110で生成される。
【0030】
ピーク値は決定されているので、工程120では、圧胴カバーがサンプルウィンドウ12について作り上げた右端ヒストグラムにおいて検出されるかどうかを決定する。すなわち、工程120では、ウィンドウ12について生成された背景統計値が、圧胴カバーのような非文書エリアからのイメージデータに対応するかどうかを決定する。この決定は、右端ヒストグラムが圧胴カバーについてのヒストグラムに対応するかどうかを確かめることにより実現される、という点で有益である。具体的には、右端ピーク値Prは、圧胴カバーについて期待される最高および最低のうどちにより定められる範囲と比較される。また、標準偏差Srは、圧胴カバーの平均的濃度についての最大標準偏差と比較される。数学的には、これらの比較は、以下の式により与えられる。
【0031】
PClow<Pr<PChigh (1)
Sr<Max_Std_Dev (2)
ここで、PCLOWは、圧胴カバーについての最低濃度値であり、PCHIGHは圧胴カバーについての最高濃度値であり、Max_Std_Devは圧胴カバーの平均濃度の最大標準偏差である。PCLOW、PCHIGHおよびMax_Std_Devについての値については、キャリブレーション技術により決定することができる。白色圧胴カバーを有するあるシステムでは、PCLOW、PCHIGHおよびMax_Std_Devは、それぞれ、210、230および2.5であることが分かっている。
【0032】
方程式(1)および(2)により与えられる条件のうちのいずれか一方が満たされなければ、本処理では、圧胴カバーが右端ヒストグラムで検出されていいないと決定する。すなわち、右端ピークPrが圧胴カバーについての濃度値の範囲内にないので、および/または、標準偏差Srが、ピークが圧胴カバーに起因すれば得られると期待されるであろう標準偏差より大きいので、本処理では、圧胴カバーがウィンドウ12内で検出されなかったと確定する。上述したように、カバーがウィンドウにおいて検出されなければ、処理は、スキャンしたイメージについての総利得の決定を、フルページピークPf(工程130)を用いて引き続き実行する。しかしながら、方程式(1)および(2)により与えられる条件の両方が満たされれば(すなわち、右端ピークPrが圧胴カバーについての濃度値の範囲内にあり、標準偏差Srが圧胴カバーの標準偏差と同様であれば)、本処理では、圧胴カバーがウィンドウ12に現われたと判定する。
【0033】
上述したように、圧胴カバーがサブ領域内で検出されれば、本処理では、フルページピーク値は圧胴カバーによって破損されているかどうかを決定する。これを達成するために、本処理は、右端ピークを有するフルページ背景ピーク値Pfを比較する、という点で有益である。具体的には、本処理では、フルページピーク値が、ウィンドウ12より作り上げたヒストグラムから認識される背景ピーク内に含まれるかどうかを決定する。この比較については、次に示す式により表現することができる。
【0034】
(Pr−MSr)<Pf<(Pr+MSr) (3)
ここで、Mは、0より大きい定数、好ましくは2である。
【0035】
すなわち、フルページピークPfが右端ピークの2つのシグマ内に含まれれば、本処理では、フルページヒストグラムが圧胴カバーによって破損されており、この結果として、フルページピークPfが誤って計算されている、と判断する。一方、フルページピークPfが右端ピークの2つのシグマ内になければ、本処理では、フルページヒストグラムおよびフルページピークPfは圧胴カバーによって何ら影響を受けていないとみなし、フルページヒストグラムおよびピークPfを用いて総利得(工程130)を決定する。
【0036】
本処理において、フルページ統計値が圧胴カバーによって破損していると判断すれば、フルページヒストグラムを分析して、有効化フルページ背景ピークを生成する。上述したように、有効化フルページ背景ピークの生成は、第1ページピークを再検索することにより、工程100で収集したフルページヒストグラムデータから新しいフルページピークP'fを認識することから始まる。すなわち、新しいピークP'fは、ピークPfの輝度より低い(黒い)輝度を有する2進数値(濃度値)からのピークを含む。
【0037】
新しいフルページピークP'fは認識されているので、この新しいピークを、サンプルウィンドウ16から収集したヒストグラムデータから生成された背景統計値に基づくしきい値と比較して、このP'fが有効であるかどうかを決定する。新しいピークP'fが、有効であるということは、右端ピークPr未満の少なくとも2つのシグマであり、かつ、ピークPfの最小頻度に基づく最小頻度を有している、という点で有益である。加えて、新しいピークが背景ピークであるということを確実にするためには、この新しいピークP'fは、文書の中央(ウィンドウ16)から決定されるようなスキャンした文書について取得することができた最小背景ピークより、大きくなくてはならない。すなわち、新しいピークP'fの有効性は、次に示す条件を用いて決定される、という点で有益である。
【0038】
P'f<(Pr−MSr) (4)
(Pc−MSc)<P'f (5)
P'f(count)>NPf(count) (6)
ここで、Pf(count)は、ピーク2進数の頻度(ピーク2進数におけるピクセルの数)であり、P'f(count)は新しいピーク2進数の頻度であり、Mは、0より大きい定数、好ましくは2であり、Nは、0と1との間の定数である。
【0039】
方程式(4)、(5)および(6)により与えられた条件のそれぞれが満たされれば、本処理では、新しい有効な背景ピークが認識されたことを確定する。すなわち、新しい背景ピークP'fは有効なピークであるとされ、処理は、この新しい背景ピークP‘fを、スキャンした文書についての全利得の計算のようなこの後の背景検出処理のために用いられる有効化ピークとして、継続する。一方、方程式(4)、(5)および(6)のうち1つ以上の条件が満たされなければ、本処理は、有効なピークが確認されていない(すなわち、新しいピークP'fは有効でない)と確定し、全利得の計算に用いた有効ピークとして工程100で以前に収集したフルページピークPfを再検索する。
【0040】
図6を参照するに、非文書エリアから取得した濃度情報が背景の決定に含まれているかどうかを決定するために、2つのサブ領域から収集した情報を用いる処理を示すフロー図が示されている。図6に示す処理は、ヒストグラムデータを収集し、かつ、文書エリア10、ウィンドウ12、ウィンドウ14およびウィンドウ16を含む、複数の領域のそれぞれからヒストグラムを計算する工程200から始まる。ヒストグラムは作り上げられているので、この後、本処理では、工程210において、各ヒストグラムについての背景ピーク値および標準偏差を決定する。すなわち、工程210は、文書エリア10より作り上げたヒストグラムから、フルページ背景ピーク値Pfおよび標準偏差Sfを決定し、ウィンドウ12より作り上げたヒストグラムから、右端背景ピーク値Prおよび標準偏差Srを決定し、ウィンドウ14より作り上げたヒストグラムから下端ピーク値Pbおよび標準偏差Sbを決定し、ウィンドウ16より作り上げたヒストグラムから中央背景ピーク値Pcおよび標準偏差Scを決定する。
【0041】
工程220では、本処理では、圧胴カバーがサンプルウィンドウ12について作り上げた右端ヒストグラムにおいて検出されるかどうかを決定する。すなわち、工程120では、ウィンドウ12について生成された背景統計値が、圧胴カバーのような非文書エリアからのイメージデータに対応するかどうかを決定する。この決定は、右端ヒストグラムが圧胴カバーについてのヒストグラムに対応するかどうかを確認することにより実行される、という点で有益である。この決定については、方程式(1)および(2)で与えられる関係を用いて上述したものと同じ方法により実行することができる。上述したように、方程式(1)および(2)により与えられる条件のうちのいずれか一方が満たされなければ、本処理では、圧胴カバーが右端ヒストグラムにおいて検出されていないと決定する。カバーがウィンドウ12において検出されなければ、本処理では、後に詳述する工程250において、圧胴カバーが下端ヒストグラムで検出されるかどうかを決定する。しかしながら、方程式(1)および(2)により与えられる条件の両方が満たされれば、本処理は、圧胴カバーがウィンドウ12に現れたと確定し、かつ、フルページピーク値が圧胴カバーによって破損しているかどうかの決定がなされる工程230を引き続き実行する。
【0042】
フルページピーク値が破損しているかどうかの決定は、方程式(3)により与えられる関係を用いて上述したものと同じ方法により実行される。具体的には、本処理では、フルページ背景ピーク値Pfを右端ピークと比較して、フルページピークPfが右端ピークPrの2つのシグマ(2Sr)内に含まれるかどうかを決定する。フルページピークPfが右端ピークPrの2つのシグマ内に含まれなければ、フルページヒストグラムおよびフルページピークPfは圧胴カバーによって影響を受けていないとみなされ、本処理では、フルページヒストグラムおよびピークPfを用いて、全利得を決定する(工程260)。
【0043】
あるいは、フルページピークが右端ピークの2つのシグマ内に含まれるのであれば、フルページヒストグラムおよびフルページピークPfは、圧胴カバーのような非文書エリアからのイメージデータによって、破損しているかもしれない。この場合には、本処理では、工程240において、有効フルページピークを生成する。工程240は、上述した工程150と同じ方法で動作する。すなわち、新しいフルページピークP'fは、第1ページピークを再度検索することにより工程200で収集したフルページヒストグラムデータから確認される。次に、新しいフルページピークP'fの有効性が、方程式(4)、(5)および(6)により与えられる条件に基づいて決定される。
【0044】
方程式(4)、(5)および(6)により与えられる条件のそれぞれが満たされれば、新しい背景ピークP'fは有効ピークとされ、本処理は、工程290における新しい背景ピークP'fを用いた全利得の計算のような背景統計値の生成を引き続き実行する。一方、方程式(4)、(5)および(6)の条件のうち1つでも満たされなければ、本処理では、新しいピークP'fが有効でないと確定し、かつ、工程290における全利得の計算に用いられる有効ピークのような、工程200および210において生成されたピークPf、および、フルページヒストグラムを再度検索する。
【0045】
工程250では、圧胴カバーが、ウィンドウ14について作り上げた下端ヒストグラムにおいて検出されるかどうかを決定する。この決定は、下端ヒストグラムが圧胴カバーについてのヒストグラムに対応するかどうかを確認することにより実行される、という点で有益である。この決定については、右端ヒストグラムにおいて圧胴カバーを検出するために用いたものと同様の方法により実行することができる。具体的には、下端ピーク濃度値Pbは、圧胴カバーについて期待される最高および最小濃度値と、圧胴カバーの平均濃度についての最大標準偏差と比較した下背景ピークの標準偏差Sbと、により定められる範囲と比較される。すなわち、工程250では、次に示す条件が満たされるかどうかを決定する。
【0046】
PClow<Pb<PChigh (7)
Sb<Max_Std_Dev (8)
(7)および(8)により与えられる条件が両方とも満たされれば(すなわち、下端ピークPbが圧胴カバーについての濃度値の範囲内にあり、かつ、標準偏差Sbが圧胴カバーの標準偏差と同様であれば)、本処理は、圧胴カバーがウィンドウ14に現われたとみなし、かつ、工程270を引き続き実行する。一方、方程式(7)および(8)の条件のうち一方が満たされなければ、圧胴カバーはウィンドウ14に現れず、処理は工程260に移行する。工程260では、フルページヒストグラムを用いた全利得、ならびに、工程200および工程210で生成されるピークPfのような、背景統計値を生成する。
【0047】
工程270では、フルページピークが破損しているかどうかを決定する。この決定は、工程230におけるものと同様の方法によりなされる。しかしながら、フルページピークを右端ピークと比較するのではなく、工程270では、フルページピークPfが下端ピークPbの2つのシグマ(2Sb)内に含まれるかどうかを決定する。すなわち、工程270では、次に示す条件が満たされるかどうかを決定する。
【0048】
(Pb−MSb)<Pf<(Pb+MSb) (9)
ここで、Mは、0より大きい定数、好ましくは2である。
【0049】
フルページピークPfが下端ピークPbの2つのシグマ内に含まれなければ、フルページヒストグラムおよびフルページピークPfは、圧胴カバーにより影響を受けていないとみなされ、本処理では、フルページヒストグラムおよびピークPfを用いて、全利得を決定する(工程260)。方程式(9)の条件が満たされれば、フルページヒストグラムおよびフルページピークPfは圧胴カバーからのイメージデータによって破損しているかもしれない。この場合には、本処理では、工程280において有効フルページピークを生成する。
【0050】
工程280は、工程240におけるものと同様の方法により動作する。すなわち、新しいフルページピークP'fが、第1ページピークを再度検索することにより工程200で収集されたフルページヒストグラムデータから確認される。次に、新しいフルページピークP'fの有効性は、次に示す条件に基づいて決定される。
【0051】
P'f<(Pb−MSb) (10)
(Pc−MSc)<P'f (11)
P'f(count)>NPf(count) (12)
ここで、Mは、0より大きい定数、好ましくは2であり、Nは、0と1との間の定数であり、0.15と0.35との間であれば有益である。
【0052】
方程式(10)(11)および(12)により与えられる条件のそれぞれが満たされれば、新しい背景ピークP'fは有効ピークとみなされ、本処理は、工程290における新しい背景ピークP'fを用いた全利得の計算のような背景の生成を引き続き実行する。一方、方程式(10)、(11)および(12)により与えられる条件のうち1つでも満たされなければ、本処理では、有効なピークが確認されなかったとみなし、かつ、工程290における全利得の計算のために用いられる有効ピークのような、工程200および工程210で生成されたピークPfおよびフルページヒストグラムを、再度検索する。
【0053】
要約すれば、本発明は、非文書エリアから得られる濃度情報と、文書の背景に対応する濃度情報とを区別する、スキャンしたイメージの背景値を決定する方法を提供する。この方法では、標準的なフルページ文書の大きさおよび形状を定める事前設定エリアについてのヒストグラム情報に加えて、事前設定エリアがスキャンしたイメージを正確に表現しない場合に非文書エリアからの濃度データを収集することができる事前設定エリア内、の1つ以上のサブ領域についてのヒストグラム情報をも収集する。本方法では、サブ領域についてのヒストグラムを分析して、ヒストグラムにおけるピーク値が圧胴カバーの濃度値内にあるかどうかを決定する。ヒストグラムにおけるピーク値が圧胴カバーの濃度値内にあれば、本手法では、フルページエリアにおけるピーク値を比較して、このピーク値がいずれかのサブ領域からのピーク値のしきい値範囲にあるかどうかを決定する。フルページピークがしきい値範囲内にあれば、本手法では、フルページエリアにおける第1ピーク値の範囲を超えて検索し、第2の、有効な背景ピークを見つけられるかどうかを決定する。
【図面の簡単な説明】
【図1】スキャンした文書のオリエンテーション、および、本発明の議論に用いられる文書エリア内のサブ領域を示す図
【図2】本発明の概念に基づいて非文書エリアからの濃度情報が文書背景値の決定に含まれるかどうかを決定するための処理を示すフロー図
【図3】本発明の概念に基づいてフルページ背景統計値を生成するための方法を示す図
【図4】本発明の概念に基づいて文書エリアにおけるサブ領域についての背景統計値を生成する方法を示す図
【図5】本発明の概念に基づいて有効フルページ背景統計値を生成するための方法を示すフロー図
【図6】本発明の概念に基づいて、非文書エリアより取得した濃度情報が背景の決定に含まれるかどうかを決定する際に、2つのサブ領域から収集した情報を用いる方法を示す図。
【符号の説明】
10 エリア
12、14、16 サンプルウィンドウ
20 高速スキャン方向
22 低速スキャン方向

Claims (6)

  1. スキャンした文書について背景統計値を生成する方法であって、
    (a)文書エリア内で選択されたピクセルからフルページ背景統計値を決定する工程であって、当該フルページ背景統計値が、フルページ入力文書に対応する所定の領域(10)について走査された画像データを用いることによって計算され、当該フルページ背景統計値が、文書及び背景グレイ・レベルに対する、ヒストグラム・ピーク値、標準偏差、ゲイン・ファク夕、を含むものであり、
    (b)前記文書エリアにおけるサブ領域内で選択されたピクセルからサブ領域背景統計値を決定する工程であって、当該サブ領域背景統計値が、サンプル・ウィンドウ(12)に対応する画像データ内の画素を用いて計算され、
    (c)前記サブ領域背景統計値が非文書エリアからのイメージデータにおける濃度値の範囲に対応するかどうかを決定する工程と、
    (d)前記サブ領域背景統計値が非文書エリアからのイメージデータにおける濃度値の範囲に対応する場合において、前記フルページ背景統計値が破損しているかどうかを決定する工程であって、
    フルページ背景統計値と非文書エリアに対する対応する統計値を比較することによって、もし、フルページ背景統計値が非文書エリアに対する対応する統計値のスレッシュホールド範囲内にあると判断されるならば、前記フルページ背景統計値が、破損していると決定され、
    (e)前記フルページ背景統計値が破損していれば有効フルページ背景統計値を生成する工程であって、
    当該有効フルページ背景統計が、
    (e1)フルページヒストグラムデータから、新しいページ背景統計値を決定し、
    (e2)新しいフルページ背景統計値を、1つあるいはそれより多いスレッシュホールドと比較して、新しいフルページ背景統計値が有効か否かを決定し、
    (e3)もし、新しい背景統計値が、スレッシュホールド内にあるならば、新しい背景統計値が、有効なフルページ背景統計値であると決定し、
    (e4)もし、新しい背景統計が、スレッシュホールド範囲の外側にあると判断されるならば、有効なフルページ背景統計値として、フルページ背景統計値を用いる、
    サブ工程によって計算される、
    工程を具備することを特徴とする方法。
  2. 前記サブ領域背景統計値はサブ領域ヒストグラムを含み、かつ、前記工程(c)は、前記サブ領域ヒストグラムが非文書エリアについてのヒストグラムに対応するかどうかを確認することを特徴とする請求項1に記載の方法。
  3. 前記サブ領域背景統計値はサブ領域背景ピークPsを含み、かつ、
    前記工程(c)は、
    (c1)前記サブ領域ピークPsを前記非文書エリアについての濃度値の範囲と比較する副工程と、
    (c2)前記サブ領域ピークPsが前記非文書エリアについての濃度値の前記範囲内にある際に、前記サブ領域背景統計値が非文書エリアからのイメージデータに対応していると確定する副工程と、
    を具備することを特徴とする請求項1に記載の方法。
  4. 前記工程(c)は、(c3)サブ領域背景ピークの標準偏差Ssを、前記非文書エリアについての背景ピークの標準偏差と比較する副工程を具備し、
    前記副工程(c2)は、サブ領域ピークPsが両方とも非文書エリアについての濃度値の前記範囲内にあり、かつ、前記標準偏差Ssが前記非文書エリアについての背景ピークの前記標準偏差未満である際に、前記サブ領域背景統計値が前記非文書エリアからのイメージデータに対応していると確定することを特徴とする請求項3に記載の方法。
  5. 前記フルページ背景統計値はフルページピークPfを含み、前記サブ領域背景統計値はサブ領域ピークPsを含み、前記工程(d)における比較は、(Ps−MSs)<Pf<(Ps+MSs)により与えられ、Ssは前記サブ領域ピークPsの標準偏差であり、かつ、Mは0より大きい定数であることを特徴とする請求項1に記載の方法。
  6. スキャンした文書についての背景統計値を生成する方法であって、
    (a)文書エリア内で選択されたピクセルからフルページ背景統計値を生成する工程であって、当該フルページ背景統計値が、フルページ入力文書に対応する所定の領域(10)に対する、走査された画像データを用いることによって計算され、当該フルページ背景統計値が、文書及び背景グレイ・レベルに対する、ヒストグラムピーク値、標準偏差、ゲイン・ファクタを含み、
    (b)前記文書エリアにおける第1サブ領域内のイメージデータから第1サブ領域背景統計値を生成する工程であって、当該第1のサブ領域背景統計値が、文書の当該第1のサブ領域をカバーするサンプル・ウィンドウ(12)に対応する画像データ内の画素を用いて計算され、
    (c)前記文書エリアにおける第2サブ領域内のイメージデータから第2サブ領域背景統計値を生成する工程であって、当該第2のサブ領域背景統計値が、文書の当該第2サブ領域をカバーするサンプル・ウィンドウ(12)に対応する画像データ内の画素を用いて計算され、
    (d)前記第1サブ領域背景統計値が非文書エリアからのイメージデータにおける濃度値の範囲に対応するかどうかを決定する工程と、
    (e)前記第1サブ領域背景統計値が非文書エリアからのイメージデータにおける濃度値の範囲に対応する場合において、
    前記フルページ背景統計値が破損しているかどうかを、前記第1サブ領域背景統計値に基づいて決定し、前記フルページ背景統計値が破損していれば、有効フルページ背景統計値を生成する工程であって、フルページ背景統計値と、前記第1サブ領域背景統計値についての対応する統計値を比較することによって、もし、フルページ背景統計値が、前記第1のサブ領域背景統計値のスレッシュホールド範囲内にあると判断されるならば、前記フルページ背景統計値が破損していると決定され、
    (f)前記第2サブ領域背景統計値が非文書エリアからのイメージデータにおける濃度値の範囲に対応しているかどうかを決定する工程と、
    (g)前記第2サブ領域背景統計値が非文書エリアからのイメージデータにおける濃度値の範囲に対応している場合において、
    前記フルページ背景統計値が破損しているかどうかを、前記第2サブ領域背景統計値に基づいて決定し、前記フルページ背景統計値が破損していれば、有効フルページ背景統計値を生成する工程であって、前記フルページ背景統計値と、前記第2のサブ領域背景統計値に対する対応する統計値を比較することによって、もし、前記フルページ背景統計値が、前記第2のサブ領域背景統計値のスレッシュホールド内にあると判断されるならば、前記フルページ背景統計値が破損していると決定され、そして、
    前記有効フルページ背景統計値が、
    (e1) 前記フルページ背景統計値から、新しいフルページ背景統計値を決定し、
    (e2)新しいフルページ背景統計値を、1つあるいはそれより多くのスレッシュホールドと比較して、当該新しいフルページ背景統計値が有効か否かを決定し、
    (e3)もし、新しいフルページ背景統計値が、スレッシュホールド内にあるならば、新しいフルページ背景統計値を、前記有効化されたフルページ背景統計値として決定し、
    (e4)もし、新しいフルページ背景統計値が、前記スレッシュホールド範囲外にあると判断されるならば、前記フルページ背景統計値を、有効化されたフルページ背景統計値として用いる、
    サブ工程によって計算される、
    工程を具備することを特徴とする方法。
JP2001376710A 2000-12-18 2001-12-11 スキャンした文書の自動式検出 Expired - Fee Related JP4416365B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/739405 2000-12-18
US09/739,405 US6674899B2 (en) 2000-12-18 2000-12-18 Automatic background detection of scanned documents

Publications (2)

Publication Number Publication Date
JP2002208007A JP2002208007A (ja) 2002-07-26
JP4416365B2 true JP4416365B2 (ja) 2010-02-17

Family

ID=24972140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001376710A Expired - Fee Related JP4416365B2 (ja) 2000-12-18 2001-12-11 スキャンした文書の自動式検出

Country Status (7)

Country Link
US (1) US6674899B2 (ja)
EP (1) EP1215884B1 (ja)
JP (1) JP4416365B2 (ja)
BR (1) BR0106160B1 (ja)
CA (1) CA2365001C (ja)
DE (1) DE60141739D1 (ja)
MX (1) MXPA01013064A (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4085580B2 (ja) * 2001-02-20 2008-05-14 富士ゼロックス株式会社 画像処理装置
US7116826B2 (en) * 2001-06-15 2006-10-03 Canon Kabushiki Kaisha Embedding with error-correction encoding
US7058222B2 (en) * 2001-12-20 2006-06-06 Xerox Corporation Automatic background detection of scanned documents
US20030128873A1 (en) * 2002-01-07 2003-07-10 Barry Bronson Imaging system and method for generating a digital image file
JP4046016B2 (ja) * 2003-06-04 2008-02-13 セイコーエプソン株式会社 画像データ処理装置及び画像データの処理方法
US6965746B2 (en) * 2003-06-17 2005-11-15 Xerox Corporation Hybrid electrophotographic development with toner induction charged via AC induced conductivity
KR100750112B1 (ko) * 2003-11-03 2007-08-21 삼성전자주식회사 입체물 스캔 장치 및 방법
US7421143B2 (en) * 2004-06-01 2008-09-02 Xerox Corporation Systems and methods for optimal dynamic range adjustment of scanned images
US20050265600A1 (en) * 2004-06-01 2005-12-01 Xerox Corporation Systems and methods for adjusting pixel classification using background detection
US20060039627A1 (en) * 2004-08-21 2006-02-23 Xerox Corporation Real-time processing of grayscale image data
US7515772B2 (en) * 2004-08-21 2009-04-07 Xerox Corp Document registration and skew detection system
US20060098243A1 (en) * 2004-11-08 2006-05-11 Lexmark International, Inc. Determining a gray background value and/or skew of a scanned document
US20060165292A1 (en) * 2005-01-26 2006-07-27 Xerox Corporation. Noise resistant edge detection
US20060268365A1 (en) * 2005-05-27 2006-11-30 Lexmark International, Inc. Imaging apparatus configured for scanning a document
US7388690B2 (en) * 2005-05-27 2008-06-17 Khageshwar Thakur Method for calibrating an imaging apparatus configured for scanning a document
US7551334B2 (en) * 2005-07-20 2009-06-23 Xerox Corporation Background suppression method and apparatus
US7555172B2 (en) * 2005-10-31 2009-06-30 Xerox Corporation Dynamic range detection and adjustment
US7668394B2 (en) * 2005-12-21 2010-02-23 Lexmark International, Inc. Background intensity correction of a scan of a document
US7701618B2 (en) * 2006-06-14 2010-04-20 Kabushiki Kaisha Toshiba Automatic image enhancement using computed predictors
US8134762B2 (en) * 2007-01-29 2012-03-13 Sharp Laboratories Of America, Inc. Methods and systems for characterizing regions of substantially-uniform color in a digital image
US7873232B2 (en) * 2007-07-31 2011-01-18 Xerox Corporation Method and system for image background suppression using neutral adjustment of color channels
US20090041344A1 (en) * 2007-08-08 2009-02-12 Richard John Campbell Methods and Systems for Determining a Background Color in a Digital Image
US7843616B2 (en) * 2008-03-27 2010-11-30 Xerox Corporation Background suppression in a multi-function color scanning system
US8111918B2 (en) * 2008-10-20 2012-02-07 Xerox Corporation Segmentation for three-layer mixed raster content images
US8285035B2 (en) * 2008-12-05 2012-10-09 Xerox Corporation 3+1 layer mixed raster content (MRC) images having a text layer and processing thereof
US8180153B2 (en) * 2008-12-05 2012-05-15 Xerox Corporation 3+1 layer mixed raster content (MRC) images having a black text layer
US8335379B2 (en) * 2009-12-28 2012-12-18 Xerox Corporation System and method for cleanup of MRC images for improved compression and image quality
JP5701181B2 (ja) * 2011-08-18 2015-04-15 株式会社Pfu 画像処理装置、画像処理方法及びコンピュータプログラム
JP5701182B2 (ja) 2011-08-18 2015-04-15 株式会社Pfu 画像処理装置、画像処理方法及びコンピュータプログラム
US9426329B2 (en) * 2014-07-10 2016-08-23 Csr Imaging Us, Lp Image processing system of background removal and white/black point compensation
JP6326316B2 (ja) * 2014-07-25 2018-05-16 シャープ株式会社 画像処理装置、撮影装置、プログラム、記録媒体
US9710911B2 (en) * 2015-11-30 2017-07-18 Raytheon Company System and method for generating a background reference image from a series of images to facilitate moving object identification
JP2020065193A (ja) * 2018-10-18 2020-04-23 シャープ株式会社 画像形成装置、画像処理方法及び画像処理プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5086485A (en) 1990-10-19 1992-02-04 Xerox Corporation Method and apparatus for dynamically setting a background level
US5280367A (en) * 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
US5488491A (en) * 1993-07-06 1996-01-30 Eastman Kodak Company Image processing apparatus and method for eliminating background density in a designated image area
JP3532014B2 (ja) * 1995-11-30 2004-05-31 松下電器産業株式会社 しきい値算出方法
US5848183A (en) 1996-11-21 1998-12-08 Xerox Corporation System and method for generating and utilizing histogram data from a scanned image
US5835628A (en) 1996-11-21 1998-11-10 Xerox Corporation Method and system for generating histograms from a scanned image
US5881166A (en) 1996-11-21 1999-03-09 Xerox Corporation Method and system for generating a histogram of a scanned image
US5751848A (en) 1996-11-21 1998-05-12 Xerox Corporation System and method for generating and utilizing histogram data from a scanned image
US6198845B1 (en) * 1997-07-01 2001-03-06 Xerox Corporation Method for determining document background for adjusting the dynamic range of an image of the document

Also Published As

Publication number Publication date
EP1215884A2 (en) 2002-06-19
JP2002208007A (ja) 2002-07-26
US6674899B2 (en) 2004-01-06
BR0106160A (pt) 2002-08-13
CA2365001C (en) 2005-01-25
US20020076102A1 (en) 2002-06-20
DE60141739D1 (de) 2010-05-20
MXPA01013064A (es) 2004-05-21
CA2365001A1 (en) 2002-06-18
BR0106160B1 (pt) 2014-09-02
EP1215884B1 (en) 2010-04-07
EP1215884A3 (en) 2004-07-21

Similar Documents

Publication Publication Date Title
JP4416365B2 (ja) スキャンした文書の自動式検出
US7729536B2 (en) Boundary extracting method, program, and device using the same
US5563403A (en) Method and apparatus for detection of a skew angle of a document image using a regression coefficient
JP4242638B2 (ja) 走査文書の自動背景検出
US7379594B2 (en) Methods and systems for automatic detection of continuous-tone regions in document images
US20120120453A1 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
KR20010063095A (ko) 영상인식에 의한 소포우편물 부피계측시스템 및부피계측방법
US20040161153A1 (en) Context-based detection of structured defects in an image
Yin Skew detection and block classification of printed documents
US6266445B1 (en) Classification-driven thresholding of a normalized grayscale image
EP0809205B1 (en) Character line detecting apparatus using simplified projection information and method thereof and character recognition apparatus thereof and method thereof
US6647144B2 (en) Detection and verification of scanning attributes
US8472716B2 (en) Block-based noise detection and reduction method with pixel level classification granularity
JPH08305795A (ja) 文字認識方法
US6529629B2 (en) Image segmentation apparatus and method
JP3215163B2 (ja) 罫線識別方法及び領域識別方法
US7280253B2 (en) System for identifying low-frequency halftone screens in image data
KR20000025647A (ko) 쉐이딩 알고리즘을 이용한 영상 처리 방법
JP3453939B2 (ja) 画像処理装置
JPH11288453A (ja) 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム
JP2551383B2 (ja) 直線検出補正装置
JP2001291056A (ja) 文書画像認識装置及び記録媒体
US20050265600A1 (en) Systems and methods for adjusting pixel classification using background detection
JPH07141465A (ja) 文書画像の傾き検出方法
JP2606498B2 (ja) 指紋画像入力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070409

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070531

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070723

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071018

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080131

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080310

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080404

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090217

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090220

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20090818

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090818

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091124

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121204

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131204

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees