JP3907433B2 - 背景トレーニングを用いるデジタルイメージング装置 - Google Patents

背景トレーニングを用いるデジタルイメージング装置 Download PDF

Info

Publication number
JP3907433B2
JP3907433B2 JP2001217562A JP2001217562A JP3907433B2 JP 3907433 B2 JP3907433 B2 JP 3907433B2 JP 2001217562 A JP2001217562 A JP 2001217562A JP 2001217562 A JP2001217562 A JP 2001217562A JP 3907433 B2 JP3907433 B2 JP 3907433B2
Authority
JP
Japan
Prior art keywords
background
image
edge
features
edge map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001217562A
Other languages
English (en)
Other versions
JP2002094763A5 (ja
JP2002094763A (ja
Inventor
スティーブン・ジェイ・シムスク
ジョン・マーク・カールトン
リチャード・アール・レッサー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JP2002094763A publication Critical patent/JP2002094763A/ja
Publication of JP2002094763A5 publication Critical patent/JP2002094763A5/ja
Application granted granted Critical
Publication of JP3907433B2 publication Critical patent/JP3907433B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/413Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
    • H04N1/417Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding
    • H04N1/4177Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding encoding document change data, e.g. form drop out data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Scanning Arrangements (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は全般に自動画像解析に関し、より詳細には対象の領域と背景とを区別することに関する。
【0002】
【従来の技術】
イメージスキャナは、ドキュメントまたは写真上、あるいは透明媒体の画像上の視認可能な画像を、コンピュータによって複製、格納あるいは処理するのに適した電子形式に変換する。イメージスキャナは個別の装置の場合、あるいは複写機の一部、ファクシミリ装置の一部または多目的装置の一部をなす場合がある。反射型のイメージスキャナは典型的には制御式の光源を備えており、光がドキュメントの表面から光学系を通して光検出装置のアレイに反射される。光検出装置は、受光した光の強度を電子信号に変換する。透過型のイメージスキャナでは、光が、透明画像、たとえば写真のポジスライドから光学系を通して、光検出装置のアレイ上に到達する。本発明は、たとえば、ドキュメントをイメージング(画像化)するために構成されたデジタルカメラにも適用することができる。
【0003】
イメージングされるドキュメントあるいは他の対象物は典型的には、イメージスキャナの視界全体を占めることはない。典型的には、走査された画像は、対象の画像(たとえば、ドキュメントあるいは写真)と背景部分とを含む。たとえば、自動ドキュメントフィーダを備える反射型のスキャナの場合、その背景は、自動ドキュメントフィーダ機構の一部を含む場合がある。第2の例の場合、机上のドキュメントを見下ろすカメラが、対象のドキュメント、机の一部、そしておそらく少なくとも部分的に視界内にある他の物体の一部をイメージングする場合がある。一般的に、走査される画像の残りの部分から対象の画像を抽出する必要がある。
【0004】
背景から画像を抽出するために知られている方法の中には、わかっている対照的な背景を利用するものがある。米国特許第4,823,395号では、背景が黒色であり、原稿上の白色の余白がエッジ検出のための対照的なエッジを提供する。同様に、米国特許第5,818,976号では、背景の光学的な特性が、走査されるページの光学的な特性と対照的であり、その対照的な背景には、灰色の陰、ある対称的な色、あるいは線または点のパターンが用いられる場合がある。米国特許第5,901,253号では、走査される画像が背景の基準走査線と比較される。米国特許第5,880,858号では、ドキュメントを用いずに走査することにより、背景画像が取得され、その後、ドキュメントを含む走査される画像において、背景に対応する画素が除去される。米国特許第5,978,519号では、画像が可変の強度レベルを含むように切り取られ、一様な強度レベルを有する部分が、その切り取られた画像から除去される。
【0005】
他の方法は、対象の画像と重複する物体の画像を除去することに向けられる。たとえば、米国特許第5,377,019号および第6,011,635号では、開いた本を見下ろしているカメラを用いてイメージングし、本を開いた状態に保持する人の指がページの画像と重複する場合がある。指は、対照的な色、および対照的な形状(曲線状のエッジ)によって本から区別される。
【0006】
一般に、走査装置は、ある所定の背景が存在することを想定することができない。たとえば、着脱式の自動ドキュメントフィーダについて考えてみる。フィーダは存在する場合もあれば、存在しない場合もある。別法では、自動ドキュメントフィーダの代わりに、スライドアダプタが用いられる場合がある。背景が走査するたびに変動することがある場合、背景から対象の画像を抽出することができる画像処理システムが必要とされる。1つのアプローチは、蓋およびアダプタ上に固有の識別子を設けることである。しかしながら、スキャナが製造された後に、新しい装置が導入される場合には、新しい装置を認識するために、ハードウエアおよびソフトウエアのいずれかが更新されなければならない。別のアプローチは、対象の画像を走査する前に必ず背景画像を走査することである。しかしながら、全ての走査前に背景を走査することにより、走査に時間がかかるようになる。
【0007】
さらに、走査装置は、ある走査から次の走査までに背景が静止しているものと仮定することはできない。たとえば、装置が取り外され、置き換えられる場合には、機械的な位置合わせの再現性には、装置位置がある時間から別の時間までの間にわずかに変動することが含まれる場合がある。別法では、装置の中には手でスキャナに搭載されるものもあり、その場合には位置の精度が非常に悪くなる。
【0008】
背景が走査毎に変動する場合、新しい背景が用いられる場合、および知られている背景が2次元内で移動する場合に、その背景から対象の画像を抽出することができる画像処理システムが必要とされる。
【0009】
【発明が解決しようとする課題】
したがって、本発明の目的は、デジタルイメージング装置において、対象の画像と背景とを区別することができる方法を提供することである。
【0010】
【課題を解決するための手段】
種々の背景、形状およびテンプレートが走査され、特徴が抽出され、その特徴がメモリに格納される。複合的な画像(対象の画像と背景部分とを合わせたもの)が走査されるとき、その複合的な画像から特徴が抽出される。複合的な画像内の特徴は、格納される背景の特徴と相関をとられ、どの背景が存在するかが特定される。必要ならば、メモリからの背景の特徴を、背景の変位を調整するために2次元内で移動させる。その背景に対応する画像データが、複合的な画像から削除される。本発明は、空白の用紙に書き込まれた情報を抽出することにも適用することができる。
【0011】
【発明の実施の形態】
図1は、自動ドキュメントフィーダ102を備えるイメージスキャナ100を示す。図1のスキャナは、例示するための一例にすぎず、本特許出願は多くの他の構成のイメージスキャナに適用することができる。図1のスキャナでは、走査されるドキュメント、写真あるいは他のアイテムが、入力トレイ104内に配置され、透明プラテン106上に走査される面を下にして給送され、走査後には、出力トレイ108に戻される。スキャナ100は、プラテン106上のアイテムをイメージングするための光学アセンブリ110を備える。光学アセンブリ110は、たとえば、照明源112、光路を折り返すための多数のミラー(114、116、118)、対物レンズ120、光センサアレイ122を備える。図1の光学構成要素のサイズは、例示を容易にするために誇張されていることに留意されたい。レンズ120は、プラテン102の表面上の1本のラインを、光センサアレイ122の一行の光センサ上に集光する。典型的には、走査光学系110の視界の深さによって、プラテンの表面から数cm上側にある場合があるアイテムに焦点を合わせて走査できるようになる。多数の行の光センサが用いられる場合もある。
【0012】
図2は、ドキュメントを搭載していない、自動ドキュメントフィーダ102の走査画像を示す。自動ドキュメントフィーダは、プラテンを通してスキャナの走査光学系が視認することができる、ローラ(図1には示されない)あるいは他の機械的な構成要素またはラインを備える場合がある。図2では、長方形200がプラテン(図1の106)の外周であり、長方形202が自動ドキュメントフィーダ(図1の102)の底面上で視認可能なラインであり、長方形204〜210が自動ドキュメントフィーダの底面付近にある視認可能なローラである。
【0013】
図3は、写真300の走査画像を示しており、図2において視認可能な自動ドキュメントフィーダの部分が図3においても視認可能である。具体的には、ライン202の一部、ローラ204および206の一部が写真の境界の外側において視認することができ、ローラ208および210は全て視認することができる。
【0014】
図1〜図3に示される自動ドキュメントフィーダ102は着脱可能な場合があり、他の蓋あるいは機構がスキャナに取り付けられる場合がある。例としては、透明アダプタ、写真アダプタ、スライドアダプタ、および多数の写真あるいは名刺を保持するためのテンプレートがある。自動ドキュメントフィーダが取り外され、その後、再度取り付けられる場合には、図3における要素202〜210の絶対位置がわずかに移動する場合がある。別法では、小さなスライドアダプタが単に手でプラテン上に配置され、配置の精度が非常に悪い場合がある。本発明の1つの目的は、図2の要素202〜210のような背景から、図3の写真300のような対象の画像を区別することである。さらに別の目的は、背景の要素が移動する場合であっても、対象の画像を区別することである。したがって、何度も用いられることが予想される多数の背景がイメージングされ、その背景画像の特徴が格納される。その後、対象の画像が、その背景とともに走査されるとき、知られている背景が存在するか否かを確認するために、その複合画像の特徴が格納された特徴と比較される。知られている背景が存在する場合には、その背景部分がその複合画像から削除され、対象の画像のみが残される。また、本発明は用紙にも適用することができる。すなわち、背景として、空白の用紙を走査することができる。その後、背景の用紙を、記入されている用紙に書き込まれている情報から削除することができる。
【0015】
画像解析を用いて画像から抽出することができる1つのよく知られている特徴はエッジである。以下は、エッジ検出アルゴリズムの一例である。以下のように8個の最も近くに隣接する画像によって取り囲まれる画素P(i,j)について考えてみる。
【表1】
Figure 0003907433
【0016】
P(i,j)とその8個の最も近くに隣接する画素との間の差の絶対値の和が閾値より大きい場合、すなわち以下の式が成り立つ場合には、画素P(i,j)はエッジ画素と呼ばれる。
【数1】
Σ|P(i,j)−P(隣接画素)|>閾値
【0017】
たとえば、8ビットの強度値の場合、デフォルトの閾値100が、多くの画像に適したエッジの識別を与える。その閾値は、比較的均一な背景あるいは比較的不均一な背景に相応しいように手動で、あるいは自動で調整することができる。その後、以下のように、バイナリエッジマップを作成することができる。ある画素がエッジ画素と呼べる場合には、値「1」が割り当てられ、エッジ画素と呼べない場合には、値「0」を割り当てることができる。上記のアルゴリズムを用いるとき、生成されたエッジラインの幅(値「1」を有する面積)は比較的広くなる傾向がある。しかしながら、一般に、走査毎のラインは完全には一致しない場合があるので、以下に記載される画像解析の場合、広いエッジラインが望ましい場合がある。必要なら、ラインのエッジに沿って画素を繰返し除去することにより、広いエッジラインを「狭くする」ことができる。
【0018】
バイナリエッジマップは記憶するためのメモリをほとんど必要としないことに留意されたい。さらに、本発明の目的上、背景のエッジマップは高解像度である必要はなく、背景を低解像度で走査することから導出することができる。また、本発明の目的上、エッジラインは連続である必要はなく、エッジラインの破断も許容することができる。
【0019】
低解像度バイナリエッジマップは、予想される各背景に対して計算され、格納されることができる。また、低解像度バイナリエッジマップは、複合画像に対して計算することもできる。その後、複合画像のバイナリエッジマップと格納される各背景のバイナリエッジマップとの間で、2次元相互相関を実行することができる。エッジを含まない領域は無視することができる。すなわち、計算時間を短縮するために、背景内のエッジを含む領域のみを相互相関のために用いることが好ましい。たとえば、図2および図3では、相互相関計算は、長方形202によって画定される領域に限定することができる。相関の組に対して最も高いピーク相関値が、どの背景が複合画像に含まれる可能性が最も高いかを示すであろう。相関のピークに、2次元相関結果の中心からのオフセットがあれば、それは走査間の背景の位置の移動を示す。
【0020】
背景の一致と、相互相関からの位置の移動とを与えると、適切な背景エッジマップを移動し、その後、複合画像エッジマップと比較することができる。以下に記載する例示的な比較方法では、「A」が複合エッジマップ内の画素であり、「B」が背景エッジマップ内の画素であり、「結果(RESULT)」が比較から生じるエッジマップであるとものとする。第1の比較方法は以下のマッピングである(ABバー)。
【表2】
Figure 0003907433
【0021】
第2の比較方法は以下のマッピングである(排他的論理和)
【表3】
Figure 0003907433
【0022】
第1の比較方法の場合、画素は、(a)複合エッジマップにおいてバイナリ1に設定され、かつ(b)背景エッジマップにおいてバイナリ1に設定されない場合にのみ、生成されたエッジマップにおいてバイナリ1に設定される。第2の比較方法では、画素は、複合エッジマップあるいは背景エッジマップのいずれかにおいてバイナリ1に設定される場合にのみ、生成されたエッジマップにおいてバイナリ1に設定されるが、両方が1の場合には0に設定される。さらに以下に説明するように、第1の比較方法はエッジマップの場合に特に有用であり、第2の比較方法は用紙あるいはテンプレートから情報を抽出する場合に特に有用である。
【0023】
図4は、図2および図3に示される画像のエッジマップに対して、第1の比較方法を適用する場合を示す。図4では、背景の部分は視認されない。図4では、エッジラインの小さな隙間が明らかではなく、背景エッジマップ内のエッジラインが交差しているため、その写真のためのエッジライン内の画素が0にマッピングされる。図3では、写真300は、白色の余白(縁取り)と白色ではない写真とを有するものとして示される。写真が、白色のエッジに沿った領域を有する場合には、内部長方形のある部分が、エッジ画素にマッピングされない場合がある。しかしながら、外側長方形は、小さな隙間を有する場合であっても、対象の画像の領域を示すのに十分であろう。
【0024】
第1の比較方法の結果は、写真(図3の300)のエッジを明瞭に示すことになるが、ノイズの小領域も含むであろう。1つのノイズ源は、部分的にエッジを含む画素である。たとえば、白色の背景上に黒色領域があるものと仮定する。いくつかの画素は全て黒色、いくつかの画素は全て白色であるが、黒色から白色への境界上で部分的に照明された数個の画素は灰色になる場合がある。特に走査間で位置に偏差がある場合には、どの画素が部分的に照明されるかは、走査毎に変化する場合がある。ノイズを除去するための1つの方法は、背景エッジマップ内のエッジに隣接する、生成された比較画像内のバイナリ1を削除することである。ノイズを除去するための別の方法は、最小サイズより小さい、バイナリ1の全ての領域を削除することである。すなわち、たとえば4個以下の1を有する連続したバイナリ1の全ての領域が削除される場合がある。
【0025】
一旦ノイズが除去されたなら、比較計算から生成された小さな隙間を埋めることが望ましい場合がある。隙間埋込み方法は、スミアリング(smearing)としても知られており、特に光学式文字認識の場合に知られている。たとえば、F.M. Wahl、K.Y. Wong、R.G. Caseyによる「Block Segmentation and Text Extraction in Mixed Text/ Image Documents」(Computer Graphics and Image Processing, v20, n4, Dec 1982, p375-390)を参照されたい。
【0026】
図5〜図7は、本発明の別の例示的な応用形態を示す。図5は、4枚のスライド、たとえば、厚紙あるいはプラスチックフレーム内に取り付けられる35mmスライドのためのホルダを示す。そのホルダは、たとえば、外周500と長方形開口部502とを有する窪んだ領域を備える場合がある。図6は、4枚のスライドを保持した状態の、図5のホルダを示す。厚紙あるいはプラスチックフレームは、図5の開口部502の周辺を覆い隠す。図7は、図5および図6に示される画像のエッジマップに第1の比較方法を適用する結果を示す。図7では、対応するエッジが両方のエッジマップ内に現れるので、外側長方形(図5および図6の500)は削除されることに留意されたい。また、外側長方形の場合、幅広のエッジラインが適しており、比較後に残される全てのノイズ画素は、上記のように、背景エッジマップ内のエッジに近いバイナリ1を削除することにより、あるいは領域をフィルタリングすることにより削除できることにも留意されたい。
【0027】
図8は、予め印刷されたテキスト(図示せず)を含む場合もある、空白の用紙の画像を示す。図9は、対象のテキスト900を記入して空欄を埋めた、図8の用紙の画像を示す。エッジマップは、対象の画像がラインによって画定される場合に、対象の画像を特定するのに適しているが、テキストの領域を特定することにはあまり適していない。したがって、用紙あるいはテンプレートの場合に、エッジマップを用いて背景用紙あるいはテンプレートを特定することができるが、対象の画像の抽出の場合には、第2の比較方法が好ましく、第2の方法は、エッジマップにではなく、図8および図9に示される画像に直接適用される。図10は、図8および図9の画像に第2の方法を適用した結果を示す(ノイズは適切に除去されている)。
【0028】
図4および図7では、生成されたエッジマップが、対象の画像を含む領域を示す。図10では、エッジマップを用いて、ドキュメントの外側の領域、たとえば図2および図3に示されるような自動ドキュメントフィーダローラを削除することができ、その後、対象のドキュメント領域を与えると、対象のテキスト情報が、エッジマップを使用することなく、直接抽出される。
【0029】
図11Aおよび図11Bは、本発明による方法の流れ図である。図11Aでは、ステップ1100において、背景のラスタ走査された画像が得られる。ステップ1102では、背景が用紙あるいはテンプレートである場合には、背景画像はセーブされる(ステップ1104)。ステップ1106では、背景画像のエッジマップが計算され、かつセーブされる。ステップ1100〜1106は、予想される対象の背景のライブラリを構築するのに必要とされる回数だけ繰り返される場合がある。別法では、ステップ1100〜1106は、1つの新しい背景のためのデータを取得することを示す場合がある。
【0030】
図11Bでは、ステップ1108において、背景および対象の画像からなる複合画像のラスタ走査された画像が得られる。ステップ1110では、複合画像のエッジマップが計算される。ステップ1112では、複合画像のエッジマップが、格納される各背景エッジマップについて、2次元相互相関を用いて相互相関をとられる。最も高いピークを有する相互相関が、どの背景が最も可能性が高いかを示す。2次元相互相関内のピークの位置が、背景が走査間でシフトしたか否かを示す。ステップ1114において、対象物が用紙(あるいはテンプレート)である場合には、ステップ1116において、必要に応じて(ステップ1112中に判定される)背景画像が変換され、シフトされた背景画像が、複合画像から削除される(たとえば、排他的論理和(XOR)関数を用いて行われる)。対象物が用紙でない場合には、ステップ1120において、必要に応じて背景エッジマップが変換され、ステップ1122において、複合エッジマップ内で視認可能な全ての背景エッジが削除される(たとえば、上記の第1の比較方法を用いる)。生成されたエッジマップ内の残りのエッジは、1つあるいは複数の対象の画像を特定するために用いられる。
【0031】
図11Aおよび図11Bにおいて、ステップ1102および1114は、作業者が決定するためのユーザインターフェースの一部の場合があることに留意されたい。別法では、ステップ1102において、いくつかの背景が作業者によって用紙として特定され、その特定情報が格納され、かつ背景エッジマップに関連付けられ、その後、ステップ1112において、背景が特定されるときに、システムが、ある背景を用紙として自動的に特定することができる。
【0032】
ラスタ走査された画像を取得するための装置の一例を示すために、図1においては、フラットベッド型イメージスキャナが用いられたことに留意されたい。しかしながら、本発明は、シートフィードスキャナ、携帯スキャナ、デジタルカメラ、および複数の予想される背景を含む場合があるラスタ画像を取得するために用いられる任意の他の装置に、同様に適用することができる。しかしながら、イメージング装置が露光間で移動することがある場合、たとえば、静止しているものに取り付けられていないデジタルカメラの場合には、画像の付加的な予備処理が必要とされる場合がある。たとえば、背景エッジマップは、2つの異なる距離で行われた2つの露光を補償するために、スケーリングされなければならない場合があるか、あるいは2つの異なる角度で行われた2つの露光を補償するために、曲げられなければならない場合がある。
【0033】
本発明の上記の記載は、例示および説明の目的で与えられている。開示される正確な形態で全てを網羅している、すなわちその形態に本発明を限定するつもりはなく、上記の教示内容に鑑みて、他の変更形態および変形形態が実現可能な場合がある。その実施形態は、本発明の原理およびその実用的な応用形態を最もわかりやすく説明し、それにより、当業者が、考慮される特定の使用形態に適するように、本発明の種々の実施形態および種々の変更形態を最も容易に利用できるようにするために、選択および記載された。添付の請求の範囲は、従来技術によって制限される場合を除いて、本発明の他の代替形態を含むものと解釈されることを意図している。
【0034】
【発明の効果】
上記のように、本発明によれば、デジタルイメージング装置において、対象の画像と背景とを区別することができる方法を実現することができる。
【0035】
以下に本発明の実施態様の例を列挙する。
【0036】
〔実施態様1〕 背景(図2、図5、図8)から対象の画像(図4、図7、図10)を区別する方法であって、
背景画像を形成するために、複数の背景を走査するステップ(1100)と、
前記背景画像それぞれの特徴を抽出するステップ(1106)と、
前記背景画像それぞれの前記特徴をメモリにセーブするステップと、
前記対象の画像と、前記複数の背景画像のうちの1つの少なくとも一部の画像とを含む複合画像(図3、図6、図9)を走査するステップ(1108)と、
前記複合画像の特徴を抽出するステップ(1110)と、
前記複合画像の前記特徴と、前記メモリ内の前記背景画像のうちの1つの前記特徴とを比較し、相関をとるステップ(1112)と、
前記メモリ内の前記背景画像のうちの1つの特徴と一致する特徴を有する前記複合画像の部分を削除するステップ(1118、1122)とを有する方法。
〔実施態様2〕 前記背景画像それぞれの特徴を抽出するステップはさらに、前記背景画像それぞれのエッジを検出するステップを含む実施態様1に記載の方法。
〔実施態様3〕 前記複合画像の特徴を抽出するステップはさらに、前記複合画像のエッジを検出するステップを含む実施態様1に記載の方法。
〔実施態様4〕 前記複合画像の前記特徴と、前記メモリ内の前記背景画像のうちの1つの前記特徴とを比較し、相関をとるステップの前に、前記背景画像のうちの1つを少なくとも1次元に変換するステップ(1116、1120)をさらに含む実施態様1に記載の方法。
〔実施態様5〕 前記背景画像のうちの少なくとも1つをメモリにセーブするステップ(1104)をさらに含む実施態様1に記載の方法。
【図面の簡単な説明】
【図1】着脱式の自動ドキュメントフィーダを備えるイメージスキャナを一部破断して示す側面図である。
【図2】図1の自動ドキュメントフィーダの底面の走査される画像を示す図である。
【図3】写真の走査画像と、図1および図2の自動ドキュメントフィーダの一部とを示す図である。
【図4】背景を除去するために画像解析した後の図3の画像のエッジマップを示す図である。
【図5】スライドホルダの走査画像を示す図である。
【図6】スライドを備えた図4のスライドホルダの走査画像を示す図である。
【図7】背景を除去するために画像解析した後の図6の画像のエッジマップを示す図である。
【図8】空白用紙の走査画像を示す図である。
【図9】情報を書き込んだ図8の用紙の走査画像を示す図である。
【図10】背景を除去するために画像解析した後の図9の画像を示す図である。
【図11A】本発明による方法の流れ図である。
【図11B】本発明による方法の流れ図である。

Claims (5)

  1. 背景から対象の画像を区別する方法であって、
    背景画像を形成するために、複数の背景を走査するステップと、
    前記背景画像それぞれの特徴を抽出するステップと、
    前記背景画像それぞれの前記特徴をメモリにセーブするステップと、
    前記対象の画像と、前記複数の背景画像のうちの1つの少なくとも一部の画像とを含む複合画像を走査するステップと、
    前記複合画像の特徴を抽出するステップと、
    前記複合画像の前記特徴と、前記メモリ内の前記背景画像のうちの1つの前記特徴とを比較し、相関をとるステップと、
    前記メモリ内の前記背景画像のうちの1つの特徴と一致する特徴を有する前記複合画像の部分を削除するステップと
    を有する方法。
  2. 前記背景画像それぞれの特徴を抽出するステップはさらに、前記背景画像それぞれのエッジを検出するステップを含む請求項1に記載の方法。
  3. 前記複合画像の特徴を抽出するステップはさらに、前記複合画像のエッジを検出するステップを含む請求項1に記載の方法。
  4. 前記複合画像の前記特徴と、前記メモリ内の前記背景画像のうちの1つの前記特徴とを比較し、相関をとるステップの前に、前記背景画像のうちの1つを少なくとも1次元に変換するステップをさらに含む請求項1に記載の方法。
  5. 前記背景画像のうちの少なくとも1つをメモリにセーブするステップをさらに含む請求項1に記載の方法。
JP2001217562A 2000-07-31 2001-07-18 背景トレーニングを用いるデジタルイメージング装置 Expired - Fee Related JP3907433B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/628,542 US6683984B1 (en) 2000-07-31 2000-07-31 Digital imaging device with background training
US628542 2000-07-31

Publications (3)

Publication Number Publication Date
JP2002094763A JP2002094763A (ja) 2002-03-29
JP2002094763A5 JP2002094763A5 (ja) 2005-08-11
JP3907433B2 true JP3907433B2 (ja) 2007-04-18

Family

ID=24519335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001217562A Expired - Fee Related JP3907433B2 (ja) 2000-07-31 2001-07-18 背景トレーニングを用いるデジタルイメージング装置

Country Status (4)

Country Link
US (1) US6683984B1 (ja)
EP (1) EP1178668B1 (ja)
JP (1) JP3907433B2 (ja)
DE (1) DE60134919D1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001233184A1 (en) * 2000-02-04 2001-08-14 America Online Incorporated Method for determining transparency in the extraction of images
US6996291B2 (en) * 2001-08-06 2006-02-07 Mitutoyo Corporation Systems and methods for correlating images in an image correlation system with reduced computational loads
US6990254B2 (en) * 2001-08-06 2006-01-24 Mitutoyo Corporation Systems and methods for correlating images in an image correlation system with reduced computational loads
US7424672B2 (en) * 2003-10-03 2008-09-09 Hewlett-Packard Development Company, L.P. System and method of specifying image document layout definition
KR100532122B1 (ko) * 2004-02-20 2005-11-29 삼성전자주식회사 회전 가능한 스캐닝부를 구비한 디지털 복합기
US7940955B2 (en) * 2006-07-26 2011-05-10 Delphi Technologies, Inc. Vision-based method of determining cargo status by boundary detection
JP2009194776A (ja) * 2008-02-15 2009-08-27 Fujitsu Microelectronics Ltd ノイズフィルタ
KR101297720B1 (ko) * 2008-09-25 2013-08-26 삼성전자주식회사 스캐너, 이를 포함하는 화상형성장치, 스캐너의 이미지 처리방법 및 화상형성장치의 인쇄방법
US8260084B2 (en) * 2009-02-05 2012-09-04 Seiko Epson Corporation Binary image stitching based on grayscale approximation
JP2010252099A (ja) * 2009-04-16 2010-11-04 Fuji Xerox Co Ltd 画像形成装置、画像形成方法、画像形成プログラム及び記録媒体
US8321422B1 (en) 2009-04-23 2012-11-27 Google Inc. Fast covariance matrix generation
US8611695B1 (en) 2009-04-27 2013-12-17 Google Inc. Large scale patch search
US8396325B1 (en) * 2009-04-27 2013-03-12 Google Inc. Image enhancement through discrete patch optimization
US8391634B1 (en) 2009-04-28 2013-03-05 Google Inc. Illumination estimation for images
US8385662B1 (en) 2009-04-30 2013-02-26 Google Inc. Principal component analysis based seed generation for clustering analysis
EP2449531B1 (en) 2009-07-02 2017-12-20 Hewlett-Packard Development Company, L.P. Skew detection
US8798393B2 (en) 2010-12-01 2014-08-05 Google Inc. Removing illumination variation from images
WO2013022426A1 (en) 2011-08-08 2013-02-14 Hewlett-Packard Development Company, L.P. Method and system for compression of a real-time surveillance signal
US8938119B1 (en) 2012-05-01 2015-01-20 Google Inc. Facade illumination removal
CN108604300B (zh) * 2016-04-28 2021-12-14 惠普发展公司,有限责任合伙企业 从具有非均匀背景内容的电子扫描图像中提取文档页面图像
US10685459B2 (en) * 2018-06-01 2020-06-16 Adobe Inc. Generating enhanced digital images by selectively transforming raster images to vector drawing segments
US10607374B2 (en) 2018-06-01 2020-03-31 Adobe Inc. Generating enhanced digital images by selectively transforming raster images to vector drawing segments

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4180831A (en) * 1975-05-23 1979-12-25 Bausch & Lomb Incorporated Image analysis data extraction
US4020462A (en) * 1975-12-08 1977-04-26 International Business Machines Corporation Method and apparatus for form removal from contour compressed image data
FR2395656A1 (fr) * 1977-05-31 1979-01-19 Cit Alcatel Installation de transmission de fac-similes, en particulier pour la reproduction de formulaires
JPS61262982A (ja) 1985-05-17 1986-11-20 Casio Comput Co Ltd 画像情報認識装置
US5097517A (en) * 1987-03-17 1992-03-17 Holt Arthur W Method and apparatus for processing bank checks, drafts and like financial documents
US4908716A (en) 1987-12-08 1990-03-13 Ricoh Company, Ltd. Image processing apparatus
JPH02268388A (ja) * 1989-04-10 1990-11-02 Hitachi Ltd 文字認識方法
JP3170299B2 (ja) * 1991-01-31 2001-05-28 株式会社リコー 画像読取処理装置
US5377019A (en) 1991-12-02 1994-12-27 Minolta Co., Ltd. Document reading apparatus having a function of determining effective document region based on a detected data
US5583950A (en) * 1992-09-16 1996-12-10 Mikos, Ltd. Method and apparatus for flash correlation
US5818976A (en) 1993-10-25 1998-10-06 Visioneer, Inc. Method and apparatus for document skew and size/shape detection
JPH08242358A (ja) * 1995-03-06 1996-09-17 Toshiba Corp 画像処理装置
JP3735893B2 (ja) * 1995-06-22 2006-01-18 セイコーエプソン株式会社 顔画像処理方法および顔画像処理装置
US6023530A (en) * 1995-11-13 2000-02-08 Applied Intelligent Systems, Inc. Vector correlation system for automatically locating patterns in an image
JP3436025B2 (ja) 1995-12-27 2003-08-11 ミノルタ株式会社 読取り画像の修正方法及び画像読取り装置
US5901253A (en) 1996-04-04 1999-05-04 Hewlett-Packard Company Image processing system with image cropping and skew correction
US6064768A (en) * 1996-07-29 2000-05-16 Wisconsin Alumni Research Foundation Multiscale feature detector using filter banks
US5978519A (en) 1996-08-06 1999-11-02 Xerox Corporation Automatic image cropping
US5974199A (en) 1997-03-31 1999-10-26 Eastman Kodak Company Method for scanning and detecting multiple photographs and removing edge artifacts
TW376492B (en) * 1997-08-06 1999-12-11 Nippon Telegraph & Telephone Methods for extraction and recognition of pattern in an image, method for image abnormality judging, and memory medium with image processing programs
US6381365B2 (en) * 1997-08-22 2002-04-30 Minolta Co., Ltd. Image data processing apparatus and image data processing method
US5880858A (en) 1997-12-31 1999-03-09 Mustek Systems Inc. Method of auto-cropping images for scanners
US6335985B1 (en) * 1998-01-07 2002-01-01 Kabushiki Kaisha Toshiba Object extraction apparatus

Also Published As

Publication number Publication date
EP1178668A3 (en) 2004-11-03
DE60134919D1 (de) 2008-09-04
EP1178668B1 (en) 2008-07-23
EP1178668A2 (en) 2002-02-06
US6683984B1 (en) 2004-01-27
JP2002094763A (ja) 2002-03-29

Similar Documents

Publication Publication Date Title
JP3907433B2 (ja) 背景トレーニングを用いるデジタルイメージング装置
KR101126466B1 (ko) 사진 문서 이미징 시스템
US8009931B2 (en) Real-time processing of grayscale image data
US8189965B2 (en) Image processing handheld scanner system, method, and computer readable medium
US6304684B1 (en) Information processing system and method of using same
JP6903023B2 (ja) 画像読取装置、画像処理システム及び異物検出方法
US6345763B1 (en) Image reading apparatus for reading a bookform document placed on a document table in face-up state
JP6895914B2 (ja) 画像読取装置、画像処理システム、制御方法及び制御プログラム
US20050207675A1 (en) Image processing apparatus
JP3582988B2 (ja) 非接触型画像読取装置
KR101150987B1 (ko) 화상처리장치 및 그 제어방법
JP6917926B2 (ja) 画像処理装置、制御方法及び制御プログラム
JP3247723B2 (ja) 画像再配置複写機
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
JP6859779B2 (ja) 画像読取装置、画像読取方法および画像読取プログラム
US20050083556A1 (en) Image cropping based on imaged cropping markers
Silva et al. Background removal of document images acquired using portable digital cameras
JP3255676B2 (ja) デジタル複写機
JP5550309B2 (ja) 画像処理装置及び表示制御方法
JP3244768B2 (ja) 画像方向指定機能付き複写機
AU2017200244A1 (en) Photographic document imaging system
WO2009141338A1 (en) Document scanner
JP2004048130A (ja) 画像処理方法、画像処理装置、および画像処理プログラム
KR20080100587A (ko) 화상형성장치 및 화상형성방법
JP2004318896A (ja) 非接触型画像読取装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20041001

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20041001

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050121

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070116

R150 Certificate of patent or registration of utility model

Ref document number: 3907433

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100126

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110126

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120126

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 6

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130126

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees