JP2008537861A - スキャンされたデータを処理するシステムおよび方法 - Google Patents

スキャンされたデータを処理するシステムおよび方法 Download PDF

Info

Publication number
JP2008537861A
JP2008537861A JP2008503002A JP2008503002A JP2008537861A JP 2008537861 A JP2008537861 A JP 2008537861A JP 2008503002 A JP2008503002 A JP 2008503002A JP 2008503002 A JP2008503002 A JP 2008503002A JP 2008537861 A JP2008537861 A JP 2008537861A
Authority
JP
Japan
Prior art keywords
data
processor
document
algorithm
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008503002A
Other languages
English (en)
Other versions
JP5001256B2 (ja
Inventor
ローランド ジー. ボレイ,
マウリティウス エー. アール. シュミットラー,
ロバート エー. テイラー,
ジョエル エス. フェクター,
ハリー エス. アスリ,
Original Assignee
コファック イメージ プロダクツ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コファック イメージ プロダクツ, インコーポレイテッド filed Critical コファック イメージ プロダクツ, インコーポレイテッド
Publication of JP2008537861A publication Critical patent/JP2008537861A/ja
Application granted granted Critical
Publication of JP5001256B2 publication Critical patent/JP5001256B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K15/00Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers
    • G06K15/40Details not directly involved in printing, e.g. machine management, management of the arrangement as a whole or of its constitutive parts
    • G06K15/407Managing marking material, e.g. checking available colours
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Facsimiles In General (AREA)

Abstract

アナログデータのためのデジタル収集デバイスを強化するための効率的な方法およびシステムが示される。該方法およびシステムによって提供される強化は、ローカルな配置ならびにリモートの配置にいるユーザに対して利用可能である。収集されるデジタルデータの質の強化は、仮想的な再収集を用いることによって、効率良く達成される。仮想的な再収集の方法は、収集デバイスによって得られるデジタルデータが、不十分な質である場合に、アナログデータの物理的な再収集を不必要にさせる。

Description

本出願は、合衆国法典35巻119条(e)に基づき、2005年3月24日に出願され、「SYSTEMS AND METHODS FOR ENHANCING DIGITAL ACQUISITION DEVICES FOR ANALOG DATA IN LOCAL AS WELL AS REMOTE DEPLOYMENTS」と題された米国仮特許出願第60/665,067号からの優先権の利益を主張し、本明細書によって、該出願の全体が本明細書において参考によって援用される。
(発明の背景)
(発明の分野)
本発明は、データ収集デバイスによって収集されたデータの質を向上させるシステムおよび方法に関する。ユーザはデータ収集デバイスからローカルにまたはリモートに配置され得る。
(関連技術の記載)
アナログデータのためのデータ収集デバイスは、アナログデータをデジタルデータへ変換する。典型的な例は、スキャニングデバイスである。スキャニングデバイスは、1枚の紙上に印刷された画像を入力として取り入れ、物理的な画像のデジタル表現を出力する。収集デバイスによって得られる質は、所与のアナログデータの特性に適した設定を有するデバイスを用いることに強く依存する。例えば、高質のスキャンされた日没の画像を達成するために有用なスキャナの設定は、夏の日のあふれるような日光で撮られた写真をスキャンするために使用される設定とはいくぶん異なる。アナログデータの特性を仮定して、より良い設定または最適な設定を見出すことは、しばしば、収集デバイスの異なる設定を用いて、再三アナログデータを収集することを必要にさせる時間のかかる処理である。これは、デジタルデータの受信者およびデータ収集デバイスが異なる場所に存在するときに、特に非実用的で非効率的になる。
以下の例は、現在の技術の非効率性を例示する。ファックスの受信者は、受信されたファックスの質に満足していない。より良い質のファックスを得るために、受信者は、例えば、電話を使用することによって、ファックスの発信元に位置される人物に通知し、異なる設定でファックスを再送信することを要求する必要がある。
さらに、一時的なアナログデータを仮定すると、アナログデータの物理的な再収集を用いる改良された収集設定の決定は、狭い時間枠内では不可能であるかまたはほとんど実行可能でない。
現在のリモートデータ収集アプリケーションにおいて、アナログデータは、例えば、スキャニングデバイスまたはデジタルコピー機を用いてデジタルに収集される。該デジタル化されたデータは、次いで、ネットワークを介して、リモートの受信者に送信される。リモートデータ収集アプリケーションの現在の方法は、収集されるデータのリモートの受信者に、データ収集デバイスのリモートコントロールを提供しない。
(発明の概要)
実施形態は、質の強化の目的のためのデータの仮想的な再収集の方法を含む。実施形態において、質の強化のための仮想的な再収集は、スキャニングデバイス、および例えば、デジタルコピー、ファックスマシン、多機能の周辺装置、赤外線カメラ、音響カメラ、デジタルカメラ、赤外線カメラ、音響カメラ、デジタルカメラ、ビルトインデジタルカメラを有する携帯電話などのような他のデータ収集デバイスに対して使用され得る。仮想的な再収集は、例えば、デバイスをモニタするための音声、音響測定、温度、ビデオなどを含む任意のアナログソースまたはデジタルソースと共に使用され得る。
アナログデータに対する収集デバイスの入力ストリームは、離散的または連続的のいずれかであり得る。さらに、入力ストリームは、時間または空間の関数であり得る。これらの様式にもかかわらず、結果として生じるデータは、順序付けられたセットの離散的なユニットに含まれる。セットの順序は、入力ストリームの時間または空間方向の情報を含む。連続的な入力ストリームの場合には、収集デバイスは、連続的な入力ストリームをビンに細分化することによって、離散的なユニットを生成する。例えば、ビデオカメラへの入力は連続的であり、結果として生じるデータは、カメラによって撮られた順序付けられたセットのピクチャフレームによって与えられ、各ピクチャフレームは前述の離散的なユニットの例である。スキャニングデバイスに送られるペーパーシートのバッチは、離散的な入力ストリームの例であり、離散的なデータはペーパーシートによって規定される。
1つの実施形態は、アナログデータに対する収集デバイスによって得られたデジタルデータを強化する効率的な方法およびシステムである。強化は、アナログデータの仮想的な再収集を用いて得られる。仮想的な再収集の方法は、収集デバイスによって収集された未加工データをキャッシュに格納する。データプロセッサは、キャッシュからの未加工データにアクセスし、該収集デバイスによってデータを物理的に再収集することなく、該データプロセッサによって未加工データの再処理を可能にする。
実施形態は、キャッシュサイズを考えて、可能な限り多くのキャッシュに入来するデータユニットを格納する。特定の実施形態において、入来するデータの新しいストレージは、キャッシュにもっとも長く存在するデータユニットを消去することによって、作成される。さらに、または他の実施形態においては、データユニットは、プライオリティを割り当てられ、より低いプライオリティを有するデータユニットは、より高いプライオリティを有するデータユニットよりも前に、新しいデータユニットで上書きされる。
実施形態は、収集デバイスによって収集された、もっとも最近使用されたデータユニットまたは比較的最近使用されたデータユニットを仮想的に再収集する能力を有する。あるいは、ユーザは、選択機構を介して、キャッシュに格納された未加工データまたは該未加工データのサブセクションを仮想的に再収集する。仮想的な再収集の方法は、アナログデータの不必要な時間および労働力のかかる物理的な再収集を必要としない。さらに、データの物理的な再収集が不可能な場合、例えば、時間依存の入力ストリームの場合には、仮想的な再収集が特に価値がある。
収集デバイスの収集速度が、出力通信システムに対して非常に高く、かつデフォルトとして、圧縮された低い解像度のデータが転送される場合には、仮想的な再収集の追加の適用は当然である。仮想的な再収集を用いて、データの受信者は、送信の帯域幅によって与えられる制約にもかかわらず、元の高い解像度のデータを選択的にアクセスおよび再処理し得る。
さらに、本明細書で与えられる方法およびシステムの実施形態は、改良されたまたは最適な収集デバイスの設定を効率よく決定するために利用する。改良されたまたは最適な設定は、特定の実施形態に依存して、システム自体によって、またはその組み合わせによって、自動的に、リアルタイムおよび非リアルタイムにおいてインタラクティブに見出され得る。さらに、方法およびシステムは、ユーザに対し潜在的に低い質のデジタルデータ、または、データを解析し、いくつかのユーザ定義の閾値に対して結果を比較することによって、ユーザにとって関心があり得る入力ストリームにおける変更について自動的に警告することによって、デジタル収集デバイスのコントロールを円滑にする。この特性は、例えば、莫大な量のアナログデータの収集を用いるか、または必要とする配置において、価値がある。
さらに、実施形態において示されるように、リモートの配置で組み合わされた仮想的な再収集の方法は、多種のビジネスプロセス、例えば、セキュリティ監視アプリケーションにおける大きな効率ゲインの可能性を提供する。例えば、建造物は、ビデオシステムを用いてモニタされ、利用可能な帯域幅のせいで低い解像度のデータがセントラルロケーションに送信される。データを解析することによって、システムは、システムをモニタする人物の関心がある可能性がある出来事を検出し、仮想的な再収集をするユーザに対する、高い解像度のデータの送信をトリガする。
未加工の圧縮されていないデータの代わりに処理されたデータをデフォルトとして転送することによって、実施形態のリモートのアプリケーションは、ストレージおよびネットワークを効果的に利用し、ハードウェアの使用、またはストレージおよびネットワーク上の要求を減少させるか、または最小限にする。
さらに、本明細書に示される方法およびシステムの実施形態は、複数のユーザが1つまたは複数のアナログ収集デバイスの使用を共有することを可能にする。各ユーザは、データプロセッサの異なる設定で、同一の未加工データを処理し得、各個別のユーザが、個人的な好みおよびニーズに従って、未加工データを処理することを可能にする。
最後に、方法およびシステムの実施形態は、収集される離散的なデータユニットのサブセクションに個別に適用され得る。すなわち、ユーザは、収集されたデータユニットのサブセクションを選択し得、該選択されたサブセクションを様々に処理し得る。例えば、画像およびテキストをディスプレイするスキャンされた画像を仮定すると、ユーザは、収集されたデータユニットを、一方は画像を含み、もう一方はテキストを含む、2つのゾーンに再分化し得、選択されたゾーンに対してもっとも適した、またはより適した設定を用いて、該ゾーンを仮想的に再収集し得る。
上述されるように、本明細書で示される方法およびシステムの実施形態は、1つ以上の解析エンジンを潜在的に配置することによって、改良されたプロセッサ設定または最適なプロセッサ設定を自動的に決定する能力を有する。例えば、第1の解析エンジン(エンジン1)は、入力として未加工データを得て、一方で第2の解析エンジン(エンジン2)は、入力として処理されたデータを使用する。第2のエンジンは、測定基準を用いて処理されたデータの質を決定する。それは新しいプロセッサ設定を、ランダムに、または処理された測定基準によって決定されるところの、データの質に依存して選択する。未加工データは、新しい設定を用いて再処理される。この処理は、収束まで、すなわち測定基準が処理されたデータの質におけるいかなる改良をも検出しなくなるまで、継続する。第1の解析エンジンによって行われる機能は、ページ境界検出、バックグラウンド平滑化、ブリードスルー検出、色検出および方向検出などであるが、これらに制限はされない。
ページ境界検出は、効率的なページスキュー補正に有用である。実施形態において、ページ境界検出は、種々のバックグラウンドに対するページを検出し、結果として、ページスキュー補正ならびに白いバックグラウンドスキャナおよび黒いバックグラウンドスキャナに対するクロッピングを可能にする。
バックグラウンド平滑化方法の実施形態は、画像のバックグラウンド内の色の数を減少させることのニーズまたは要求に対処し、画像の外観を向上させ、同様に圧縮後の画像のサイズを減少させる。本発明の実施形態は以下のように作動する。画像内で見出される色の全てまたは一部をクラスタし、バックグラウンドと考えられるために十分なピクセルを含む色を選択する。これらのバックグラウンドは、次いでマージされ、バックグラウンドクラスタに属する画像内のピクセルの全てまたは一部は、クラスタ内の平均色に置換される。
ブリードスルー検出の実施形態は、これらのページ上のさらなる画像処理を行うために、スキャンされた画像のブランクでない側のブリードスルーを検出する。このアルゴリズムの実施形態は、面の位置を近似的に適合させるために、表面および裏面のスキャンされた画像内でページ境界検出を使用する。次いで、アルゴリズムは、マッピングを微調整するために、存在するカラーコンテンツまたはグレーコンテンツを使用する。この追加のステップは、フロントカメラとバックカメラとの光学およびスキューのわずかな違いに対して有用である。残りの(説明されない)コンテンツが、特定の密度基準未満である場合には、該ページはブランクと呼ばれる。
実施形態において、色検出は、スキャンされた画像内のカラーコンテンツを検出するためのニーズまたは要求、およびフォアグラウンドとバックグラウンドとを区別するためのニーズまたは要求を扱う。このアルゴリズムの実施形態は、バックグラウンドカラーが卓越した色またはドキュメント内でもっとも卓越した色である場合に、バックグラウンド色を除くための機構を提供する。このアルゴリズムの実施形態は、スキャンされた画像内のピクセルを検査し、該ピクセルがカラーピクセルか、またはバックグラウンドピクセルであることを決定する。この決定は、ピクセルの彩度レベルおよび発光レベルを使用する。
実施形態において、方向検出は、見るためにテキストページをどちらの方向に直角に回転させるかを自動的に決定する。アルゴリズムの実施形態は、ページ内の黒の連結コンポーントから可能性のある個別の文字を選択し、訓練されたニューラルネットワークによって、それらの個別の方向を決定する。アルゴリズムは、方向の結果を、どちらのページの方向が最良であるか、または良くなるかを決定するために使用する。
実施形態において、仮想的な再収集は、ソフトウェアとしてインプリメントされ、収集デバイスから独立している。収集デバイスのユーザは、プロセッサ設定を変更することによって、収集されたアナログデータのデジタル表現の質をインタラクティブに強化し得る。あり得る調節は、輝度、コントラスト、ガンマ、エロージョン、方向、セグメンテーション、カラーレンダリング、彩度、解像度、ワーピングの角度、シーケンス検出からの外れ、拡張、スペックル除去およびスキュー角を含むがこれらに限定はされない。該実施形態は、例えば、それらの制限されたハードウェア能力によって、入力として、多種のアナログデータを仮定すると、通常は高い質のデジタルデータを持続的に生成することが不可能な収集デバイスに関して、価値がある。これらの場合には、実施形態は、収集デバイスの能力および有用性を強化するための費用対効果の高い方法である。
さらに、実施形態は、収集デバイスのユーザが、ユーザの個別の好みおよび要求に従って、デジタルデータを収集することを可能にする。
実施形態において、別の利点は、仮想的な再収集が収集デバイスから独立しているということである。仮想的な再収集によって使用されるアルゴリズムは、典型的には、収集デバイスのハードウェアの改良よりもかなり速いペースで進歩する。ユーザは、単に仮想的な再収集ソフトウェアをアップデートすることによって、アルゴリズム的な改良の利益を容易に享受し得る。この特性は、スキャナの減価償却費を減少させるか、または最小化することによって、例えば、高価なハイエンドのスキャナに対して価値がある。
さらなる実施形態において、上記される実施形態は、リモートに配置され、結果として、デジタルデータの1人以上のリモートの受信者に仮想的な再収集の能力を提供する。インプリメンテーションは、ソフトウェア、ファームウェア、ハードウェア、あるいはソフトウェア、ファームウェアまたはハードウェアの任意の組み合わせであり得る。
実施形態の例は、ファックスサーバマシンの使用についてである。データは、高解像度のアナログ形式で表現され、ファックス通信サーバのデータキャッシュに格納され、デフォルトの設定および属性を用いて得られたバイナリデータは、それぞれのあて先に送信される。ファックスサーバマシンにおいてインプリメントされたコールバックプロトコルを介して、ファックスの受信者は、ファックスサーバに格納された画像から特定の画像または画像の拡大されたエリアを選択し得、該選択された画像に対するプロセッサ設定および属性を特定し得る。該選択された画像または画像の拡大されたエリアは、特定された設定に従って再処理され、受信者に送信される。
イメージセットは、ファックスサーバにおいて、キャッシュに格納される。キャッシュがいっぱいであるか、または画像がユーザによってフルに処理されているときは、該画像は、消去されるか、送信された画像と置換されるか、データベースに格納されるか、またはこれらの任意の組み合わせを行われる。この実施形態は、ファックスの受信者が、受信されたファックスの質を、受信者のデスクトップまたはアプリケーション上で直接強化することを可能にし、不十分な画質の場合のファックスの再送信を時代遅れにさせる。
さらに、上述のコールバックプロトコルは、受信者が、白紙のような回復不能であり得る問題を送信者に警告することが可能である。最終的に、送信者は、ファックスを送信する間に、改良されたまたは最適な設定を推察する必要がない。
さらなる実施形態において、仮想的な再収集は、解析エンジンによって強化され、該解析エンジンは、収集されたデバイスの未加工データを入力として得る。解析エンジンは、収集デバイスに対する改良された設定または最適に近い設定を自動的に決定する。さらに、解析エンジンは、自動的に、収集デバイスによって得られたデジタルデータの質をモニタし、質が所定の閾値未満であるときにユーザに警告する。ユーザは、好みの閾値を調節し得る。さらに、ユーザは、解析エンジンによって決定された収集デバイスの設定を上書きし得、必要な場合または所望の場合には、インタラクティブに該設定を手動で調節し得る。
実施形態において、インタラクティブな調節が、非リアルタイムでなされ得、結果として、入来するデータのフローを邪魔しない。この実施形態は、例えば、莫大な量のアナログデータの収集を使用するか、または必要とする配置に対して、関心がある。それは、ほぼ自動的なデータ収集を可能にし、さらに結果として生じるデジタルデータの高い質を確実にする。典型的な例は、コピー機の部屋または設備であり、これらはスキャニングデバイスを用いて大量の紙のドキュメントを電子的にアーカイブする。
実施形態において、解析エンジンによって強化された仮想的な再収集は、ソフトウェア、ファームウェア、ハードウェアあるいはソフトウェア、ファームウェアまたはハードウェアの任意の組み合わせとしてインプリメントされ得る。ハードウェアインプリメンテーションは、ソフトウェアインプリメンテーションと比較すると速度に関する利点を提供し、大容量のデータを迅速かつ効率的に扱うことを可能にする。
さらなる実施形態において、解析エンジンによって強化された仮想的な再収集が、リモートに配置される。解析エンジンによって強化される、リモートに配置された仮想的な再収集は、ソフトウェア、ファームウェア、ハードウェアあるいはソフトウェア、ファームウェアまたはハードウェアの任意の組み合わせとしてインプリメントされ得る。
さらなる実施形態において、仮想的な再収集は、第1および第2の解析エンジンによって強化される。第2の強化エンジンは、特定のデータプロセッサ設定を用いて、第1の解析エンジンから得られた処理されたデジタルデータを解析する。この情報を利用すると、第2の解析エンジンは、新しいセットのデータプロセッサ設定を推定し、未加工データは新しい設定を用いて仮想的に再収集される。
実施形態において、処理は、十分に改良された設定または最適な設定が自動的に決定されるまで繰り返される。第1および第2の解析エンジンによって強化された仮想的な再収集は、ソフトウェア、ファームウェア、ハードウェアあるいはソフトウェア、ファームウェアまたはハードウェアの任意の組み合わせとしてインプリメントされ得る。
さらなる実施形態において、第1および第2の解析エンジンによって強化された仮想的な再収集は、リモートに配置される。リモートに配置された、第1および第2の強化エンジンによって強化された仮想的な再収集は、ソフトウェア、ファームウェア、ハードウェアあるいはソフトウェア、ファームウェアまたはハードウェアの任意の組み合わせとしてインプリメントされ得る。
実施形態において、データ処理システムは、データキャプチャデバイスからの未加工データまたは正規化されたデータを備え、該未加工データまたは該正規化されたデータは、コンピュータアクセス可能なストレージ媒体に格納され、第1の収集コントローラは、該未加工データまたは該正規化されたデータと通信する。該第1の収集コントローラは、該未加工データまたは該正規化されたデータの少なくとも一部を解析することにより、該未加工データまたは該正規化されたデータが第1のセットのパラメータ内にあるかどうかを決定するように構成されている。該未加工データまたは該正規化されたデータが、該第1のパラメータのセット内にない場合には、該第1の収集コントローラが、第1のセットのプロセッサ設定を生成する。該データ処理システムは、該第1の収集コントローラと通信するプロセッサであって、該プロセッサは、第1のセットのプロセッサ設定を用いて該未加工データまたは該正規化されたデータを処理するように構成されている、プロセッサと、該プロセッサと通信する該第2の収集コントローラとをさらに備えている。第2の画像収集コントローラは、処理されたデータの少なくとも一部を解析することにより、該処理されたデータが、第2のセットのパラメータ内にあるかどうかを決定するように構成されている。該処理されたデータが該第2のセットのパラメータ内にない場合には、第2の収集コントローラが、プロセッサは該未加工データまたは該正規化されたデータを再処理するために使用する第2のセットのプロセッサ設定を生成する。
別の実施形態において、データ処理方法は、コンピュータアクセス可能なストレージ媒体に、データキャプチャデバイスからの未加工データまたは正規化されたデータを格納することと、第1の解析エンジンを用いて、該未加工データまたは該正規化されたデータの少なくとも一部を解析することにより、該未加工データまたは該正規化されたデータが第1のセットのパラメータ内にあるかどうかを決定することとを包含する。該未加工データまたは該正規化されたデータが、該第1のセットのパラメータ内にない場合には、該方法は、該第1の解析エンジンを用いて第1のセットのプロセッサ設定を生成することと、該第1のセットのプロセッサ設定を用いて該未加工データまたは該正規化されたデータを処理することと、第2の解析エンジンを用いて該処理されたデータの少なくとも一部を解析することにより、該処理されたデータが第2のセットのパラメータ内にあるかどうかを決定することとを包含する。該処理されたデータが、該第1のセットのパラメータ内にない場合には、該方法は、該未加工データまたは該正規化されたデータを再処理するために該第2の解析エンジンを用いて第2のセットのプロセッサ設定を生成することを包含する。
さらに別の実施形態において、データ処理システムは、データキャプチャデバイスからの未加工データを格納するためのストレージ手段と、該未加工データの少なくとも一部を解析することによって、該未加工データが、第1のセットのパラメータ内にあるかどうかを決定するために該未加工データと通信する第1の解析手段であって、ない場合には、該第1の解析手段が第1のセットのプロセッサ設定を生成する、第1の解析手段とを備えている。該データ処理システムは、該第1のセットのプロセッサ設定を用いて該未加工データを処理するために該第1の解析手段と通信する処理手段と、該処理されたデータの少なくとも一部を解析することによって、該処理されたデータが第2のセットのパラメータ内にあるかどうかを決定するために該処理手段と通信する第2の解析手段であって、ない場合には、該第2の解析手段が、該処理手段が該未加工データを再処理するために使用する第2のセットのプロセッサ設定を生成する、第2の解析手段とをさらに備えている。
さらなる実施形態において、ドキュメント処理システムは、データキャプチャデバイスからのドキュメントデータであって、該ドキュメントデータはコンピュータアクセス可能なストレージ媒体に格納される、ドキュメントデータと、該ドキュメントデータと通信する第1の収集コントローラとを備えている。該第1の収集コントローラは、該ドキュメントデータの少なくとも一部を解析することによって、該ドキュメントデータが第1のセットのパラメータ内にあるかどうかを決定するように構成されている。該ドキュメントデータが第1のセットのパラメータ内にない場合には、該第1の収集コントローラが、第1のセットのプロセッサ設定を生成する。ドキュメント処理システムは、第1の収集コントローラと通信するプロセッサであって、該プロセッサは、該第1のセットのプロセッサ設定を用いて該ドキュメンドデータを処理するように構成されている、プロセッサと、該プロセッサと通信する第2の収集コントローラとをさらに備えている。第2の収集コントローラは、該処理されたドキュメントデータの少なくとも一部を解析することにより、該処理されたドキュメントデータが第2のセットのパラメータ内にあるかどうかを決定するように構成されている。該処理されたドキュメントデータが第2のセットのパラメータ内にない場合には、第2の収集コントローラが、該プロセッサが該ドキュメントデータを再処理するために使用する第2のセットのプロセッサ設定を生成する。
実施形態において、ドキュメント処理方法は、データキャプチャデバイスからのドキュメントデータを、コンピュータアクセス可能なストレージ媒体に格納することと、第1の解析エンジンを用いて、該ドキュメントデータの少なくとも一部を解析することにより、該ドキュメントデータが第1のセットのパラメータ内にあるかどうかを決定することとを包含する。該ドキュメントデータが第1のセットのパラメータ内にない場合には、該方法は、該第1の解析エンジンを用いて第1のセットのプロセッサ設定を生成することと、該第1のセットのプロセッサ設定を用いて該ドキュメントデータを処理することと、第2の解析エンジンを用いて該処理されたドキュメントデータの少なくとも一部を解析することにより、該処理されたドキュメントデータが、第2のセットのパラメータ内にあるかどうかを決定することとをさらに包含する。該処理されたドキュメントデータが第2のセットのパラメータ内にない場合には、該方法は、該ドキュメントデータを再処理するために、第2の解析エンジンを用いて第2のセットのプロセッサ設定を生成することをさらに包含する。
別の実施形態において、ドキュメント処理システムは、データキャプチャデバイスからのドキュメントデータを格納するためのストレージ手段と、該ドキュメントデータの少なくとも一部を解析することによって、該ドキュメントデータが、第1のセットのパラメータ内にあるかどうかを決定するために該ドキュメントデータと通信する第1の解析手段であって、ない場合には、該第1の解析手段が第1のセットのプロセッサ設定を生成する、第1の解析手段とを備えている。該ドキュメント処理システムは、該第1のセットのプロセッサ設定を用いて該ドキュメントデータを処理するために該第1の解析手段と通信する処理手段と、該処理されたドキュメントデータの少なくとも一部を解析することによって、該処理されたドキュメントデータが第2のセットのパラメータ内にあるかどうかを決定するために該処理手段と通信する第2の解析手段であって、ない場合には、該第2の解析手段は、該処理手段が該ドキュメントデータを再処理するために使用する第2のセットのプロセッサ設定を生成する、第2の解析手段と、をさらに備えている。
さらに別の実施形態において、ドキュメント処理システムは、スキャナからのドキュメントを受信するランダムアクセスキャッシュを備えており、該ドキュメントは、該ランダムアクセスキャッシュ内に複数のバンドとして、ランダムにアクセス可能な方法で格納される。該ドキュメント処理システムは、該ランダムアクセスキャッシュと通信するプロセッサであって、該ランダムアクセスキャッシュから該ドキュメントを得るように構成されており、該ドキュメントを処理するために使用されるプロセッサコントロール設定を有するプロセッサと、該プロセッサと相互接続される収集コントローラとをさらに備えている。該収集コントローラは、該処理されたドキュメントを解析することにより、該ドキュメント内の少なくとも1つのバンドについて異なるプロセッサコントロール設定をいつ使用するか、および該異なるプロセッサコントロール設定を用いて該バンドを再処理するために、該ランダムアクセスキャッシュ内に格納された該少なくとも1つのバンドに、どこで該プロセッサがランダムにアクセスするかを決定するように構成されている。
さらなる実施形態において、ドキュメント処理方法は、スキャナからのドキュメントをランダムアクセスキャッシュ内に複数のバンドとして、ランダムにアクセス可能な方法で格納することと、該ランダムアクセスキャッシュから該ドキュメントを得ることと、プロセッサコントロール設定を用いて該ドキュメントを処理することとを包含する。該方法は、解析エンジンを用いて該処理されたドキュメントを解析することにより、該ドキュメント内の少なくとも1つのバンドについて異なるプロセッサコントロール設定をいつ使用するかを決定することと、該異なるプロセッサコントロール設定を用いて該バンドを再処理するために、該ランダムアクセスキャッシュに格納された該少なくとも1つのバンドにランダムにアクセスすることとを包含する。
実施形態において、ドキュメント処理システムは、スキャナから受信されたドキュメントを、ストレージ手段内に複数のバンドとして、ランダムにアクセス可能な方法で格納するためのストレージ手段と、該ストレージ手段から該ドキュメントを得て、処理手段に関連するプロセッサコントロール設定を用いて該ドキュメントを処理するための処理手段とを備えている。該ドキュメント処理システムは、該処理されたドキュメントを解析することにより、該ドキュメント内の少なくとも1つのバンドについて異なるプロセッサコントロール設定をいつ使用するかを決定するための解析手段と、該異なるプロセッサコントロール設定を用いて該バンドを再処理するために、該ストレージ手段に格納された少なくとも1つのバンドにランダムにアクセスするためのアクセス手段とをさらに備えている。
本発明を要約する目的で、本発明の特定の局面、利点および新規な特徴が、本明細書に記載されている。必ずしも全てのこのような利点の全てが、本発明のあらゆる特定の実施形態に従って達成され得る必要はないことが理解されるべきである。従って、本発明は、本明細書で教示され、示唆され得るような他の利点を達成する必要なしに、本明細書で教示されるような1つの利点または一群の利点を達成または最適化する方法で具体化され、または実行され得る。
本発明の様々な特徴をインプリメントする概略的なアーキテクチャが、図面を参照して記載される。図面および関連する記載が、本発明の実施形態を示すために、かつ本発明の範囲を制限するためではなく、提供される。図面全体を通して、参照数字は、参照されるエレメント間の対応を示すために再使用される。さらに、各参照数字の最初の数字は、該エレメントが最初に現れる図面を示す。
(好ましい実施形態の詳細な記載)
図1は、データ収集および再スキャニングシステム150の実施形態のブロック図である。データ収集および再スキャニングシステム150は、データ収集デバイス100を備え、データ収集デバイス100は、データキャプチャデバイス101と、正規化プロセッサ102と、通信デバイス103とを備えている。データキャプチャデバイス101の例は、カメラ、ビデオレコーダ、赤外線カメラ、音響カメラ、デジタルカメラ、ファックスマシン、画像をキャプチャすることが可能な任意のデバイス、音響センサ、音響センサを有する任意のデバイスなどを含むがこれらに制限はされない。データキャプチャデバイス101は、例えば、スキャナのような非リアルタイムのデバイスであり得、または、データキャプチャデバイス101は、例えば、カメラおよびビデオレコーダのようなリアルタイムデバイスであり得る。
データ収集および再スキャニングシステム150は、ユーザシステム110をさらに備え、ユーザシステム110は、通信デバイス104を備え、通信デバイス104は、通信デバイス103、ランダムアクセスデータキャッシュ105、データプロセッサ106、ユーザインタフェース107およびデータディスプレイ108と通信する。実施形態において、ランダムアクセスデータキャッシュは、少なくとも1つのサブセクション、ゾーン、バンド、画像ストリップ、データストリップなどで、ランダムにアクセス可能な方法で、データを格納する。
データ再収集および再スキャニングシステム150は、アプリケーション/ストレージデバイス109をさらに備えている。該アプリケーション/ストレージデバイス109の例は、コンピュータプロセッサ、プログラム論理、制御回路網、汎用シングルチップまたはマルチチップマイクロプロセッサ、デジタル信号プロセッサ、組み込み型マイクロプロセッサ、マイクロコントローラなどを含むがこれらに制限はされない。データストレージの例は、揮発性および不揮発性メモリ、ハードドライブ、DVDストレージ、CD ROMストレージ、光学および磁気光学ストレージ、リムーバブルまたは非リムーバブルフラッシュメモリデバイス、あるいは別のメモリデバイスを含み得る。
アナログデータが収集デバイス100に提示される。アナログキャプチャデバイス101は、アナログデータを測定する。正規化プロセッサ102は、測定されたデータを正規化されたデータに変換する。正規化プロセッサ102は、アナログデータを測定するセンサによって誘起される公知のエラーおよびバイアスを較正し、補正することにより、正規化されたデータを生成する。
本明細書で以後未加工データと言う、該正規化された未加工データは、通信デバイス103および104を用いる高速接続を介して、ユーザシステム110まで送信され、ランダムアクセスデータキャッシュ105に格納される。未加工データは、ランダムアクセスキャッシュ105に、バンド、画像ストリップ、データストリップなどとして格納される。実施形態において、ランダムアクセスデータキャッシュ105は、64Kバイトのバンドにパーティションされる。
未加工データに加え、未加工データに関連するデータまたは各バンドに対するメタデータも、キャッシュ105に格納される。これらのメタデータは、データおよびキャッシュ内の位置を識別するタグ、収集の時刻および日付のスタンプ、シーケンスナンバー、データバンドの開始、データバンドの終了、高さ、幅、次のバンドへのポインタなどを含むがこれらに制限はされない。一部の実施形態においては、タグが未加工データのサブセクションまたはゾーンを識別する。
データプロセッサ106は、デフォルトのデータ処理プロセッサ設定を用いて未加工データを処理する。
未加工データが、データプロセッサ106によって処理される順序は、自動的にまたはインタラクティブに決定される。自動的な実施形態において、キャッシュ105に最初に格納された、もっとも最近の未加工データまたはより最近の未加工データが処理される。
インタラクティブな実施形態において、データタグまたはメタデータを利用して処理するために、ユーザは、これらの特定の未加工データのバンドまたはサブセクションを識別する。バンドは、キャッシュ105においてランダムにアクセス可能である。このことは、非リアルタイムの仮想の再収集を可能にする。
それらのメタデータを共に有する処理されたデータが、データディスプレイ108にディスプレイされる。デフォルトのデータプロセッサ設定は、ユーザインタフェース107を介して調節可能である。設定の変更は、データプロセッサ106をトリガし、ランダムアクセスデータキャッシュ105に格納された選択された未加工データを、変更された設定を用いて再処理し、該再処理されたデータをデータディスプレイ108に表示する。プロセッサ設定をインタラクティブに再調節することによって、データがユーザの好みを満足させるまで、データは処理される。
データプロセッサ106を制御することに加え、ユーザインタフェース107はまた、ランダムアクセスデータキャッシュ105を制御する。ユーザは、非リアルタイムのインタラクティブな処理のために、ユーザインフェース107を介して、未加工データのサブセクション、ゾーン、バンド、画像ストリップまたはデータストリップならびに選択する特定の未加工データにアクセスし得る。
ユーザは、処理されたデータを、さらなる処理ならびに格納のためにアプリケーション/ストレージデバイス109に送信し得る。
図1に描かれるデータ収集および再スキャニングシステム150は、複数のユーザの使用をサポートする。データ収集デバイス100は、複数のユーザによってアクセスされ得る。実施形態において、ユーザシステム110は、コンピュータをさらに備えている(図示されない)。実施形態において、ユーザシステム110は、コンピュータ上のソフトウェアとして、少なくとも部分的にインプリメントされる。
図2は、リモートに配置されたデータ収集および再スキャニングシステム250の実施形態のブロック図である。データ収集および再スキャニングシステム250は、データ収集デバイス100と、格納および処理システム212と、ユーザシステム210と、収集/ストレージデバイス109とを備えている。
格納および処理システム212は、通信デバイス103と、ランダムアクセスデータキャッシュ105と、データプロセッサ106と、通信デバイス203とを備えている。
ユーザシステム210は、通信デバイス204と、ユーザインタフェース107と、データディスプレイ108とを備えている。
収集デバイス100からの未加工データは、通信デバイス103および104を用いた高速接続を介して、格納および処理システム212まで送信される。未加工データおよびメタデータは、ランダムアクセスデータキャッシュ105に格納される。データプロセッサ106は、デフォルトのデータプロセッサ設定を用いて未加工データを処理する。
ユーザシステム210は、格納および処理システム212と、通信デバイス203および204を用いて、通信媒体216を介して通信する。
図2に示される通信媒体216にここで焦点をあてると、一実施形態において、通信媒体は、インターネットであり、インターネットはコンピュータのグローバルネットワークである。他の実施形態において、通信媒体216は、例として、専用の通信線、電話ネットワーク、無線データ送信システム、赤外線データ送信システム、双方向ケーブルシステム、特注のコンピュータネットワーク、インタラクティブキオスクネットワークなどを含む任意の通信システムであり得る。
処理されたデータは、それらのメタデータと共に、データディスプレイ108にディスプレイされる。デフォルトのデータプロセッサ設定は、ユーザインタフェース107を介して調節可能である。設定を変更することは、データプロセッサ106をトリガし、ランダムアクセスデータキャッシュ105に格納された選択された未加工データを、変更された設定を用いて再処理し、データディスプレイ108に再処理されたデータをディスプレイする。プロセッサ設定をインタラクティブに再調整することによって、データがユーザの好みを満足させるまで処理される。
ユーザは、さらなる処理ならびに格納のためにアプリケーション/ストレージ109に、処理されたデータを送信し得る。
データ収集および再スキャニングシステム250は、ユーザシステム210がデータ収集デバイス100ならびに格納および処理システム212からリモートに配置されるということを除けば、データ収集および再スキャニングシステム150に類似する。リモートに配置されたシステム250において、データキャッシュ105は、データ収集デバイス100に対してローカルである。ユーザシステム210は、該実施形態の効果的な使用を確実にするために高速接続を用いて、データ収集デバイス100と接続される必要はない。データ収集および再スキャニングシステム250は、ソフトウェア、ファームウェアまたはソフトウェアとファームウェアとの任意の組み合わせとして、少なくとも部分的にインプリメントされる。
図3は、解析エンジンを備えているデータ収集および再スキャニングシステム350の実施形態のブロック図である。データ収集および再スキャニングシステム350は、データ収集デバイス100と、ユーザシステム310と、アプリケーション/ストレージデバイス109とを備えている。ユーザシステム310は、通信デバイス104と、ランダムアクセスデータキャッシュ105と、データプロセッサ106と、ユーザインタフェース107と、データディスプレイ108と、解析エンジン314とを備えている。
アナログデータは、収集デバイス100に提示される。アナログキャプチャデバイス101はアナログデータを測定する。正規化プロセッサ102は、測定されたデータを正規化された未加工データに変換する。未加工データは、通信デバイス103および104を用いた高速接続を介して、ユーザシステム310まで送信される。ユーザシステム310において、未加工データはランダムアクセスデータキャッシュ105に格納される。
選択された未加工データは、解析エンジン314によって解析される。実施形態において、解析エンジン314は、収集コントローラ314である。選択機構は、上記の実施形態において記載されるように、自動的またはインタラクティブのいずれかであり得る。解析エンジン314によって行われる解析は、選択された未加工データに対する新しいデータプロセッサ設定を生じる。解析の例は、ページ境界検出、ストリーク検出、ページボーダ検出、ブランクページ検出、RGBカラー表現からYCbCrカラー表現への変換、色相測定、彩度測定、発光測定、グレースケール強度ヒストグラムを作成すること、色ヒストグラムを作成すること、幾何解析、色検出、輝度およびカラーレベルに対するガンマ検出、テキスト方向などを含むがこれらに限定はされない。
設定は、データプロセッサ106に移行され、未加工データは新しい設定で処理される。処理されたデータは、データディスプレイ108にディスプレイされる。データ処理設定は、ユーザインタフェース107を用いてインタラクティブに調節され得る。データ処理設定を決定することに加え、解析エンジン314はまた、潜在的に不十分な質の処理されたデータを生じる未加工データを自動的に検出し、これらのデータの選択をした際に、ユーザシステム310を介してユーザに警告する。対応するトラッピング条件(trapping condition)(例えば、輝度の範囲、コントラストの範囲、ミッシングコーナー、ブランクページなどのような質の閾値を特定するユーザ定義されたパラメータ)が、ユーザインタフェース107を介して、ユーザがアクセス可能である。ユーザシステム310を介してユーザは、収集されるデータの質を制御することが可能である。
ユーザシステム310は、処理されたデータを格納し得るとともに、さらなる処理ならびに格納のために、アプリケーション/ストレージデバイス109に送信し得る。さらに、ユーザは、ユーザインタフェース107を介して、データプロセッサ106で処理されるべき、ランダムアクセスデータキャッシュ105に格納された未加工データのサブセクションまたはゾーンにアクセスし得る。
データ収集および再スキャニングシステム350は、特定の未加工データの非リアルタイムのインタラクティブな処理を可能にする。データ収集および再スキャニングシステム350はまた、複数のユーザの使用をサポートする。データ収集デバイス100は、固有のプロセッサ設定を有する各データプロセッサ106を有する複数のユーザシステム310によってアクセスされ得る。実施形態において、データ収集および再スキャニングシステム350は、コンピュータをさらに備えている(図示されない)。実施形態において、データ収集および再スキャニングシステム350は、コンピュータ上のソフトウェアとして、少なくとも部分的にインプリメントされる。
図4は、データ収集デバイス100と、ユーザシステム410と、解析エンジン314とを備えているデータ収集および再スキャニングシステム450の実施形態のブロック図である。データ収集および再スキャニングシステム450は、図3に示されるデータ収集および再スキャニングシステム350をハードウェアとしてインプリメントする。
ランダムアクセスデータキャッシュ105、データプロセッサ106および解析エンジン314は、データ収集デバイス100においてインプリメントされる。データ収集デバイス100は、データキャプチャデバイス101と、正規化プロセッサ102と、通信デバイス103とをさらに備えている。ユーザシステム410は、通信デバイス104と、ユーザインタフェース107と、データディスプレイ108とを備えている。
図5は、リモートに配置された、解析エンジン314を備えているデータ収集および再スキャニングシステム550の実施形態のブロック図である。データ収集および再スキャニングシステム550は、収集デバイス100と、ストレージおよび処理システム512と、ユーザシステム510と、収集/ストレージデバイス109とを備えている。
格納および処理システム512は、通信デバイス104と、ランダムアクセスデータキャッシュ105と、データプロセッサ106と、解析エンジン314と、通信デバイス503とを備えている。
ユーザシステム510は、通信デバイス504と、ユーザインタフェース107と、データディスプレイ108とを備えている。
収集デバイス100からの未加工データは、通信デバイス103および104を用いる高速接続を介して、格納および処理システム512に送信される。未加工データおよびメタデータは、キャッシュ105に格納される。データプロセッサ106は、デフォルトのデータ処理設定を用いて未加工データを処理する。
選択された未加工データは、解析エンジン314によって解析される。解析エンジン314によって行われる解析は、選択された未加工データに対する新しいデータプロセッサ設定を生じる。設定は、データプロセッサ106に移行され、未加工データは新しい設定を用いて処理される。
ユーザシステム510は、通信デバイス503および504を用いた通信媒体216を介して格納および処理システム512と通信する。処理されたデータは、データディスプレイ108にディスプレイされる。データプロセッサ設定は、ユーザインタフェース107を用いてインタラクティブに調節され得る。
ユーザは、システム510を介して、処理されたデータを格納し得、さらなる処理ならびに格納のために、アプリケーション/ストレージデバイス109に送信し得る。さらに、ユーザは、ユーザインタフェース107を介して、データプロセッサ106において処理されるべき、ランダムアクセスデータキャッシュ105において格納された未加工データのサブセクションまたはゾーンにアクセスし得る。
データ収集および再スキャニングシステム550は、特定の未加工データの非リアルタイムのインタラクティブな処理を可能にする。データ収集および再スキャニングシステム550は、ユーザシステム510が、データ収集デバイス100ならびに格納および処理システム512からリモートに配置されることを除けば、データ収集および再スキャニングシステム350と類似する。リモートに配置されたシステム550において、データキャッシュ105および解析エンジン314は、データ収集デバイス100に対してローカルである。
データ収集および再スキャニングシステム550はまた、複数のユーザの使用をサポートする。データ収集デバイス100は、固有のプロセッサ設定を有する各データプロセッサ106を有する複数のユーザシステム510によってアクセスされ得る。データ収集および再スキャニングシステム550は、ソフトウェア、ファームウェアまたはソフトウェアとファームウェアとの組み合わせとして、少なくとも部分的にインプリメントされる。
図6は、リモートに配置された、解析エンジン314を備えているデータ収集および再スキャニングシステム650のハードウェアインプリメントされた実施形態のブロック図である。データ収集および再スキャニングシステム650は、図4に示されるデータ収集および再スキャニングシステム450を、リモートの配置でインプリメントする。データ収集および再スキャニングシステム650は、データ収集デバイス100と、ユーザシステム610と、アプリケーション/ストレージデバイス109とを備えている。
ランダムアクセスデータキャッシュ105、データプロセッサ106および解析エンジン314は、データ収集デバイス100上のハードウェアとして直接インプリメントされる。データ収集デバイス100は、データキャプチャデバイス101と、正規化プロセッサと、通信デバイス103とをさらに備えている。ユーザシステム610は、ユーザインタフェース107と、データディスプレイ108と、通信デバイス604とを備えている。
ユーザシステム610は、通信デバイス103および604を用いた通信媒体216を介してデータ収集デバイス100と通信する。
図7は、第1の解析エンジン714および第2の解析エンジン718を有するデータ収集および再スキャニングシステム750の実施形態のブロック図である。データ収集および再スキャニングシステム750は、データ収集デバイス100とユーザシステム710とを備えている。データ収集デバイス100は、データキャプチャデバイス101と、正規化プロセッサ102と、通信デバイス103とを備えている。ユーザシステム710は、通信デバイス104と、ランダムアクセスデータキャッシュ105と、データプロセッサ106と、ユーザインタフェース107と、データディスプレイ108とを備えている。ユーザシステム710は、第1の解析エンジン714と第2の解析エンジン718とをさらに備えている。実施形態において、第1および第2の解析エンジン714、718は、それぞれ、第1および第2の収集コントローラである。
アナログデータは、収集デバイス100に与えられる。データキャプチャデバイス101は、アナログデータを測定する。正規化プロセッサ102は、測定されたデータを正規化された未加工データに変換する。未加工データは、通信デバイス103および104を用いた高速接続を介して、ユーザシステム710に送信される。
ユーザシステム710において、未加工データは、データキャッシュ105において格納される。未加工データは、バンド、画像ストリップ、データストリップなどとして、ランダムアクセスデータキャッシュ105に格納される。実施形態において、ランダムアクセスデータキャッシュは、64Kバイトのバンドにパーティションされる。
未加工データに加え、未加工データに関連するデータまたは各バンドに対するメタデータはまた、キャッシュ105に格納される。これらのメタデータは、データおよびキャッシュ内の位置を識別するタグ、収集の時刻および日付のスタンプ、シーケンスナンバー、データバンドの開始、データバンドの終了、高さ、幅、次のバンドへのポインタなどを含むがこれらには制限されない。一部の実施形態において、タグは未加工データのサブセクションまたは未加工データのゾーンを識別する。
選択された未加工データは、解析エンジン714によって解析される。選択機構は、上記の実施形態において記載されるように、自動的またはインタラクティブのいずれかであり得る。第1の解析エンジン714によって行われる解析は、選択された未加工データに対する、改良されたデータプロセッサ設定または最適に近いデータプロセッサ設定を生じる。実施形態において、第1の解析エンジン714は、例えば、ドキュメントの方向、バックグラウンド補正、色補正、テキスト抽出、テキスト/バックグラウンド分離、ページ境界検出、ストリーク検出、ページボーダ検出、ブランクページ検出、RGBカラー表現からYCbCrカラー表現への変換、色相測定、彩度測定、発光測定、グレースケール強度ヒストグラムの作成、色ヒストグラムの作成、色検出、輝度およびカラーレベルに対するガンマ検出などのような幾何処理を行う。
設定はデータプロセッサ106に移行され、未加工データは設定を与えると処理される。
処理されたデータは、第2の検索エンジン718に移行される。実施形態において、プロセッサ106は、処理されたデータを解析のために第2の解析エンジン718に送信する。別の実施形態において、プロセッサ106は、処理されたデータを第1の解析エンジン714に送信し、第1の解析エンジン714が、処理されたデータを、解析のために第2の解析エンジン718に送信する。
第2の解析エンジン718において、処理されたデータが解析され、改良されたデータプロセッサ設定が決定される。第2の解析エンジン718は、処理されたデータの質を所定の測定基準と比較する。第2の解析エンジン718は、該測定基準によって決定されるような、処理されたデータの質に基づいて、新しいプロセッサ設定を選択する。
実施形態において、第2の解析エンジンは、例えば、不十分な光学文字認識のエリアの認識、非線形のガンマ、高いバックグラウンドノイズ、文字色の歪みなどのような特徴または質の処理を行う。実施形態において、第2の解析エンジンは、少なくとも部分的に、データディスプレイ108におけるユーザのデータレビューおよびユーザインタフェース107からのユーザの変更したプロセッサ設定の入力を置き換える。
新しい設定は、データプロセッサ106に送信され、未加工データは、該新しい設定を用いて再処理される。実施形態において、第2の解析エンジン718は、ランダムアクセスキャッシュ105内の未加工データの位置を含むメタデータおよび新しいプロセッサ設定をプロセッサ106に送信する。プロセッサ106は、新しいプロセッサ設定を用いて、データを処理する。
別の実施形態において、第2の解析エンジン718は、データに関連するメタデータおよび新しいプロセッサ設定を第1の解析エンジン714に送信する。第1の解析エンジン714は、ランダムアクセスキャッシュ105内の未加工データの位置を含むメタデータおよび新しいプロセッサ設定を受信し、ランダムアクセスキャッシュ105内の未加工データの位置を含むメタデータおよび新しいプロセッサ設定をプロセッサ106に送信する。プロセッサ106は、新しいプロセッサ設定を用いて、未加工データを処理する。
さらに別の実施形態において、第2の解析エンジン718は、データに関連するメタデータを第1の解析エンジン714に送信する。第1の解析エンジン714は、ランダムアクセスキャッシュ105内の未加工データの位置を含むメタデータおよび新しいプロセッサ設定を受信し、新しいプロセッサ設定を用いて、未加工データのバンドを処理する。
処理されたデータは、解析のために、第2の解析エンジン718に移行される。実施形態において、プロセッサ106は、処理されたデータを、解析のために第2の解析エンジン718に送信する。別の実施形態において、第1の解析エンジン714は、処理されたデータを、解析のために第2の解析エンジン718に送信する。別の実施形態において、プロセッサ106は、処理されたデータを、第1の解析エンジン714に送信し、第1の解析エンジン714は、処理されたデータを、解析のために第2の解析エンジン718に送信する。
変更されたデータプロセッサ設定を用いて未加工データを再処理するステップおよび処理されたデータを解析し、変更されたデータプロセッサ設定を決定するステップは、収束するまで、すなわち測定基準が処理されたデータの質における改良を全く検出しなくなるまで、繰り返される。このことは、改良されたプロセッサ設定または最適なプロセッサ設定を生じる。
例えば、スキャナは、1インチ当たり600ドット(dpi)の解像度でドキュメントをスキャンする。ドキュメントは、様々なフォントサイズのテキストを含む。未加工データは、ランダムアクセスキャッシュ105に、未加工データの各バンドに関連するメタデータと共に、バンドで格納される。
処理時間およびユーザ格納スペースを節約するために、第1の解析エンジン714は、例えば、上記の他のあり得る幾何処理設定と共に、200dpiの解像度でデータを処理するためのプロセッサ106の設定を送信する。
プロセッサ106は、第1の解析エンジン714からの設定を用いて未加工データを処理する。処理されたデータおよび関連するメタデータは、第2の解析エンジン718に移行される。
第2の解析エンジン718は、所定の測定基準を用いて処理されたデータを解析する。例えば、第2の解析エンジン718は、可能性としては、テキストサイズが小さすぎて200dpiの解像度で認識可能でないので、処理されたデータのバンドが認識可能でないことを決定する。第2の解析エンジン718は、400dpiの解像度で処理するために、認識不可能なデータのバンドに関連するメタデータを、新しいプロセッサ設定と共に、プロセッサ106に送信する。
プロセッサ106は、ランダムアクセスキャッシュ105内の未加工データの位置を含むメタデータおよび新しいプロセッサ設定を受信し、400dpiにおいて未加工データのバンドを処理する。プロセッサ106は、データの処理されたバンドおよびその関連するメタデータを、解析のために第2の解析エンジン718に送信する。
第2の解析エンジン718は、データの処理されたバンドが、所定の測定基準を満たすかどうかを決定する。満たさない場合には、第2の解析エンジン718は、未加工データのバンドを処理するために、バンドに関連するメタデータを、新しいプロセッサ設定と共に、プロセッサ106に送信する。例えば、第2の解析エンジン718は、バンド内のテキストが、400dpiの解像度でさえも認識不可能であることを決定し、600dpiの解像度で未加工データのバンドを処理するために、バンドに関連するメタデータを、新しいプロセッサ設定と共に、プロセッサ106に送信する。
データを解析し、新しいプロセッサ設定を用いて未加工データを再処理する処理は、第2の解析エンジン718が、処理されたデータが既定の測定基準を満たすことを決定するまで発生する。処理パラメータは、未加工データの全てを再処理することなしに、未加工データの一部またはバンドについて変更され得る。実施形態において、キャプチャされたデータの一部を再処理することは、処理時間およびデータ格納スペースをセーブする。
これらのステップによって得られた処理されたデータは、データディスプレイ108にディスプレイされる。データプロセッサ設定は、ユーザインタフェース107を用いて、インタラクティブに調節され得る。
データプロセッサ設定を決定することに加えて、第1の解析エンジン714および第2の解析エンジン718は、質の十分でない処理されたデータを生じる可能性のある未加工データを自動的に検出する。上記の対応するトラッピング条件は、ユーザインタフェース107を介してユーザがアクセス可能であり、ユーザが収集されるデータの質を効率良く制御することを可能にする。
さらに、ユーザは、ユーザインタフェース107を介して、データプロセッサ106において処理されるべき、ランダムアクセスデータキャッシュ105に格納された未加工データのサブセクションまたはゾーンにアクセスし得る。
データ収集および再スキャニングシステム750はまた、特定の未加工データの非リアルタイムのインタラクティブな処理を可能にする。ユーザは、処理されたデータを格納すると共に、さらなる処理のために、アプリケーション/ストレージデバイス109に送信し得る。データ収集および再スキャニングシステム750は、複数のユーザの使用をサポートする。収集デバイス100は、固有のプロセッサ設定を有する各データプロセッサ106を有する複数のユーザシステム710によってアクセスされ得る。実施形態において、データ収集および再スキャニングシステム750は、コンピュータをさらに備えている(図示されない)。実施形態において、データ収集および再スキャニングシステム750は、コンピュータ上のソフトウェアとして少なくとも部分的にインプリメントされる。
図8は、第1の解析エンジン714および第2の解析エンジン718を備えているデータ収集および再スキャニングシステム850の実施形態のブロック図である。データ収集および再スキャニングシステム850は、図7に示されるデータ収集および再スキャニングシステム750をハードウェアとしてインプリメントする。
データ収集および再スキャニングシステム850は、データ収集デバイス100と、ユーザシステム810と、アプリケーション/ストレージデバイス109とを備えている。ランダムアクセスデータキャッシュ105、データプロセッサ106、第1の解析エンジン714および第2の解析エンジン718は、データ収集デバイス100においてインプリメントされる。データ収集デバイス100は、データキャプチャデバイス101と、正規化プロセッサ102と、通信デバイス103とをさらに備えている。ユーザシステム810は、通信デバイス104と、ユーザインタフェース107と、データディスプレイ108とを備えている。
図9は、リモートに配置された、第1の解析エンジン714および第2の解析エンジン718を備えているデータ収集および再スキャニングシステム950の実施形態のブロック図である。データ収集および再スキャニングシステム950は、データ収集デバイス100と、格納および処理システム912と、ユーザシステム910と、収集/ストレージデバイス109とを備えている。
データ収集デバイスは、データキャプチャデバイス101と、正規化プロセッサと、通信デバイス103とを備えている。
格納および処理システム912は、通信デバイス104と、ランダムアクセスデータキャッシュ105と、データプロセッサ106と、第1の解析エンジン714と、第2の解析エンジン718と、通信デバイス903とを備えている。
ユーザシステム910は、通信デバイス904と、ユーザインタフェース107と、データディスプレイ108とを備えている。
収集デバイス100からの未加工データは、通信デバイス103および104を用いた高速接続を介して、格納および処理システム912に送信される。未加工データおよびメタデータは、キャッシュ105に格納される。データプロセッサ106は、デフォルトのデータプロセッサ設定を用いて、未加工データを処理する。
データ格納および処理システム912において、未加工データはデータキャッシュ105に格納される。選択された未加工データは、第1の解析エンジン714によって解析される。選択機構は、上記の実施形態において記載されたように、自動的またはインタラクティブのいずれかであり得る。第1の解析エンジン714によって行われる解析は、選択された未加工データを与えられると、改良されたデータプロセッサ設定または最適に近いデータプロセッサ設定を生じる。設定は、データプロセッサ106に移行され、未加工データは、与えられる設定を用いて処理される。
処理されたデータは、第2の解析エンジン718に移行される。第2の解析エンジン718において、処理されたデータは解析され、改良されたデータプロセッサ設定が決定される。第2の解析エンジン718は、測定基準を用いて処理されたデータの質を決定する。第2の解析エンジン718は、測定基準によって決定されたような、処理されたデータの質に依存して、新しいプロセッサ設定を選択する。改良された設定は、データプロセッサ106に送信され、未加工データが再処理される。変更されたデータプロセッサ設定を用いて処理されたデータを再処理するステップおよび処理されたデータを解析し、変更されたデータプロセッサ設定を決定するステップは、収束するまで、すなわち上記のように測定基準が、処理されたデータの質における改良を全く検出し得なくなるまで、繰り返される。このことは改良されたプロセッサ設定または最適なプロセッサ設定を生じる。
ユーザシステム910は、通信デバイス903および904を用いて通信媒体216を介して格納および処理システム912と通信する。処理されたデータは、データディスプレイ108においてディスプレイされる。データプロセッサ設定は、ユーザインタフェース107を用いて調節され得る。
ユーザは、ユーザシステム910を介して、さらなる処理ならびに格納のために、アプリケーション/ストレージ109に、処理されたデータを送信し得る。さらに、ユーザは、ユーザインタフェース107を介して、データプロセッサ106において処理されるべき、ランダムアクセスデータキャッシュ105において格納された未加工データのサブセクションまたはゾーンにアクセスし得る。
データ収集および再スキャニングシステム950は、特定の未加工データの非リアルタイムのインタラクティブな処理を可能にする。データ収集および再スキャニングシステム950は、データ収集および再スキャニングシステム750と類似し、ユーザシステム910が、データ収集デバイス100ならびに格納および処理システム912からリモートに配置されている。リモートに配置されたシステム950において、データキャッシュ105、データプロセッサ106、第1の解析エンジン714および第2の解析エンジン718は、データ収集デバイス100に対してローカルである。
データ収集および再スキャニングシステム950はまた、複数のユーザの使用をサポートする。データ収集デバイス100は、固有のプロセッサ設定を有する各データプロセッサ106を有する複数のユーザシステム910によってアクセスされ得る。データ収集および再スキャニングシステム950は、ソフトウェア、ファームウェアまたはソフトウェアとファームウェアとの組み合わせとして、少なくとも一部はインプリメントされる。
図10は、リモートに配置された、第1の解析エンジン714および第2の解析エンジン718を備えているデータ収集および再スキャニングシステム1050のハードウェアインプリメントされた実施形態のブロック図である。データ収集および再スキャニングシステム1050は、図8に示されるデータ収集および再スキャニングシステム850を、リモートの配置でインプリメントする。データ収集および再スキャニングシステム1050は、データ収集デバイス100と、ユーザシステム1010と、アプリケーション/ストレージデバイス109とを備えている。
ランダムアクセスデータキャッシュ105、データプロセッサ106、第1の解析エンジン714および第2の解析エンジン718は、収集デバイス100において、ハードウェアとしてインプリメントされる。データ収集デバイス100は、データキャプチャデバイス101と、正規化プロセッサ102と、通信デバイス103とをさらに備えている。
ユーザシステム1010は、ユーザインタフェース107と、データディスプレイ108と、通信デバイス1004とを備えている。ユーザシステム1010は、通信デバイス103および1004を用いて通信媒体216を介して、データ収集デバイス100と通信する。
図11は、複数のデータ収集デバイス100と複数のユーザシステム1110とを備えているデータ収集および再スキャニングシステム1150の実施形態のブロック図である。複数のユーザシステム1110は、複数のデータ収集デバイス100からリモートに配置される。
データ収集デバイス100は、データキャプチャデバイス101と、正規化プロセッサ102と、通信デバイス103と、ランダムアクセスデータキャッシュ105と、データプロセッサ106とを備えている。実施形態において、データプロセッサ106は、低い処理能力のエンジンである。
ユーザシステム1110は、ユーザインタフェース107と、データディスプレイ108と、通信デバイス1104と、解析エンジン1114とを備えている。実施形態において、解析エンジン1114は、高性能の解析プロセッサである。
アナログデータが収集デバイス100に与えられる。アナログキャプチャデバイス101は、アナログデータを測定する。正規化プロセッサ102は、測定されたデータを正規化された未加工データに変換する。データプロセッサ106は、データの変換に使用される。変換されたデータは、ランダムアクセスデータキャッシュ105に格納される。データ処理の例は、ドキュメント方向、バックグラウンド補正、色補正、テキスト抽出、テキスト/バックグラウンド抽出、閾値、相関、デスペックル(despeckle)などを含むが、これらに制限はされない。
リアルタイムのブロードキャストプッシュモードで作動する場合、またはユーザシステム1110のうちの少なくとも1つからの要求があると、選択されたキャッシュされたデータは、データプロセッサ106によって、スケールされかつ圧縮される。通信デバイス105は、スケールされかつ圧縮されたデータおよび関連するタグまたはメタデータを、通信デバイス103を用いて通信媒体216を介して、ユーザシステム1110に送信する。
実施形態において、タグデータは、キャプチャデバイスのアドレスおよびキャッシュ105内のデータ位置を備えている。実施形態において、メタデータは、データおよびキャッシュ内の位置を識別するタグ、収集の時刻および日付のスタンプ、シーケンスナンバー、データバンドの開始、データバンドの終了、高さ、幅、次のバンドへのポインタなどを備えているが、これらに制限はされない。タグデータは、通信媒体216の通信ネットワークプロトコルに組み込まれる。
ユーザシステム1110は、通信媒体216および通信デバイス1104を介してデータを受信する。データは解析エンジン1114によって解析される。解析が、ユーザによって決定された境界の外側となる解析結果によって特徴付けられる、いくつかの関連するデータエリアを検出した場合には、解析エンジン1114は、データに関連するタグおよび該データ内の関心のあるエリアの位置を送信することによって、ユーザインタフェース107を起動させる。
ユーザインタフェース107は、自動的な動作または手動的な動作であり得る。ユーザインタフェース107は、対応するデータキャプチャデバイス100から、新しい処理設定を有する新しいデータセットを要求するために、タグコンテンツおよびエリア位置を使用する。データプロセッサ106は、新しい設定を用いて選択されたデータを再処理し、データキャプチャデバイス100は、再処理されたデータをユーザシステム1110に再送信する。この仮想の再スキャン動作は、インタラクティブな処理であり、これは異なる設定またはウィンドウを使用し得る。
上記のインタラクティブな処理の間、データは、複数のキャプチャデバイス100によって、複数のユーザシステム1110にリアルタイムに送信され続ける。実施形態において、ユーザは、データディスプレイ108を介して、任意の入来するデータを視覚化し得る。実施形態において、受信するデータの任意の部分は、アプリケーション/ストレージデバイス109によって格納され得る。
実施形態において、ユーザシステム1110は、選択されたデータに関連する1つ以上のデータ収集デバイス100のデータキャッシュ105に、選択されたデータをロックし得る。ユーザシステム1110が、所望の解像度で選択されたデータを受信したときに、ユーザシステム1110はデータをアンロックする。実施形態において、ユーザシステム1110は、データをロックするために、許可レベルを有する。データキャッシュ105内のロックされていないデータは、先入れ先出しモデルにおいて上書きされる。
(例示的な実施形態)
このセクションは、仮想再スキャンワークフロー、方向検出方法、ブリードスルー検出方法、色検出方法、バックグラウンド平滑化方法、スキャンページ境界検出方法の例示的な実施形態を含む。
(例示的な仮想再スキャン(VRS)ワークフロー)
実施形態において、ユーザが、VRS処理を用いて画像をスキャンすることを選択する場合には、VRS処理はスキャナを初期化し、未加工の(処理されていない)マスタ画像を収集する。マスタ画像は、白黒でスキャンすることを選択した場合には、グレースケールであり、そうでなければマスタ画像は、ユーザが特定したところの、グレースケールまたは有色である。
VRS処理はまた、既定のスキャナ特定の設定を用いて、スキャナを初期化する。これらの設定は、VRS処理が性能を向上させることを助ける。例えば、設定のうちの1つは、オーバースキャニング(すなわち、VRSが良好なデスキュー動作を行い得るように要求されたサイズ以上をスキャンする)を行うことである。
スキャナは、特定された設定につき1つの画像をスキャンし、未加工画像は、スキャナからVRSキャッシュまで送信される。
VRSソフトウェアは、1つ以上の画像処理アルゴリズムを行う。実施形態において、解析エンジンはVRSを備えている。1つのアルゴリズムは、実際のページ境界が、スキャンされた未加工画像内であることを決定する。実施形態において、スキャンされた画像は、オーバースキャニングに起因するスキャナ導入されたバックグラウンドを含む。ページ境界を決定することが、黒、白、グレーなどのような種々のバックグラウンドに対してなされる。ストリーク検出のような技術が、例えば、汚れたスキャナカメラ/ランプ、ローラなどによって導入されたラインストリークに対して使用される。ページボーダシャドー検出のような他の技術が、ページ境界を決定するために使用される。
別の画像処理アルゴリズムが、スキャンされたページがブランクであるかどうかを決定する。ページは、スキャニングが裏表二重でなされたとき、ページがもう一方の側からブリードスルーする色を含み得る。アルゴリズムが、ページがコンテンツを含まないことを決定する場合には、該ページはユーザ設定に従って消去され得る。
別の画像処理アルゴリズムは、ページコンテンツを、RGBカラー表現からYCbCr(発光、色相および彩度フォーマット)に変換する。このことは、ページの色相および彩度の局面における多くの色が関連する動作を可能にし、結果として速度向上を生じる。スキャナが白黒で画像をスキャンする場合には、このステップは行われない。
さらに別の画像処理アルゴリズムが画像を解析する。あり得る解析としては、発光解析を行い、グレースケール強度情報をヒストグラムに抽出すること、色情報をカラーヒストグラムに抽出すること、ページ上で幾何解析を行うことなどである。
別の画像処理アルゴリズムは、ドキュメントが色を有するかどうかを、先の解析に基づいて検出する。カラーコンテンツがない場合には、アルゴリズムが、スキャナ設定を設定することにより、ドキュメントが白黒ドキュメントであることを示す。ドキュメントがバックグラウンド色を有し、バックグラウンド色が主色である場合には、アルゴリズムはスキャナ設定を設定することにより、ドキュメントがカラードキュメントであることを示す。さらに、ドキュメントがカラーコンテンツを含む場合には、ユーザはスキャナ設定を調節し、カラーコンテンツが、特定のドキュメントのコンテンツに関連するかどうか、または、例えば、黄色い紙上のドキュメントのようなドキュメントの主たる特性であるかの決定に基づいて、色を再処理したり、色を再処理しなかったりし得る。
別の画像処理アルゴリズムは、画像についてガンマ補正を行うことにより、輝度およびカラーレベルを調節する。
さらなる画像処理アルゴリズムは、先の解析に基づいて、ページ画像についてデスキューおよびクロッピングを行う。
さらに別の画像処理アルゴリズムは、画像中のテキストの方向を検出し、必要であれば、画像を直角に回転させる。
別の画像処理アルゴリズムは、例えば、バーコード検出、ラインフィルタリング、デスペックリング、裏書の文字列(endorsement string)で注釈をつけることなどのような他の動作を行う。
さらなる画像処理アルゴリズムは、バックグラウンド色を検出し、それらの色をマージすることによって、バックグラウンド平滑化を行う。
画像が自動的に補正され得ないという問題を有する場合には、画像処理ソフトウェアが、処理される画像および設定をユーザにディスプレイする。ユーザは、次いで画像に対する設定を決定する。ユーザが設定を変更すると、画像処理ソフトウェアは、ユーザ特定された設定を用いて上記の画像処理アルゴリズムのうちの1つ以上を実行し、処理された画像をユーザにディスプレイする。ユーザが画像を受け入れるときには、画像処理ソフトウェアは、ユーザによって選択された最終的な設定を用いて、未加工画像を再処理する。
別の実施形態において、第2の解析エンジンは、追加の解析を行い、処理された画像が所定の要求を満たすかどうかを決定する。画像が所定の要求を満たさない場合には、第2の解析エンジンが新しい設定を決定し、新しい設定を用いて未加工画像を再処理する。この処理は、画像が要求を満たすまで、繰り返す。
画像処理が完了すると、画像処理ソフトウェアは、画像をアプリケーションに送信する。
(例示的な方向検出)
実施形態において、方向検出アルゴリズムは、見るために、どちらの方向にテキストページを直角に回転させるべきかを自動的に検出する。アルゴリズムは、ページ内の黒の連結成分から可能性のある個別の文字を選択する。アルゴリズムは、次いで、訓練されたニューラルネットワークを使用することによって、個別の文字の方向を決定する。アルゴリズムは、より良いページ方向を決定するためにニューラルネットワークの方向の結果を使用する。
アルゴリズムは、ページ画像内の連結コンポーネントを見出す。これらのコンポーネントのいくつかが、図形要素を含み得るので、アルゴリズムは、ページ画像内の文字でないものを取り除くために、多くの制約を使用する。該制約の例は、ピクセル数が所定の閾値を超えることと;幅および高さの両方が大きすぎることと;幅に対する高さの比が所定の閾値を超えないことと;その文字枠のエリアに対する連結コンポーネントの黒いピクセルの数の比率が大きすぎないか、または小さすぎないことと;成分のサイズがページのサイズに近付かないことと;水平方向または垂直方向のいずれかで文字を横切るラインに沿った、白から黒および黒から白への遷移の数が、大きすぎないこととである。
このテストをパスするコンポーネントのいくつかは、グルーされた(glued)文字、破損した文字の破片などを含み得る。実施形態において、合理的な画質を仮定すると、統計的に意味のある大多数が個別の文字を含む。
アルゴリズムは、成分の各々を、20×20ピクセルのグレースケールの正方形にフィットするように比例的にスケールを合わせられる。アルゴリズムは、次いで、グレースケールの正方形の周囲に2ピクセルの白い余白を加え、結果生じる24×24の画像を、方向検出のために訓練されたフィードフォワード型(feed−forward)ニューラルネットワークに送信する。
アルゴリズムで使用されるニューラルネットワークは、実施形態において、576の入力を144の特徴に変換する事前処理レイヤを有する。該特徴は、それぞれ180個および80個のノードの2つの隠れたレイヤを通る。ニューラルネットワークの結果は、「上」、「下」、「左」または「右」の方向における信頼度を示す4つの出力である。その、ガボールウェーブレット(Gabor Wavelet)を使用して、やや異なる事前処理を有するニューラルネットワークが、論文「A Subspace Projection Approach to Feature Extraction:The Two−Dimensional Gabor Transform for Character Recognition」、Neural Network、7(8)、pp.1295−1301、1994年および「Neural Network Positioning and Classification of Handwritten Characters」、Neural Networks、9(4)、pp.685−693、1996年に記載されている。ニューラルネットワークの訓練は、ランタイムアルゴリズムの一部ではなく、例えば、Arial、Times Roman、Courierなどのような一般的なビジネスフォントからスケールされた文字を用いてオフラインで行われる。
次いで、アルゴリズムは、もっとも高い信頼度のレベルを有する方向を受容するかどうかを決定する。該アルゴリズムは、所定の閾値を超える信頼度の比率に基づいて決定する。
精度の向上または精度の最大化のために、実施形態において、ページの解析は、ページ内で見出されたコンポーネントを利用する。典型的に、ほとんどのテキストページに対して、わずかなパーセンテージのコンポーネントは、信頼ある決定をするために十分である。精度と速度との間の合理的なトレードオフを達成するために、ページは、いくつかのセットのストライプに分割される。各セットのストライプは、ページ上に分散され、準ランダムにコンポーネントの選択をする。実施形態において、第1のセット内の良好な連結コンポーネントの数が既定の数を超え、投票が自信を持って勝利する方向が決定する場合には、アルゴリズムは結果を返す。そうでない場合には、最終条件が満たされるまで、またはページ上の全てまたは所定のパーセンテージが検査されるまで、ストライプの次のセットが処理され、次いでその次のセットが処理されるなどする。
文字形状の認識は、フォントサイズおよび解像度が小さくなるにつれ、より困難になる。実施形態において、アルゴリズムを良好に行うために、バイナリキャラクタの高さは16ピクセルを超える。アルゴリズムは、高さ8ピクセルまでの文字に対して、それなりの劣化を示し得る。
実施形態において、アルゴリズムは、ページ上の連結コンポーネントの大部分が個別の文字であることを仮定し得る。
アルゴリズムの実施形態は、ラテンアルファベットを用いて訓練されている。ラテンアルファベットとキリルアルファベットとの間ならびにラテンアルファベットとギリシャアルファベットとの間には多くの共通の形状があるので、アルゴリズムはまた、キリル文字およびラテン文字に対して良好に行われる。アルゴリズムは、様々な文字セットに対して具体的に訓練され得る。
(例示的なブリードスルー検出)
ブリードスルー検出アルゴリズムの実施形態は、これらのページについてさらなる画像処理を行うために、スキャンされたドキュメントの面のブリードスルーを検出することを自動的に扱う。実施形態において、アルゴリズムは、面の位置をおおむね適合させるために、フロントスキャンおよびバックスキャンされたページ内のページ境界検出を用いる。次に、アルゴリズムは、マッピングを微調整するために存在する色またはグレーコンテンツを使用する。この追加のステップは、フロントカメラおよびバックカメラのわずかに異なるオプティックおよびスキューに起因して使用され得る。残りの(説明されない)コンテンツが、所定の密度基準未満である場合には、アルゴリズムは該ページがブランクであることを決定する。
実施形態において、アルゴリズムは、スキャナのバックグラウンドに対するページの各面を検出する。次にアルゴリズムは、ページの両面について個々にブランクページ検出を行い、ブリードスルーの有無にかかわらず、ページの片面または両面が、ブランクであるかどうかを決定する。片面または両面がブランクである場合、アルゴリズムは終了する。
片面または両面が、ブランクでない場合、アルゴリズムは、両面についてのメインのバックグラウンドを決定する。次に、アルゴリズムは、より大きな量のコンテンツを有する面を表面として選択する。次に、アルゴリズムは、対応するページの長方形を用いて表面に裏面をマッピングする。
バックグラウンドと十分に異なる色を有する暗いピクセルが両面でマークされ、マスク画像を形成する。アルゴリズムは、マスク画像をブロックごとに局所的に解析することにより、粗いマッピングに対する局所的なシフトを決定する。次に、該アルゴリズムは、表面に対する裏面のマッピングをファイナライズするために、最小二乗平均近似を使用する。アルゴリズムは、表面のより暗いコンテンツから既定の距離内の裏面上のコンテンツを無効にし、次いでアルゴリズムは、残りの画像を、ブランクページ検出ステップに送信する。
(例示的な色検出)
色検出アルゴリズムの実施形態は、スキャンされた画像内のカラーコンテンツを検出し、フォアグラウンドの色とバックグラウンドの色とを区別する。アルゴリズムは、バックグラウンド色が、ドキュメントにおいてもっとも卓越した色である場合には、それを除く。該アルゴリズムは、スキャンされた画像内のピクセルを検査し、該ピクセルがカラーピクセルであるかどうか、および該ピクセルがバックグラウンドピクセルであるかどうかを決定する。この決定は、ピクセルの彩度および発光レベルを使用する。
実施形態において、アルゴリズムは、画像を、RGB表現からYCbCr(ルーマおよびクロミナンス)表現に変換する。アルゴリズムは、ピクセルの彩度成分を見て、彩度レベルを決定する。彩度は、ピクセル内の色の量の測度を提供する。彩度が高くなればなるほど、色はより鮮やかになる。値が小さくなればなるほど、ピクセルが含む色はより少なくなる。彩度は、0〜182の間の数として表現され、これは彩度を計算するために使用される数式に由来する。実施形態における、ユーザ調節可能な色の閾値は、ピクセルがカラーピクセルであるかどうかを決定するために使用される。彩度の値が閾値よりも大きい場合には、ピクセルはカラーであり、そうでなければカラーではない。
アルゴリズムは、ピクセルがバックグラウンドピクセルであるかどうかを決定する。スキャナがドキュメントをスキャンするときには、ドキュメントおよび/またはスキャナの白または黒のバックグラウンドは、低い彩度の光または暗い色として見え得る。多くの画像に対して、バックグラウンドのピクセルの量は、全エリアの大きなパーセンテージである。画像の白および/または黒のバックグラウンド部分の寄与を除外するために、色検出アルゴリズムは、白いバックグラウンドの閾値、黒いバックグラウンドの閾値およびバックグラウンドの彩度の閾値を使用することにより、バックグラウンドのピクセルのメンバシップを決定する。実施形態において、ピクセルの発光が白いバックグラウンドの閾値よりも高いか、または黒いバックグラウンドの閾値よりも低く、かつピクセルの彩度がバックグラウンドの彩度の閾値よりも小さい場合には、ピクセルはバックグラウンドピクセルとして分類される。その他の場合には、ピクセルはバックグラウンドではないピクセルである。
アルゴリズムは、バックグラウンドではないピクセルを解析して、それらの彩度の値に基づくピクセルのヒストグラムを構築することによって、様々なカラーコンテンツを決定する。スキャナは、ランプまたはカメラによって、一部のカラーをスキャンされた画像に導入し得る。汚れたカメラは、例えば、カラースポットを加え得る。ピクセルの色の彩度の値が、所定の閾値未満である場合には、アルゴリズムはピクセルがカラーを有していないことを決定する。そうではない場合には、ピクセルが有効なカラーであると考えられる。ドキュメントが任意の有効なカラーを含む場合には、ドキュメントはカラードキュメントであると考えられる。
(例示的なバックグラウンド平滑化)
バックグラウンド平滑化アルゴリズムの実施形態は、画像のバックグラウンド内の色の数を減少させることにより、画像の外観を向上させ、ならびに圧縮後の画像のサイズを減少させる。
アルゴリズムは、画像内に見出される色をクラスタし、バックグラウンドと考えられるために十分な量のピクセルを含むそれらを選択する。
アルゴリズムは、バックグラウンドのクラスタの同時発生を決定することにより、2つ以上のクラスタが実際に単一のバックグラウンドを表すかどうかを決定する。これらのタイプのバックグラウンドは、ディザ法によって、または目がバックグラウンド内で平均化された色として知覚するマイクロドットを用いることによって、一般的に生成される。スキャナが高い解像度で、画像をスキャンする場合に、個々の色がピクセルの各々に対して見られる。アルゴリズムは、同時発生するクラスタをマージし、該クラスタに対する平均色を計算する。
次いで、アルゴリズムは、バックグラウンドは、わずかに暗いまたはわずかに明るい色を有する隣接したクラスタを有するかどうかを決定する。しばしば、スキャニングしたときに、例えば、輸送を経験する紙は、ローラおよび紙上に作用する力によって、曲げられ、画像内に影およびハイライトを生成し得る。これらの影およびハイライトは、異なるクラスタとして知覚され得、それらはメインのバックグラウンドと共にマージされ得る。
アルゴリズムは、画像を検索し、ピクセルの色が、バックグラウンドクラスタの1つに属するかどうかを決定することによって、ピクセルごとに画像を変更する。ピクセルが、バックグラウンドクラスタに属する場合には、アルゴリズムは、ピクセルの色をクラスタの平均された色に変更する。
(例示的なスキャンページ境界の検出)
スキャンページ境界の検出のアルゴリズムは、スキャンされた画像内のページ境界を自動的に検出する。一般的に、産業において使用されるページスキュー検出アルゴリズムは、非常に暗いスキャナのバックグラウンドと典型的に白いページとの間のコントラストが、はっきりしていてミスすることがない黒いバックグラウンドのスキャニングに対してのみ信頼性を有して作動する。実施形態において、このアルゴリズムは、任意のバックグラウンドに対するページを検出し、従って、白いバックグラウンドのスキャナに対してさえも、ページスキュー補正を行い、クロッピングする。
スキャナのバックグラウンドとページのバックグラウンドとの間には非常に小さいカラーレベルまたはグレーレベルがあり得るので、差だけでは、ページ境界点を検出するためには信頼され得ない。代わりに、アルゴリズムは、解析のピクセルを中心に置いた小さなウィンドウにおいて収集された統計量を計算し、比較する。アルゴリズムは、これらの統計量と、アルゴリズムはスキャナのバックグラウンドであると予期する、スキャンされた画像の角において収集された統計量の範囲とを比較する。
アルゴリズムは、スキャンされた画像の4つの角において統計量を計算する。ページのコンテンツが角の近くにある場合に起こり得る、角の一部が均一でない場合には、アルゴリズムは、均一でない角を考慮しない。
角のいくつかが、その他の角と非常に異なっている場合には、アルゴリズムは多数の似た角を選択する。該選択が、同等に信頼性のある代替案の間でなされなければならない場合、アルゴリズムは、オーバークロッピングされたページのバックグラウンドを不適格にするために、該角を、スキャンされた画像の内側のバックグラウンドと比較する。
角を適格にするために、アルゴリズムは、後の使用のために、スキャナのバックグラウンドの統計量を合計する。
アルゴリズムはスキャンされた画像の行および列を検索し、スキャナのバックグラウンドの統計特性と非常に異なる統計特性を有する最初のピクセルおよび最後のピクセルを探す。所定の閾値は、スキャナのバックグラウンドの範囲からのピクセル中心のウィンドウのずれの有意性を決定する。
検出された最初のバックグラウンドでないピクセルおよび最後のバックグラウンドでないピクセルは、エッジの点の候補を決定するために使用され得る。いくつかの制約が、異常値を取り除くために使用される。例えば、ページの左の境界を検索する場合には、エッジの点の候補は、上下にすぐ近くの隣接するセグメントを有し、該セグメントを接続することによって形成される角度は90度から45度の範囲内である。エッジの点の候補は、最小二乗平均近似の変形を用いて解析され、ページのメインの長方形を表す最良の直線を見出す。アルゴリズムは、長方形をサポートするエッジの点と、ページのサイズ、スキャンの解像度などに依存し得る可能性のあるエッジの点の最大の数との比に基づいて、信頼性のある測定基準を見出された長方形に割り当てる。
アルゴリズムがスキューの角度を決定した後、アルゴリズムは、ページのメインの長方形の外側の個々のエッジの点が、仮定されるページの長方形の形状からのタブまたはずれの存在を示すためのそれらの隣接するものからの十分なサポートを有するかどうかを決定する。意味があると考えられるエッジの点は、クロップラインを決定するために使用される。
デュアルスキャニングの場合には、アルゴリズムは、ページ画像の表面と裏面との間のスキュー角度を両立するようにする。表面で検出されるスキュー角度が、裏面で検出されるスキュー角度と異なる場合には、2つのうちの1つが誤りである可能性がある。この場合には、アルゴリズムは、より高い信頼性と関連する角度を使用し、もう一方の側に対するクロップラインを再計算する。
同様に、表面および裏面のクロップラインが大きく異なる場合には、アルゴリズムは、ページ画像の表面と裏面との間のクロップラインを両立するようにする。アルゴリズムは、ページのメインの長方形とそのクロップラインとの間の差を考慮することにより、スキャナのアーティファクトに起因する延伸を決定かつ除去する。
実施形態において、ページ境界の検出アルゴリズムは、スキャナのバックグラウンドが均一であることと、スキャン幅にわたる個々のセンサ間の輝度の変化が重要でないことと、ストリークを引き起こす、機能不全または較正不足のセンサがほとんどないことを仮定する。
本発明の特定の実施形態が記載されたが、これらの実施形態は例示のみのために示され、本発明の範囲を制限することを意図されない。実際に、本明細書に記載された新規の方法およびシステムは、種々の他の形態で組み込まれ得、さらに、本明細書に記載された方法およびシステムの形態における他の省略、置換および変更が、本発明の精神から逸脱することなくなされ得る。添付する特許請求の範囲およびそれらの均等物は、このような形態または変更が、本発明の範囲および精神に含まれるようにカバーすることが意図される。
図1は、データ収集および再スキャニングシステムの実施形態のブロック図である。 図2は、リモートに配置されたデータ収集および再スキャニングシステムの実施形態のブロック図である。 図3は、解析エンジンを有するデータ収集および再スキャニングシステムの実施形態のブロック図である。 図4は、解析エンジンを有するデータ収集および再スキャニングシステムのハードウェアインプリメントされた実施形態のブロック図である。 図5は、リモートに配置された、解析エンジンを有するデータ収集および再スキャニングシステムの実施形態のブロック図である。 図6は、リモートに配置された、解析エンジンを有するデータ収集および再スキャニングシステムのハードウェアインプリメントされた実施形態のブロック図である。 図7は、第1および第2の解析エンジンを有するデータ収集および再スキャニングシステムのハードウェアインプリメントされた実施形態のブロック図である。 図8は、第1および第2の解析エンジンを有するデータ収集および再スキャニングシステムの実施形態のブロック図である。 図9は、リモートに配置された、第1および第2の解析エンジンを有するデータ収集および再スキャニングシステムの実施形態のブロック図である。 図10は、リモートに配置された第1および第2の解析エンジンを有するデータ収集および再スキャニングシステムのハードウェアインプリメントされた実施形態のブロック図である。 図11は、複数の収集デバイスを備え、複数のユーザを有するデータ収集および再スキャニングシステムの実施形態のブロック図である。

Claims (30)

  1. コンピュータインプリメントされたデータ処理方法であって、
    コンピュータアクセス可能なストレージ媒体に、データキャプチャデバイスからの未加工データまたは正規化されたデータを格納することと、
    第1の解析エンジンを用いて該未加工データまたは該正規化されたデータの少なくとも一部を解析することにより、該未加工データが第1のセットのパラメータ内にあるかどうかを決定し、ない場合には、該第1の解析エンジンを用いて第1のセットのプロセッサ設定を生成することと、
    該第1のセットのプロセッサ設定を用いて該未加工データまたは該正規化されたデータを処理することと、
    第2の解析エンジンを用いて該処理されたデータの少なくとも一部を解析することにより、該処理されたデータが第2のセットのパラメータ内にあるかどうかを決定し、ない場合には、該未加工データまたは該正規化されたデータを再処理するために、該第2の解析エンジンを用いて第2のセットのプロセッサ設定を生成することと
    を包含する、方法。
  2. 前記第2のセットのプロセッサ設定を用いて前記未加工データまたは前記正規化されたデータを再処理することをさらに包含する、請求項1に記載の方法。
  3. 前記第2の解析エンジンを用いて前記処理されたデータの少なくとも一部を解析することにより、該処理されたデータが前記第2のセットのパラメータ内にあるかどうかを決定するステップと、
    前記未加工データを再処理するために該第2の解析エンジンを用いて前記第2のセットのプロセッサ設定を生成するステップと、
    該処理されたデータが該第2のセットのパラメータを有するまで、前記第2のセットのプロセッサ設定を用いて該未加工データを再処理するステップと
    を繰り返すことをさらに包含する、請求項2に記載の方法。
  4. 前記データキャプチャデバイスは、スキャナ、カメラ、赤外線カメラ、音響カメラ、デジタルカメラ、ビデオレコーダ、音響センサまたはファックスマシンである、請求項1に記載の方法。
  5. 前記処理することは、少なくとも1つの画像処理アルゴリズムを適用することを包含する、請求項1に記載の方法。
  6. 前記処理することは、少なくともデータ処理アルゴリズムを適用することを包含する、請求項1に記載の方法。
  7. 前記処理することは、方向検出アルゴリズム、ブリードスルー検出アルゴリズム、色検出アルゴリズム、バックグラウンド平滑化アルゴリズムおよびスキャンページ境界アルゴリズムのうちの少なくとも1つを適用することを包含する、請求項1に記載の方法。
  8. 前記第1のセットのパラメータは、未加工データの解析または正規化されたデータの解析に関連する、請求項1に記載の方法。
  9. 前記第2のセットのパラメータは、処理されたデータの解析に関連する、請求項1に記載の方法。
  10. 前記第2のセットのパラメータは、ターゲットデータに関する処理されたデータの解析に関連する、請求項1に記載の方法。
  11. 前記第2のセットのパラメータは、所定の測定基準である、請求項1に記載の方法。
  12. データキャプチャデバイスからの未加工データまたは正規化されたデータであって、該未加工データまたは該正規化されたデータは、コンピュータアクセス可能なストレージ媒体に格納される、未加工データまたは正規化されたデータと、
    該未加工データまたは該正規化されたデータと通信する第1の収集コントローラであって、該第1の収集コントローラは、該未加工データまたは該正規化されたデータのうちの少なくとも一部を解析することにより、該未加工データまたは該正規化されたデータが第1のセットのパラメータ内にあるかどうかを決定し、ない場合には、該第1の収集コントローラは第1のセットのプロセッサ設定を生成するように構成されている、第1の収集コントローラと、
    該第1の収集コントローラと通信するプロセッサであって、該プロセッサは、該第1のセットのプロセッサ設定を用いて該未加工データまたは該正規化されたデータを処理するように構成されている、プロセッサと、
    該プロセッサと通信する第2の収集コントローラであって、該第2の収集コントローラは、該処理されたデータの少なくとも一部を解析することにより、該処理されたデータが第2のセットのパラメータ内にあるかどうかを決定し、ない場合には、該第2の収集コントローラは、該プロセッサが該未加工データを再処理するために使用する第2のセットのプロセッサ設定を生成するように構成されている、第2の収集コントローラと
    を備えている、データ処理システム。
  13. 前記データ収集デバイスは、スキャナ、カメラ、赤外線カメラ、音響カメラ、デジタルカメラ、ビデオレコーダ、温度センサ、音響センサまたはファックスマシンである、請求項12に記載のデータ処理システム。
  14. 前記処理することは、少なくとも1つの画像処理アルゴリズムを適用することを包含する、請求項12に記載のデータ処理システム。
  15. 前記処理することは、少なくとも1つのデータ処理アルゴリズムを適用することを包含する、請求項12に記載のデータ処理システム。
  16. 前記処理することは、方向検出アルゴリズム、ブリードスルー検出アルゴリズム、色検出アルゴリズム、バックグラウンド平滑化アルゴリズムおよびスキャンページ境界アルゴリズムのうちの少なくとも1つを適用することを包含する、請求項12に記載のデータ処理システム。
  17. 前記第1のセットのパラメータは、処理されたデータの解析に関連する、請求項12に記載のデータ処理システム。
  18. 前記第1のセットのパラメータは、ターゲットデータに関する処理されたデータの解析に関連する、請求項12に記載のデータ処理システム。
  19. 前記第2のセットのパラメータは、定性解析に関連する、請求項12に記載のデータ処理システム。
  20. データキャプチャデバイスからのドキュメントデータであって、該ドキュメントデータは、コンピュータアクセス可能なストレージ媒体に格納される、ドキュメントデータと、
    該ドキュメントデータと通信する第1の収集コントローラであって、該第1の収集コントローラは、該ドキュメントデータの少なくとも一部を解析することにより、該ドキュメントデータが第1のセットのパラメータ内にあるかどうかを決定し、ない場合には、該第1の収集コントローラが、第1のセットのプロセッサ設定を生成する、第1の収集コントローラと、
    該第1の収集コントローラと通信するプロセッサであって、該プロセッサは、該第1のセットのプロセッサ設定を用いて該ドキュメントデータを処理するように構成されている、プロセッサと、
    該プロセッサと通信する第2の収集コントローラであって、該第2の収集コントローラは、該処理されたドキュメントデータの少なくとも一部を解析することにより、該処理されたドキュメントデータが第2のセットのパラメータ内にあるかどうかを決定し、ない場合には、第2の収集コントローラが、該プロセッサが該ドキュメントデータを再処理するために使用する第2のセットのプロセッサ設定を生成するように構成されている、第2の収集コントローラと
    を備えている、ドキュメント処理システム。
  21. 前記データキャプチャデバイスは、スキャナ、カメラ、赤外線カメラ、音響カメラ、デジタルカメラ、ビデオレコーダ、音響センサまたはファックスマシンである、請求項20に記載のドキュメント処理システム。
  22. 前記処理することは、少なくとも1つの画像処理アルゴリズムを適用することを包含する、請求項20に記載のドキュメント処理システム。
  23. 前記処理することは、方向検出アルゴリズム、ブリードスルー検出アルゴリズム、色検出アルゴリズム、バックグラウンド平滑化アルゴリズムおよびスキャンページ境界アルゴリズムのうちの少なくとも1つを適用することを包含する、請求項20に記載のドキュメント処理システム。
  24. 前記第1のセットのパラメータは、幾何解析に関連する、請求項20に記載のドキュメント処理システム。
  25. 前記第2のセットのパラメータは、定性解析に関連する、請求項20に記載のドキュメント処理システム。
  26. 前記第2のセットのパラメータは、光学文字認識に関する定性解析に関連する、請求項20に記載のドキュメント処理システム。
  27. 前記第2のセットのパラメータは、分類に関する定性解析に関連する、請求項20に記載のドキュメント処理システム。
  28. 前記第2のセットのパラメータは、テキスト分類に関する定性解析に関連する、請求項20に記載のドキュメント処理システム。
  29. 前記第2のセットのパラメータは、画像分類に関する定性解析に関連する、請求項20に記載のドキュメント処理システム。
  30. 前記第2のセットのパラメータは、フォーム認識に関する定性解析に関連する、請求項20に記載のドキュメント処理システム。
JP2008503002A 2005-03-24 2006-03-01 スキャンされたデータを処理するシステムおよび方法 Active JP5001256B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US66506705P 2005-03-24 2005-03-24
US60/665,067 2005-03-24
US11/329,999 2006-01-11
US11/329,999 US8749839B2 (en) 2005-03-24 2006-01-11 Systems and methods of processing scanned data
PCT/US2006/007150 WO2006104627A1 (en) 2005-03-24 2006-03-01 Systems and methods of processing scanned data

Publications (2)

Publication Number Publication Date
JP2008537861A true JP2008537861A (ja) 2008-09-25
JP5001256B2 JP5001256B2 (ja) 2012-08-15

Family

ID=36570665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008503002A Active JP5001256B2 (ja) 2005-03-24 2006-03-01 スキャンされたデータを処理するシステムおよび方法

Country Status (4)

Country Link
US (3) US8749839B2 (ja)
EP (1) EP1864481A1 (ja)
JP (1) JP5001256B2 (ja)
WO (1) WO2006104627A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11275961B2 (en) 2017-12-22 2022-03-15 Beijing Sensetime Technology Development Co., Ltd. Character image processing method and apparatus, device, and storage medium

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8749839B2 (en) * 2005-03-24 2014-06-10 Kofax, Inc. Systems and methods of processing scanned data
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
CN101180785B (zh) 2005-05-27 2010-05-26 西门子能量及自动化公司 可变频率驱动器及其操作方法
JP2007259123A (ja) * 2006-03-23 2007-10-04 Konica Minolta Business Technologies Inc 画像読取装置、画像処理方法及びコンピュータ読み取り可能なプログラム
US8213687B2 (en) * 2006-04-28 2012-07-03 Hewlett-Packard Development Company, L.P. Image processing methods, image processing systems, and articles of manufacture
JP2008165381A (ja) * 2006-12-27 2008-07-17 Ricoh Co Ltd 画像処理装置及び画像処理方法
US8086551B2 (en) * 2007-04-16 2011-12-27 Blue Oak Mountain Technologies, Inc. Electronic system with simulated sense perception and method of providing simulated sense perception
JP4567771B2 (ja) * 2008-07-07 2010-10-20 シャープ株式会社 原稿読取装置、並びに、原稿読取装置を備える画像送信装置および画像形成装置
JP4610644B2 (ja) * 2008-08-27 2011-01-12 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、画像処理プログラム及びコンピュータ読み取り可能な記録媒体
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8879846B2 (en) 2009-02-10 2014-11-04 Kofax, Inc. Systems, methods and computer program products for processing financial documents
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
FR2949889A1 (fr) 2009-09-10 2011-03-11 Sagem Comm Procede de detection de pages blanches et machine multifonction correspondante
US8503733B2 (en) * 2009-11-16 2013-08-06 Xerox Corporation Show-through measurement system and method for inks on media
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9165188B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9064191B2 (en) 2012-01-26 2015-06-23 Qualcomm Incorporated Lower modifier detection and extraction from devanagari text images to improve OCR performance
US9053361B2 (en) 2012-01-26 2015-06-09 Qualcomm Incorporated Identifying regions of text to merge in a natural image or video frame
US9183458B2 (en) 2012-07-19 2015-11-10 Qualcomm Incorporated Parameter selection and coarse localization of interest regions for MSER processing
US9047540B2 (en) 2012-07-19 2015-06-02 Qualcomm Incorporated Trellis based word decoder with reverse pass
US9076242B2 (en) 2012-07-19 2015-07-07 Qualcomm Incorporated Automatic correction of skew in natural images and video
US9262699B2 (en) 2012-07-19 2016-02-16 Qualcomm Incorporated Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR
US9141874B2 (en) 2012-07-19 2015-09-22 Qualcomm Incorporated Feature extraction and use with a probability density function (PDF) divergence metric
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
CN105283884A (zh) 2013-03-13 2016-01-27 柯法克斯公司 对移动设备捕获的数字图像中的对象进行分类
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
JP2016518790A (ja) 2013-05-03 2016-06-23 コファックス, インコーポレイテッド モバイル装置を用いて取込まれたビデオにおけるオブジェクトを検出および分類するためのシステムおよび方法
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US9483818B2 (en) * 2013-12-30 2016-11-01 Fujitsu Limited Bleed-through detection method and bleed-through detection apparatus
JP2015198327A (ja) * 2014-04-01 2015-11-09 キヤノン株式会社 画像読取装置、画像読取方法、及びコンピュータプログラム
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020054693A1 (en) * 2000-07-28 2002-05-09 Elmenhurst Brian J. Orthogonal technology for multi-line character recognition
JP2003234888A (ja) * 2002-02-08 2003-08-22 Ricoh Co Ltd 画像補正装置、プログラム、記憶媒体及び画像補正方法

Family Cites Families (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3696599A (en) 1971-07-16 1972-10-10 Us Navy Cable fairing system
US4836026A (en) 1984-06-01 1989-06-06 Science Applications International Corporation Ultrasonic imaging system
DE3716787A1 (de) * 1986-05-19 1987-11-26 Ricoh Kk Zeichenerkennungsverfahren
US4992863A (en) * 1987-12-22 1991-02-12 Minolta Camera Kabushiki Kaisha Colored image reading apparatus
JPH02311083A (ja) * 1989-05-26 1990-12-26 Ricoh Co Ltd 原稿読取装置
JP2940960B2 (ja) * 1989-10-31 1999-08-25 株式会社日立製作所 画像の傾き検出方法および補正方法ならびに画像情報処理装置
IT1237803B (it) 1989-12-21 1993-06-17 Temav Spa Procedimento per la preparazione di polveri fini di alluminio nitruro
JP2708263B2 (ja) * 1990-06-22 1998-02-04 富士写真フイルム株式会社 画像読取装置
KR930010845B1 (ko) * 1990-12-31 1993-11-12 주식회사 금성사 화상정보의 그림/문자 자동분리방법
JPH04270565A (ja) * 1991-02-20 1992-09-25 Fuji Xerox Co Ltd 画像圧縮装置
US5317646A (en) 1992-03-24 1994-05-31 Xerox Corporation Automated method for creating templates in a forms recognition and processing system
DE4310727C2 (de) * 1992-04-06 1996-07-11 Hell Ag Linotype Verfahren und Einrichtung zur Analyse von Bildvorlagen
JPH06274680A (ja) * 1993-03-17 1994-09-30 Hitachi Ltd 文書認識方法およびシステム
US5652663A (en) * 1994-07-29 1997-07-29 Polaroid Corporation Preview buffer for electronic scanner
US5563723A (en) 1994-08-31 1996-10-08 Eastman Kodak Company Method of calibration of image scanner signal processing circuits
EP0723247B1 (en) * 1995-01-17 1998-07-29 Eastman Kodak Company Document image assessment system and method
US5822454A (en) * 1995-04-10 1998-10-13 Rebus Technology, Inc. System and method for automatic page registration and automatic zone detection during forms processing
US6532077B1 (en) 1995-10-04 2003-03-11 Canon Kabushiki Kaisha Image processing system
US6009196A (en) * 1995-11-28 1999-12-28 Xerox Corporation Method for classifying non-running text in an image
US5937084A (en) * 1996-05-22 1999-08-10 Ncr Corporation Knowledge-based document analysis system
JP3685421B2 (ja) * 1996-09-18 2005-08-17 富士写真フイルム株式会社 画像処理装置
JPH10117262A (ja) * 1996-10-09 1998-05-06 Fuji Photo Film Co Ltd 画像処理装置
DE69836447T2 (de) * 1997-02-19 2007-09-13 Canon K.K. Abtastvorrichtung und Steuerverfahren dafür sowie Bildeingabesystem
JP2927350B2 (ja) 1997-03-27 1999-07-28 株式会社モノリス 多重解像度フィルタ処理方法およびその方法を利用することのできる画像マッチング方法
US6154217A (en) 1997-04-15 2000-11-28 Software Architects, Inc. Gamut restriction of color image
US6005958A (en) * 1997-04-23 1999-12-21 Automotive Systems Laboratory, Inc. Occupant type and position detection system
US6067385A (en) 1997-05-07 2000-05-23 Ricoh Company Limited System for aligning document images when scanned in duplex mode
JP3877385B2 (ja) * 1997-07-04 2007-02-07 大日本スクリーン製造株式会社 画像処理パラメータ決定装置およびその方法
JP3061019B2 (ja) 1997-08-04 2000-07-10 トヨタ自動車株式会社 内燃機関
US6005968A (en) 1997-08-29 1999-12-21 X-Rite, Incorporated Scanner calibration and correction techniques using scaled lightness values
JPH1186021A (ja) * 1997-09-09 1999-03-30 Fuji Photo Film Co Ltd 画像処理装置
JPH1178112A (ja) * 1997-09-09 1999-03-23 Konica Corp 画像形成装置及び画像形成方法
JPH1191169A (ja) * 1997-09-19 1999-04-06 Fuji Photo Film Co Ltd 画像処理装置
US5867264A (en) 1997-10-15 1999-02-02 Pacific Advanced Technology Apparatus for image multispectral sensing employing addressable spatial mask
US6222613B1 (en) 1998-02-10 2001-04-24 Konica Corporation Image processing method and apparatus
JPH11261821A (ja) * 1998-03-12 1999-09-24 Fuji Photo Film Co Ltd 画像処理方法
JP3457562B2 (ja) * 1998-04-06 2003-10-20 富士写真フイルム株式会社 画像処理装置及び方法
US6748109B1 (en) * 1998-06-16 2004-06-08 Fuji Photo Film Co., Ltd Digital laboratory system for processing photographic images
US6219158B1 (en) 1998-07-31 2001-04-17 Hewlett-Packard Company Method and apparatus for a dynamically variable scanner, copier or facsimile secondary reflective surface
US6385346B1 (en) * 1998-08-04 2002-05-07 Sharp Laboratories Of America, Inc. Method of display and control of adjustable parameters for a digital scanner device
US6370277B1 (en) * 1998-12-07 2002-04-09 Kofax Image Products, Inc. Virtual rescanning: a method for interactive document image quality enhancement
US6480304B1 (en) * 1998-12-09 2002-11-12 Scansoft, Inc. Scanning system and method
US6396599B1 (en) * 1998-12-21 2002-05-28 Eastman Kodak Company Method and apparatus for modifying a portion of an image in accordance with colorimetric parameters
JP2000251012A (ja) * 1999-03-01 2000-09-14 Hitachi Ltd 帳票処理方法およびシステム
JP4114279B2 (ja) * 1999-06-25 2008-07-09 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
US6628416B1 (en) * 1999-10-13 2003-09-30 Umax Data Systems, Inc. Method and user interface for performing a scan operation for a scanner coupled to a computer system
US7430066B2 (en) * 1999-10-13 2008-09-30 Transpacific Ip, Ltd. Method and user interface for performing an automatic scan operation for a scanner coupled to a computer system
US6751349B2 (en) * 1999-11-30 2004-06-15 Fuji Photo Film Co., Ltd. Image processing system
US6665425B1 (en) * 1999-12-16 2003-12-16 Xerox Corporation Systems and methods for automated image quality based diagnostics and remediation of document processing systems
JP2001218047A (ja) * 2000-02-04 2001-08-10 Fuji Photo Film Co Ltd 画像処理装置
US6757081B1 (en) * 2000-04-07 2004-06-29 Hewlett-Packard Development Company, L.P. Methods and apparatus for analyzing and image and for controlling a scanner
US20020030831A1 (en) * 2000-05-10 2002-03-14 Fuji Photo Film Co., Ltd. Image correction method
US6469801B1 (en) * 2000-05-17 2002-10-22 Heidelberger Druckmaschinen Ag Scanner with prepress scaling mode
US6763515B1 (en) * 2000-06-05 2004-07-13 National Instruments Corporation System and method for automatically generating a graphical program to perform an image processing algorithm
JP4171574B2 (ja) * 2000-07-21 2008-10-22 富士フイルム株式会社 画像処理条件決定装置および画像処理条件決定プログラム記憶媒体
US6850653B2 (en) * 2000-08-08 2005-02-01 Canon Kabushiki Kaisha Image reading system, image reading setting determination apparatus, reading setting determination method, recording medium, and program
US6901170B1 (en) * 2000-09-05 2005-05-31 Fuji Xerox Co., Ltd. Image processing device and recording medium
JP4472847B2 (ja) * 2000-09-28 2010-06-02 キヤノン電子株式会社 画像処理装置及びその制御方法、画像入力装置及びその制御方法、並びに記憶媒体
US7043080B1 (en) * 2000-11-21 2006-05-09 Sharp Laboratories Of America, Inc. Methods and systems for text detection in mixed-context documents using local geometric signatures
US6522791B2 (en) * 2001-01-23 2003-02-18 Xerox Corporation Dynamic user interface with scanned image improvement assist
JP2002247371A (ja) * 2001-02-21 2002-08-30 Ricoh Co Ltd 画像処理装置および画像処理プログラムを記録した記録媒体
JP2002300386A (ja) * 2001-03-30 2002-10-11 Fuji Photo Film Co Ltd 画像処理方法
FR2825817B1 (fr) * 2001-06-07 2003-09-19 Commissariat Energie Atomique Procede de traitement d'images pour l'extraction automatique d'elements semantiques
US7403313B2 (en) * 2001-09-27 2008-07-22 Transpacific Ip, Ltd. Automatic scanning parameter setting device and method
JP5002099B2 (ja) 2001-08-31 2012-08-15 株式会社東芝 磁気共鳴イメージング装置
US7515313B2 (en) * 2001-09-20 2009-04-07 Stone Cheng Method and system for scanning with one-scan-and-done feature
EP1317133A1 (en) 2001-12-03 2003-06-04 Kofax Image Products, Inc. Virtual rescanning a method for interactive document image quality enhancement
US7346215B2 (en) * 2001-12-31 2008-03-18 Transpacific Ip, Ltd. Apparatus and method for capturing a document
US20030142328A1 (en) * 2002-01-31 2003-07-31 Mcdaniel Stanley Eugene Evaluation of image processing operations
US7209599B2 (en) * 2002-07-12 2007-04-24 Hewlett-Packard Development Company, L.P. System and method for scanned image bleedthrough processing
US7123387B2 (en) * 2002-08-23 2006-10-17 Chung-Wei Cheng Image scanning method
KR100446538B1 (ko) 2002-11-21 2004-09-01 삼성전자주식회사 디지털 카메라 대여 시스템을 위한 온라인 디지털 사진처리 시스템
US20040169889A1 (en) * 2003-02-27 2004-09-02 Toshiba Tec Kabushiki Kaisha Image processing apparatus and controller apparatus using thereof
US20040169873A1 (en) * 2003-02-28 2004-09-02 Xerox Corporation Automatic determination of custom parameters based on scanned image data
US7639392B2 (en) * 2003-03-28 2009-12-29 Infoprint Solutions Company, Llc Methods, systems, and media to enhance image processing in a color reprographic system
US7406183B2 (en) * 2003-04-28 2008-07-29 International Business Machines Corporation System and method of sorting document images based on image quality
US20040263639A1 (en) * 2003-06-26 2004-12-30 Vladimir Sadovsky System and method for intelligent image acquisition
US8937731B2 (en) 2003-09-01 2015-01-20 Konica Minolta Business Technologies, Inc. Image processing apparatus for receiving a request relating to image processing from an external source and executing the received request
JP3951990B2 (ja) 2003-09-05 2007-08-01 ブラザー工業株式会社 無線ステーション,プログラムおよび動作制御方法
JP4725057B2 (ja) * 2003-09-09 2011-07-13 セイコーエプソン株式会社 画質調整情報の生成および画質調整情報を用いた画質調整
US7844109B2 (en) * 2003-09-24 2010-11-30 Canon Kabushiki Kaisha Image processing method and apparatus
JP4139760B2 (ja) * 2003-10-10 2008-08-27 富士フイルム株式会社 画像処理方法および装置ならびに画像処理プログラム
EP1530357A1 (en) * 2003-11-06 2005-05-11 Ricoh Company, Ltd. Method, computer program, and apparatus for detecting specific information included in image data of original image with accuracy, and computer readable storing medium storing the program
US7430059B2 (en) * 2004-05-24 2008-09-30 Xerox Corporation Systems, methods and graphical user interfaces for interactively previewing a scanned document
US7272261B2 (en) * 2004-06-04 2007-09-18 Xerox Corporation Method and system for classifying scanned-media
US7515772B2 (en) * 2004-08-21 2009-04-07 Xerox Corp Document registration and skew detection system
US7782384B2 (en) * 2004-11-05 2010-08-24 Kelly Douglas J Digital camera having system for digital image composition and related method
US7201323B2 (en) 2004-12-10 2007-04-10 Mitek Systems, Inc. System and method for check fraud detection using signature validation
US7249717B2 (en) 2004-12-10 2007-07-31 Mitek Systems, Inc. System and method for check fraud detection using signature validation
US7168614B2 (en) 2004-12-10 2007-01-30 Mitek Systems, Inc. System and method for check fraud detection using signature validation
US7487438B1 (en) * 2005-03-08 2009-02-03 Pegasus Imaging Corporation Method and apparatus for recognizing a digitized form, extracting information from a filled-in form, and generating a corrected filled-in form
US20070002348A1 (en) 2005-03-15 2007-01-04 Kabushiki Kaisha Toshiba Method and apparatus for producing images by using finely optimized image processing parameters
US7545529B2 (en) 2005-03-24 2009-06-09 Kofax, Inc. Systems and methods of accessing random access cache for rescanning
US8749839B2 (en) 2005-03-24 2014-06-10 Kofax, Inc. Systems and methods of processing scanned data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020054693A1 (en) * 2000-07-28 2002-05-09 Elmenhurst Brian J. Orthogonal technology for multi-line character recognition
JP2003234888A (ja) * 2002-02-08 2003-08-22 Ricoh Co Ltd 画像補正装置、プログラム、記憶媒体及び画像補正方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11275961B2 (en) 2017-12-22 2022-03-15 Beijing Sensetime Technology Development Co., Ltd. Character image processing method and apparatus, device, and storage medium

Also Published As

Publication number Publication date
US20130251280A1 (en) 2013-09-26
US8749839B2 (en) 2014-06-10
US8823991B2 (en) 2014-09-02
JP5001256B2 (ja) 2012-08-15
US9129210B2 (en) 2015-09-08
WO2006104627A9 (en) 2007-03-01
WO2006104627A1 (en) 2006-10-05
US20140233068A1 (en) 2014-08-21
EP1864481A1 (en) 2007-12-12
US20060215231A1 (en) 2006-09-28

Similar Documents

Publication Publication Date Title
JP5001256B2 (ja) スキャンされたデータを処理するシステムおよび方法
US7545529B2 (en) Systems and methods of accessing random access cache for rescanning
US20140333971A1 (en) Systems and methods of processing scanned data
US9769354B2 (en) Systems and methods of processing scanned data
US7672022B1 (en) Methods and apparatus for analyzing an image
US8731325B2 (en) Automatic generation of a photo guide
US6757081B1 (en) Methods and apparatus for analyzing and image and for controlling a scanner
JP4118749B2 (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
US7209599B2 (en) System and method for scanned image bleedthrough processing
US7970182B2 (en) Two stage detection for photographic eye artifacts
US20080317358A1 (en) Class-based image enhancement system
JP2010520727A (ja) 写真の目のアーチファクトの2段階検出
US20110026818A1 (en) System and method for correction of backlit face images
Liu et al. A new quality assessment and improvement system for print media
JP4920814B2 (ja) 画像処理方法、装置および記録媒体
JP3820751B2 (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP2000013596A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
US20140286525A1 (en) Systems and methods for segmenting an image
JP2000013613A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
US20050265600A1 (en) Systems and methods for adjusting pixel classification using background detection
JP2005110184A (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JP2000013611A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
US20060269133A1 (en) Systems and methods for information handling in an image processing system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100930

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101220

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101228

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110128

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110204

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110223

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110328

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120316

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120424

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120517

R150 Certificate of patent or registration of utility model

Ref document number: 5001256

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250