JP4676225B2 - スキャン・ドキュメントから電子フォームに取り込むための方法および装置 - Google Patents
スキャン・ドキュメントから電子フォームに取り込むための方法および装置 Download PDFInfo
- Publication number
- JP4676225B2 JP4676225B2 JP2005083418A JP2005083418A JP4676225B2 JP 4676225 B2 JP4676225 B2 JP 4676225B2 JP 2005083418 A JP2005083418 A JP 2005083418A JP 2005083418 A JP2005083418 A JP 2005083418A JP 4676225 B2 JP4676225 B2 JP 4676225B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- field
- information
- captured
- user interface
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/127—Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
光学式スキャナおよび他のイメージング・デバイスは、(テキスト、図、写真などの)印刷情報を含むオブジェクトを獲得し、この情報をコンピュータが使用できるデジタル形式に変換するために使用される。一般に、ユーザは、スキャンすべきオブジェクトをスキャナのプラテン(platen)上に配置する。スキャナ・ヘッドが、プラテン区域上で通過させられ、結果としてのイメージが、複数のピクセルへと分割される。各ピクセル・ロケーションには、このピクセルのカラーまたは明暗度に依存する値が割り当てられる。次いで、(ビットマップと呼ばれる)結果としてのビット・マトリクスは、ファイル中として格納し、モニタ上に表示し、ソフトウェア・アプリケーションによって操作することができる。
本明細書中で説明しているこのオブジェクトの検出および抽出のシステムおよび方法は、デジタル・イメージ・データ内で所望のオブジェクトを自動的に見つけ出し、他のオブジェクトおよび任意のバックグラウンドからこれらの所望のオブジェクトを分離することができる。これによって、単一のパスで複数のオブジェクトをスキャンする利点を依然として保持しながら、各オブジェクトがそれ自体の個別のオブジェクトであると見なすことができるようになる。したがって、各個別のオブジェクトは、それ自体のファイルとして保存することができ、またこのスキャン・イメージ中に含まれる他のオブジェクトとは独立にソフトウェア・アプリケーションによって個別に操作することもできる。例えば、このシステムおよび方法は、フラットベッド・スキャナ(flatbed scanner)の単一パスによってスキャンされる際に、互いに隣接して配置されている複数の名刺を識別することができる。
図2は、前述のこのオブジェクトの検出および抽出のシステムおよび方法を組み込んだイメージ処理システム200の実装形態の一例を示す全体ブロック図である。一般的に言うと、デジタル・イメージ・データは、オブジェクトの検出および抽出システム202によって処理されて、このデジタル・イメージ・データ中に含まれるオブジェクト数、ならびに各オブジェクトのサイズ、オリエンテーション(向き)および位置が決定される。このシステム202は、これを、各オブジェクトの境界を決定し、これらのオブジェクトを自動的に別々のイメージ・オブジェクトに分離することによって、達成する。このことは、ユーザが手間暇をかけて各オブジェクトの手動分離を実施しなくても済むようにする。
オブジェクト検出および抽出システム202は、図3に示すいくつかのプログラム・モジュールを含んでおり、これらは、このシステムが、デジタル・イメージ・データ210中の1つまたは複数のオブジェクトを互いに自動的に区別できるようにする。オブジェクト検出および抽出システム202は、データ・ピクセル検出モジュール300、セグメンテーション・モジュール310、および単一オブジェクト抽出モジュール320を含んでいる。
図5は、本発明の一実施形態による、図2〜4に示すオブジェクト検出および抽出方法の詳細の一実施例を示す流れ図である。ステップ500においてイメージを受け取る。ステップ501において、第1の方向のデータ・ピクセル数を算出して第1のデータ・セットを生成する。同様にして、ステップ502において、第2の方向のデータ・ピクセル数を算出して第2のデータ・セットを生成する。一実施例として、このイメージは、一般的にピクセルの行および列を含む長方形のスキャン・イメージである。イメージ・ファンクションは、1方向のデータ・ピクセルの総和として定義することができる。この状況においては、行中のデータ・ピクセル数が、このイメージ中の行ごとに算出される。同様にして、列中のデータ・ピクセル数が、このイメージの列ごとに算出される。第1のデータ・セットは、このイメージの各行上のデータ・ピクセルの分布を含み、第2のデータ・セットは、このイメージの各列上のデータ・ピクセルの分布を含んでいる。
このオブジェクト検出および抽出方法の詳細を例証するために、次に2つの動作例を提示することにする。
図6は、スキャン・イメージ(scanned image)602を備えるオブジェクト600を示している。この動作実施例において、このオブジェクト600は、レシートなどの長方形オブジェクトである。オブジェクト600は、長方形など、あらかじめ確定された形状を有することを想定している。しかし、オブジェクト600のサイズ、オリエンテーション(向き)、および位置については未知である。
|Im(i,j)−b|>しきい値
が成り立つどのピクセルも、データ・ピクセルとして確定され、他のすべてのピクセルは、バックグラウンド・ピクセルとして確定される。データ・ピクセルとバックグラウンド・ピクセルとを区別するためにグレースケール法ではなくてカラーを使用することができること、この決定が、単一しきい値の使用よりもより複雑な方法に基づくことが可能なこと、に留意されたい。
単一オブジェクトのケースについて以上で開示したオブジェクト抽出方法は、複数オブジェクトのケースにも拡張することができる。一般的に言えば、これは、複数のオブジェクトのケースを複数の単一オブジェクトのケースに分解するものであり、この単一オブジェクトのケースは、前述のように解決することができる。図8に示すように、この第2の動作例においては、スキャン・イメージ800は、複数のオブジェクト、すなわち第1のオブジェクト801、第2のオブジェクト802、および第3のオブジェクト803を含んでいる。この複数のオブジェクトのケースにおいては、以上で開示したものと同じオブジェクト抽出方法が使用されるが、再帰的方法で行われる。
一実施例として限定するものではないが、以下の擬似コードは、このオブジェクト検出および抽出方法の可能な一実装形態を記述するものである。
function procMult(Im);
I0=0; j0=0; i1=leni; j1=lenj;
[P, Q]=getProjections(Im);
[gapsi, gapsj]=getGaps(P, Q);
if ((length(gapsi)-2)+(length(gapsj)-2)<1)
drawObject(Im, P, Q);
else
for m=0:length(gapsi)-2
for n=0:length(gapsj)-2
procMult(Im(gapsi(m):gapsi(m+1),
gapsj(n):gapsj(n+1))
end
end
end
このコールされるファンクションは以下の通りである。
[P, Q]=getProjections(Im)
これは、イメージ領域上でP(j)、Q(i)を算出するルーチンである。
[gapsi, gapsj]=getGaps(P, Q)
これは、P(j)、Q(i)中で任意のギャップの位置を決定する。図6におけるこのイメージに対する応答は、gapsi=[0, imax]およびgapsj[0, jmax]となり、図8に対しては、gapsi=[0, imax]およびgapsj=[0, j0jmax]とな。
drawObject(Im, P, Q)
これは、各台形についてのP(j)、Q(i)を検査し、これらのパラメータを推定し、どの長方形がこのデータに適合するかどうかを決定する。適合する場合、グローバル・リストに頂点を追加する。
以上の説明では、バックグラウンド・ピクセルとデータ・ピクセルの間に混同がないことを想定している。この理想的な状況においては、グラフP(j)およびQ(i)によって形成される台形は、理想的な台形となることになり、自信を持って簡単にこの変曲点を決定することができる。
一実施形態においては、このオブジェクト検出および抽出プロセスは、このイメージのサブ・サンプリングされた(sub-sampled)バージョンに対して適用される。このイメージのサブ・サンプリングされたバージョンを使用する利点は、これによってハイレゾリューション(high resolution)イメージ・データの処理が回避できること、にある。
(図2に示す)オブジェクト検出および抽出システム202が各識別オブジェクトの座標を出力し、これらのオブジェクトがその全体イメージから抽出された後に、各オブジェクトのイメージを処理して、このオブジェクト中に含まれる有用な情報要素を識別することができる。次いで、アドレス帳への連絡先エントリや経費報告書へのエントリなど関連する電子フォームに入力する際にユーザを支援するために、これらの情報要素を、クラスタ化して、モジュールに提供することができる。
次いで認識済みのテキスト・ブロックのこのクラスタ化されたテキスト領域は、フォーム・フィリング・モジュールで使用するために、図1に示すローカル・メモリ・デバイスまたはリモート・メモリ・デバイスのうちの一方など、タグ付けされていないメディア・データ・ストアに記憶される。
A=[aij=P(qj at t+1|qi at t)]
B=[bik=P(ok|qi)],
Π=[pi=P(qi at t=1)].
表記法P(a|b)は、「b」を仮定したときの「a」の条件付き確率を表す。上式において、現在の状態が(時刻tにおける)「qi」であり、qi∈Qであると仮定すると、Aは、次の状態(時刻t+1における)「qj」へと遷移する確率である。現在の状態がqiであると仮定すると、Bは、その出力がokである確率であり、式中ok∈Oである。Πは、状態指数「i」ごとに時刻t=1において状態qiにある確率である。
「this」=トークン1
「is」=トークン2
「a」=トークン3
「test」=トークン4
110 コンピュータ
120 処理ユニット
130 システム・メモリ
134 オペレーティング・システム
135 アプリケーション・プログラム
136 他のプログラム・モジュール
137 プログラム・データ
140 着脱不能な不揮発性メモリ・インターフェース
141 ハードディスク・ドライブ
144 オペレーティング・システム
145 アプリケーション・プログラム
146 他のプログラム・モジュール
147 プログラム・データ
150 着脱可能な不揮発性メモリ・インターフェース
151 着脱可能な不揮発性磁気ディスクの磁気ディスク・ドライブ
152 着脱可能な不揮発性磁気ディスク
155 光ディスク・ドライブ
156 着脱可能な不揮発性光ディスク
160 ユーザ入力インターフェース
161 ポインティング・デバイス
162 キーボード
163 マイクロフォン
164 イメージング・デバイス
170 ネットワーク・インターフェース
171 ローカル・エリア・ネットワーク
172 モデム
173 ワイド・エリア・ネットワーク
180 リモート・コンピュータ
185 リモート・アプリケーション・プログラム
190 ビデオ・インターフェース
191 モニタ
195 出力ペリフェラル・インターフェース
196 プリンタ
197 スピーカ
200 イメージ処理システム
202 オブジェクト検出および抽出システム
204 プラテン
206 スキャニング・デバイス
210 デジタル・イメージ・データ
212 バックグラウンド・データ
214 コンピューティング・デバイス
300 オブジェクト・ピクセル検出モジュール
310 セグメンテーション・モジュール
320 単一オブジェクト抽出モジュール
330 デジタル・イメージ・データ
340 オブジェクト・ピクセル・データ
350 セグメンテーションが生じているか
360 イメージをサブ・イメージに分割する
370 各サブ・イメージを処理するために入力する
380 抽出されたイメージ・オブジェクト
400 オブジェクト・ピクセル解析モジュール
410 検証モジュール
420 オブジェクト・ロケーション出力モジュール
430 単一オブジェクトをおそらく含むイメージ・データ
440 単一オブジェクトについての座標
600 オブジェクト
602、702 スキャン・イメージ
604、704 2次元の直交座標系
620、720 第1の台形形状
630、730 第2の台形形状
800 スキャン・イメージ
801、802、803 オブジェクト
810、830 第1の台形形状
820、832 第2の台形形状
820 上部サブ・イメージ
822 下部サブ・イメージ
834 左のサブ・サブイメージ834
1000 FFI1002を生成し、動作させるためのシステム
1002 フォーム・フィラー・インターフェース
1004 フォーム・データGUI
1006 オブジェクト・データGUI
1008 フィールド
1010 ステータス・インジケータ
1012 信頼度インジケータ
1102 フォーム・フィリング・インターフェース
1104 フォーム・データGUI
1106 オブジェクト・ペイン(GUI)/オブジェクト・データGUI
1108 フィールド
1110 ステータス・インジケータ
1120 プレビュー・ペイン(GUI)/オブジェクト・データGUI
1122 全体イメージ
1124 個別オブジェクト
1130 テキスト・ブロック
1132 カラー化されたボックス
1140 情報領域
1200 フォーム・フィリング・モジュールまたはシステム
1202 制御コンポーネント
1208 解析コンポーネント
1210 タグの付いていないメディア・データ・ストア
1212 フォーム・データ・ストア
1214 サイド情報ストア
1300 支援フォーム・フィリングを容易にするHMMの使用を示すダイアグラム
1400 ヒストグラム
Claims (43)
- 電子イメージから電子フォームに取り込むための、コンピュータによって実施される方法であって、
(a)前記電子イメージ内の、任意のオリエンテーションを有する第1のオブジェクトのサイズ、オリエンテーションおよび位置を識別すること、
(b)前記第1のオブジェクトに対応する前記電子イメージ内のピクセルからの情報要素を識別すること、
(c)グラフィック・ユーザ・インターフェースを介して前記電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示すること、
(d)前記情報要素を解析して異なる情報タイプのタグ付きグループに分類すること、
(e)前記タグ付きグループを前記電子フォームの前記フィールドに取り込み、取り込まれたフォームを生成し、前記グラフィック・ユーザ・インターフェースを介して前記ユーザが前記取り込まれたフィールドを編集できるようにすること、および
前記フィールドの入力および検証についてのステータスを前記ユーザに示すステータス・インジケータを、前記フィールドに隣接して配置して提供することであって、前記フィールドのステータスは、前記フィールドが未入力で未検証である第1のステータス、前記フィールドが入力済みだが未検証である第2のステータス、前記フィールドが入力済みで検証済みである第3のステータスを含むこと
を備えることを特徴とする方法。 - 前記電子イメージ内の、任意のオリエンテーションを有する第1のオブジェクトのサイズ、オリエンテーションおよび位置を識別することは、前記電子イメージ内の複数のオブジェクトのうちの前記第1のオブジェクトのサイズ、オリエンテーションおよび位置を識別することを備えることを特徴とする請求項1に記載の方法。
- 前記電子イメージ内の、任意のオリエンテーションを有する第1のオブジェクトのサイズ、オリエンテーションおよび位置を識別することは、
前記イメージ内の各ピクセルを分類してピクセル分類データを生成すること、
イメージ・ファンクションを明確化して前記ピクセル分類データを処理すること、
前記イメージ・ファンクション中のディスパリティに基づいて前記イメージをサブ・イメージに分割すること、および
前記サブ・イメージを処理して前記第1のオブジェクトを含めて前記オブジェクトごとにサイズ、オリエンテーションおよび位置を決定すること
を備えることを特徴とする請求項1に記載の方法。 - イメージ内の各ピクセルを分類してピクセル分類データを生成すること、イメージ・ファンクションを明確化して前記ピクセル分類データを処理すること、イメージ・ファンクション中のディスパリティに基づいて前記イメージをサブ・イメージに分割すること、を前記イメージが単一オブジェクトを含むようになるまで、または前記イメージをもはや分割することができなくなるまで、繰り返すことをさらに備えることを特徴とする請求項3に記載の方法。
- 前記イメージ内の各ピクセルを分類してピクセル分類データを生成すること、データ・ピクセルまたはバックグラウンド・ピクセルのうちの一方として各ピクセルを分類することを備えることを特徴とする請求項3に記載の方法。
- ある方向におけるデータ・ピクセルの総和として前記イメージ・ファンクションを定義すること、
第1の方向における前記イメージ・ファンクションを算出して第1のデータ・セットを生成すること、
第2の方向における前記イメージ・ファンクションを算出して第2のデータ・セットを生成すること、および
前記第1の方向における前記イメージ・ファンクションと前記第2の方向における前記イメージ・ファンクションにおけるディスパリティを検索すること
をさらに備えることを特徴とする請求項5に記載の方法。 - 前記第1のオブジェクトに対応する前記電子イメージ内のピクセルからの情報要素を識別することは、光学式文字認識を使用して前記第1のオブジェクト内のテキスト・ブロック、および前記テキスト・ブロックの2次元ロケーションを識別することを備え、
グラフィック・ユーザ・インターフェースを介して前記電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、前記グラフィック・ユーザ・インターフェースを介して前記電子フォームの前記フィールドと同時に前記識別されたテキスト・ブロックを前記ユーザに対して表示することを備える
ことを特徴とする請求項1に記載の方法。 - グラフィック・ユーザ・インターフェースを介して前記電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、前記グラフィック・ユーザ・インターフェースを介して前記第1のオブジェクトのイメージ内の前記識別された情報要素を前記ユーザに対して表示することを備え、
前記情報要素を解析して異なる情報タイプのタグ付きグループに分類することは、前記第1のオブジェクトの前記イメージ内の異なる情報タイプの前記タグ付きのグループを、前記異なる情報タイプを示すビジュアル・インジケータを用いてハイライトすることを備える
ことを特徴とする請求項7に記載の方法。 - 前記情報要素を解析して異なる情報タイプのタグ付きグループに分類することは、タグの付いていないメディア・ストアからのタグの付いていないメディアとして前記情報要素を受け取ること、および前記タグの付いていないメディアを解析して前記情報要素の情報タイプを識別することを備え、
前記タグ付きグループを前記電子フォームの前記フィールドに取り込んで取り込まれたフォームを生成し、前記グラフィック・ユーザ・インターフェースを介して前記ユーザが前記取り込まれたフィールドを編集できるようにすることは、前記情報要素の少なくとも1つを、その要素の前記情報タイプに基づいて前記フィールドの少なくとも1つに自動的に取り込むことを備え、
グラフィック・ユーザ・インターフェースを介して前記電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、オブジェクト・データ・グラフィック・ユーザ・インターフェースを介して前記情報要素を表示すること、およびフォーム・グラフィック・ユーザ・インターフェースを介して前記取り込まれたフィールドと未だ取り込まれていない任意のフィールドとを表示することを備える
ことを特徴とする請求項1に記載の方法。 - グラフィック・ユーザ・インターフェースを介して前記電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、前記オブジェクト・データ・グラフィック・ユーザ・インターフェースにおけるビジュアル・インジケータを使用して、情報要素が前記フォーム中の特定のフィールドと適合可能であることを示すことをさらに備えることを特徴とする請求項9に記載の方法。
- グラフィック・ユーザ・インターフェースを介して前記電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、前記フォーム中の少なくとも1つの取り込まれたフィールドにおける少なくとも1つの情報要素に関連付けられたステータス・レベルを示すことをさらに備えることを特徴とする請求項9に記載の方法。
- グラフィック・ユーザ・インターフェースを介して前記電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、前記示されたステータス・レベルに基づいて、前記少なくとも1つの取り込まれたフィールドにおける前記少なくとも1つの情報要素を検証および/または訂正するように前記ユーザに促すことをさらに備えることを特徴とする請求項11に記載の方法。
- 前記情報要素を解析して異なる情報タイプのタグ付きグループに分類することは、前記少なくとも1つの情報要素についての前記ユーザの検証および/または訂正に基づいて、前記取り込まれたフォームの他のフィールドをアップデートすることを備えることを特徴とする請求項12に記載の方法。
- (f)前記取り込まれたフィールドのうちのいずれかに対して行われる編集から収集されるサイド情報をサイド情報ストアに書き込むこと、および
(g)前記情報要素を、(d)前記情報要素を解析して異なる情報タイプのタグ付きグループに分類することにおいて、再解析して異なる情報タイプのタグ付きグループへと分類し、(e)前記タグ付きグループを前記電子フォームの前記フィールドに取り込んで取り込まれたフォームを生成し、前記グラフィック・ユーザ・インターフェースを介して前記ユーザが前記取り込まれたフィールドを編集できるようにすることにおいて、前記サイド情報に基づいて少なくとも1つの他のフィールドに再取り込みすること
をさらに備えることを特徴とする請求項1に記載の方法。 - 前記電子イメージは、複数のオブジェクトを備え、前記方法は、
(f)オブジェクトごとに、対応する電子フォームの各フィールドが、そのオブジェクト内のピクセルから取得された情報要素で少なくとも部分的に取り込まれるように、オブジェクトごとに、
(a)前記電子イメージ内の、任意のオリエンテーションを有する第1のオブジェクトのサイズ、オリエンテーションおよび位置を識別すること、
(b)前記第1のオブジェクトに対応する前記電子イメージ内のピクセルからの情報要素を識別すること、
(c)グラフィック・ユーザ・インターフェースを介して前記電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示すること、
(d)前記情報要素を解析して異なる情報タイプのタグ付きグループに分類すること、および
(e)前記タグ付きグループを前記電子フォームの前記フィールドに取り込んで取り込まれたフォームを生成し、前記グラフィック・ユーザ・インターフェースを介して前記ユーザが前記取り込まれたフィールドを編集できるようにすること
を実施すること
をさらに備えることを特徴とする請求項1に記載の方法。 - 前記複数のオブジェクトは、異なるタイプのオブジェクトを備えることを特徴とする請求項15に記載の方法。
- コンピュータによって実行されたときに、
(a)電子イメージ内の任意のオリエンテーションを有する第1のオブジェクトのサイズ、オリエンテーションおよび位置を識別すること、
(b)前記第1のオブジェクトに対応する前記電子イメージ内のピクセルからの情報要素を識別すること、
(c)グラフィック・ユーザ・インターフェースを介して電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示すること、
(d)前記情報要素を解析して異なる情報タイプのタグ付きグループに分類すること、
(e)前記タグ付きグループを前記電子フォームの前記フィールドに取り込み、取り込まれた電子フォームを生成し、前記グラフィック・ユーザ・インターフェースを介して前記ユーザが前記取り込まれたフィールドを編集できるようにすること、および
前記フィールドの入力および検証についてのステータスを前記ユーザに示すステータス・インジケータを、前記フィールドに隣接して配置して提供することであって、前記フィールドのステータスは、前記フィールドが未入力で未検証である第1のステータス、前記フィールドが入力済みだが未検証である第2のステータス、前記フィールドが入力済みで検証済みである第3のステータスを含むこと
を備える方法を実施するコンピュータ実行可能命令を備えることを特徴とするコンピュータ読取り可能媒体。 - 前記電子イメージは、前記第1のオブジェクトを含めて複数のオブジェクトを備え、前記方法は、
(f)オブジェクトごとに、対応する電子フォームの各フィールドが、そのオブジェクト内のピクセルから取得された情報要素で少なくとも部分的に取り込まれるように、オブジェクトごとに、
(a)電子イメージ内の任意のオリエンテーションを有する第1のオブジェクトのサイズ、オリエンテーションおよび位置を識別すること、
(b)前記第1のオブジェクトに対応する前記電子イメージ内のピクセルからの情報要素を識別すること、
(c)グラフィック・ユーザ・インターフェースを介して電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示すること、
(d)前記情報要素を解析して異なる情報タイプのタグ付きグループに分類すること、および
(e)前記タグ付きグループを前記電子フォームの前記フィールドに取り込み、取り込まれた電子フォームを生成し、前記グラフィック・ユーザ・インターフェースを介して前記ユーザが前記取り込まれたフィールドを編集できるようにすること
を実施すること
をさらに備えることを特徴とする請求項17に記載のコンピュータ読取り可能媒体。 - 前記複数のオブジェクトは、異なるタイプのオブジェクトを備えることを特徴とする請求項18に記載のコンピュータ読取り可能媒体。
- 前記電子イメージ内の、任意のオリエンテーションを有する第1のオブジェクトのサイズ、オリエンテーションおよび位置を識別することは、
前記イメージ内の各ピクセルを分類してピクセル分類データを生成すること、
イメージ・ファンクションを明確化して前記ピクセル分類データを処理すること、
前記イメージ・ファンクション中のディスパリティに基づいて前記イメージをサブ・イメージに分割すること、および
前記サブ・イメージを処理して前記第1のオブジェクトを含めて前記オブジェクトごとにサイズ、オリエンテーションおよび位置を決定すること
を備えることを特徴とする請求項17に記載のコンピュータ読取り可能媒体。 - 前記イメージ内の各ピクセルを分類してピクセル分類データを生成することは、データ・ピクセルまたはバックグラウンド・ピクセルのうちの一方として各ピクセルを分類することを備えることを特徴とする請求項20に記載のコンピュータ読取り可能媒体。
- ある方向におけるデータ・ピクセルの総和として前記イメージ・ファンクションを定義すること、
第1の方向における前記イメージ・ファンクションを算出して第1のデータ・セットを生成すること、
第2の方向における前記イメージ・ファンクションを算出して第2のデータ・セットを生成すること、および
前記第1の方向における前記イメージ・ファンクションと前記第2の方向における前記イメージ・ファンクションにおけるディスパリティを検索すること
をさらに備えることを特徴とする請求項21に記載のコンピュータ読取り可能媒体。 - 前記第1のオブジェクトに対応する前記電子イメージ内のピクセルからの情報要素を識別することは、光学式文字認識を使用して前記第1のオブジェクト内のテキスト・ブロック、および前記テキスト・ブロックの2次元ロケーションを識別することを備え、
グラフィック・ユーザ・インターフェースを介して電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、前記グラフィック・ユーザ・インターフェースを介して前記第1のオブジェクトのイメージ内の前記識別されたテキスト・ブロックを前記ユーザに対して表示することを備え、
前記情報要素を解析して異なる情報タイプのタグ付きグループに分類することは、異なる情報タイプの前記タグ付きのグループを前記異なる情報タイプを示すビジュアル・インジケータを伴う前記第1のオブジェクトの前記イメージ内においてハイライトすることを備える
ことを特徴とする請求項17に記載のコンピュータ読取り可能媒体。 - 前記情報要素を解析して異なる情報タイプのタグ付きグループに分類することは、タグの付いていないメディア・ストアからのタグの付いていないメディアとして前記情報要素を受け取ること、および前記タグの付いていないメディアを解析して前記情報要素の情報タイプを識別することを備え、
前記タグ付きグループを前記電子フォームの前記フィールドに取り込み、取り込まれた電子フォームを生成し、前記グラフィック・ユーザ・インターフェースを介して前記ユーザが前記取り込まれたフィールドを編集できるようにすることは、前記情報要素の少なくとも1つをその要素の前記情報タイプに基づいて前記フィールドの少なくとも1つに自動的に取り込むことを備え、
グラフィック・ユーザ・インターフェースを介して電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、オブジェクト・データ・グラフィック・ユーザ・インターフェースを介して前記情報要素を表示すること、およびフォーム・グラフィック・ユーザ・インターフェースを介して前記取り込まれたフィールドと未だ取り込まれていない任意のフィールドとを表示することを備える
ことを特徴とする請求項17に記載のコンピュータ読取り可能媒体。 - グラフィック・ユーザ・インターフェースを介して電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、前記オブジェクト・データ・グラフィック・ユーザ・インターフェースにおけるビジュアル・インジケータを使用して、情報要素が前記フォーム中の特定のフィールドと適合可能であることを示すことをさらに備えることを特徴とする請求項24に記載のコンピュータ読取り可能媒体。
- グラフィック・ユーザ・インターフェースを介して電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、前記フォーム中の少なくとも1つの取り込まれたフィールドにおける少なくとも1つの情報要素に関連付けられたステータス・レベルを示すことをさらに備えることを特徴とする請求項24に記載のコンピュータ読取り可能媒体。
- グラフィック・ユーザ・インターフェースを介して電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示することは、前記示されたステータス・レベルに基づいて前記少なくとも1つの取り込まれたフィールドにおける前記少なくとも1つの情報要素を検証および/または訂正するように前記ユーザに促すことをさらに備えることを特徴とする請求項26に記載のコンピュータ読取り可能媒体。
- 前記情報要素を解析して異なる情報タイプのタグ付きグループに分類することは、前記少なくとも1つの情報要素の前記ユーザの検証および/または訂正に基づいて前記取り込まれたフォームの他のフィールドをアップデートすることを備えることを特徴とする請求項27に記載のコンピュータ読取り可能媒体。
- (f)前記タグ付きグループを前記電子フォームの前記フィールドに取り込み、取り込まれた電子フォームを生成し、前記グラフィック・ユーザ・インターフェースを介して前記ユーザが前記取り込まれたフィールドを編集できるようにすることにおいて、前記ユーザによって行われる編集から収集されるサイド情報をサイド情報ストアに書き込むこと、および
(g)前記情報要素を前記解析することを、前記情報要素を解析して異なる情報タイプのタグ付きグループに分類することにおいて、再解析して異なる情報タイプのタグ付きグループへと分類し、前記タグ付きグループを前記電子フォームの前記フィールドに取り込み、取り込まれた電子フォームを生成し、前記グラフィック・ユーザ・インターフェースを介して前記ユーザが前記取り込まれたフィールドを編集できるようにすることにおいて、前記サイド情報に基づいて少なくとも1つの他のフィールドに再取り込みこと
をさらに備えることを特徴とする請求項17に記載のコンピュータ読取り可能媒体。 - 電子フォームに少なくとも部分的に取り込むためのシステムであって、
電子イメージ中のピクセルを処理して前記電子イメージ内の任意のオリエンテーションを有するオブジェクトのサイズ、オリエンテーションおよび位置を識別するオブジェクト検出および抽出モジュールと、
前記第1のオブジェクトに対応する前記電子イメージ内のピクセルから情報要素を識別する光学式文字認識モジュールと、
前記電子フォームのフィールドおよび前記識別された情報要素をユーザに対して同時に表示するグラフィック・ユーザ・インターフェースと、
前記情報要素を解析して異なる情報タイプのタグ付きグループへと分類し、前記タグ付きグループを前記フィールドに少なくとも部分的に取り込み、取り込まれた電子フォームを生成する解析モジュールと、
前記フィールドの入力および検証についてのステータスを前記ユーザに示すステータス・インジケータを、前記フィールドに隣接して配置して提供する手段であって、前記フィールドのステータスは、前記フィールドが未入力で未検証である第1のステータス、前記フィールドが入力済みだが未検証である第2のステータス、前記フィールドが入力済みで検証済みである第3のステータスを含む手段と
を備えることを特徴とするシステム。 - 前記グラフィック・ユーザ・インターフェースによって、前記ユーザは、前記取り込まれたフィールドおよび未だ取り込まれていない任意のフィールドを編集できるようになることを特徴とする請求項30に記載のシステム。
- 前記オブジェクト検出および抽出モジュールは、
イメージの各ピクセルを分類し、イメージ・ファンクションを明確化するデータ・ピクセル検出モジュールと、
前記イメージ・ファンクション中のディスパリティに基づいて前記イメージをより小さなサブ・イメージへと分割することが可能なセグメンテーション・モジュールと、
前記サブ・イメージを処理して前記イメージ内のオブジェクトの数、サイズ、オリエンテーションおよび位置を検出する単一オブジェクト抽出モジュールと
を備えることを特徴とする請求項30に記載のシステム。 - 前記データ・ピクセル検出モジュールは、データ・ピクセルまたはバックグラウンド・ピクセルのうちの一方として各ピクセルを分類することを特徴とする請求項32に記載のシステム。
- 前記データ・ピクセル検出モジュールは、ある方向におけるデータ・ピクセルの総和として前記イメージ・ファンクションを定義し、第1の方向における前記イメージ・ファンクションを算出して第1のデータ・セットを生成し、第2の方向における前記イメージ・ファンクションを算出して第2のデータ・セットを生成し、前記第1の方向における前記イメージ・ファンクション中、および前記第2の方向における前記イメージ・ファンクション中のディスパリティを検索することを特徴とする請求項33に記載のシステム。
- 前記光学式文字認識モジュールは、光学式文字認識を使用して前記第1のオブジェクト内のテキスト・ブロックおよび前記テキスト・ブロックの2次元ロケーションを識別する手段を備え、
前記グラフィック・ユーザ・インターフェースは、前記グラフィック・ユーザ・インターフェースを介して、前記第1のオブジェクトのイメージ内の前記識別されたテキスト・ブロックを前記ユーザに対して表示し、前記第1のオブジェクトの前記イメージ内の異なる情報タイプの前記タグ付きグループを、前記異なる情報タイプを示すビジュアル・インジケータを用いてハイライトする手段を備える
ことを特徴とする請求項30に記載のシステム。 - 前記解析モジュールは、タグの付いていないメディア・ストアからのタグの付いていないメディアとして前記情報要素を受け取り、前記タグの付いていないメディアを解析して前記情報要素の情報タイプを識別し、その要素の前記情報タイプに基づいて、前記情報要素のうちの少なくとも1つを前記フィールドのうちの少なくとも1つに自動的に取り込む手段を備え、
前記グラフィック・ユーザ・インターフェースは、オブジェクト・データ・グラフィック・ユーザ・インターフェースを介して前記情報要素を表示し、フォーム・グラフィックユーザ・インターフェースを介して前記取り込まれたフィールドおよび未だ取り込まれていない任意のフィールドを表示する手段を備える
ことを特徴とする請求項30に記載のシステム。 - 前記オブジェクト・データ・グラフィック・ユーザ・インターフェースは、情報要素が前記フォームの特定のフィールドと適合可能であることを示すビジュアル・インジケータを備えることを特徴とする請求項35に記載のシステム。
- 前記フォーム・グラフィック・ユーザ・インターフェースは、前記フォーム中の少なくとも1つの取り込まれたフィールドにおける少なくとも1つの情報要素に関連付けられたステータス・レベル・インジケータを備えることを特徴とする請求項35に記載のシステム。
- 前記グラフィック・ユーザ・インターフェースは、少なくとも1つの取り込まれたフィールド中の少なくとも1つの情報要素をそのフィールドに関連付けられた前記ステータス・レベル・インジケータに基づいて検証および/または訂正するように前記ユーザを促す手段を備えることを特徴とする請求項37に記載のシステム。
- 前記解析モジュールは、前記取り込まれたフィールドおよび前記未だ取り込まれていないフィールドに対する前記ユーザによって行われる編集に従って前記取り込まれたフォームの他のフィールドをアップデートするための手段を備えることを特徴とする請求項31に記載のシステム。
- 異なる情報タイプの第1および第2のオブジェクトを有する電子イメージから電子フォームに取り込む方法であって、
前記電子イメージ内の前記第1および第2のオブジェクトのサイズ、オリエンテーションおよび位置を識別し、各オブジェクトの前記サイズ、オリエンテーションおよび位置に関連付けられ、前記電子イメージ中のピクセルに対応する、サブ・イメージに前記電子イメージを分割すること、
各サブ・イメージ上で光学式文字認識を実施して前記対応するオブジェクト内のタグの付いていない情報要素を識別すること、
サブ・イメージごとに、前記タグの付いていない情報要素を解析してタグ付きの情報要素に分類すること、
前記第1のオブジェクトの前記サブ・イメージから識別される前記タグ付きの情報要素を第1の電子フォーム・タイプ中のフィールドに取り込んで第1の取り込まれたフォームを生成すること、
前記第2のオブジェクトの前記サブ・イメージから識別される前記タグ付きの情報要素を第2の電子フォーム・タイプ中のフィールドに取り込んで第2の取り込まれたフォームを生成すること、
グラフィック・ユーザ・インターフェースを介して、前記第1および第2の取り込まれたフォームと前記タグの付いていない情報要素とをユーザに対して表示し、前記ユーザが、前記グラフィック・ユーザ・インターフェースを介して前記第1および第2の取り込まれたフォームを編集できるようにすること、および
前記フィールドの入力および検証についてのステータスを前記ユーザに示すステータス・インジケータを、前記フィールドに隣接して配置して提供することであって、前記フィールドのステータスは、前記フィールドが未入力で未検証である第1のステータス、前記フィールドが入力済みだが未検証である第2のステータス、前記フィールドが入力済みで検証済みである第3のステータスを含むこと
を備えることを特徴とする方法。 - 前記第1のオブジェクトは名刺を含み、前記第2のオブジェクトは購入レシートを含み、
前記第1の電子フォームは、ソフトウェア・アドレス帳の連絡先レコードを備え、前記第2の電子フォームは、ソフトウェア財務アプリケーションの電子財務レコードを備える
ことを特徴とする請求項41に記載の方法。 - 電子イメージから電子フォームに取り込むための、コンピュータによって実施される方法であって、
(a)前記電子イメージ内の、任意のオリエンテーションを有する第1のオブジェクトのサイズ、オリエンテーションおよび位置を識別すること、
(b)前記第1のオブジェクトに対応する前記電子イメージ内のピクセルからの情報要素を識別すること、
(c)グラフィック・ユーザ・インターフェースを介して前記電子フォームのフィールドと前記識別された情報要素とをユーザに対して表示すること、
(d)前記情報要素を解析して異なる情報タイプのタグ付きグループに分類すること、
(e)前記タグ付きグループを前記電子フォームの前記フィールドに取り込み、取り込まれたフォームを生成し、前記グラフィック・ユーザ・インターフェースを介して前記ユーザが前記取り込まれたフィールドを編集できるようにすること、および
前記フィールドの入力および検証についてのステータスを前記ユーザに示すステータス・インジケータを、前記フィールドに隣接して配置して提供することであって、前記フィールドのステータスは、前記フィールドが未入力で未検証である第1のステータス、前記フィールドが入力済みだが未検証である第2のステータス、前記フィールドが入力済みで検証済みである第3のステータスを含むこと
を備え、
前記ステータス・インジケータは、色を用いて前記ステータスを示し、
前記第1のステータス又は前記第2のステータスは、前記フィールドが正しい情報を含んでいるかについての検証が完了していないことを示し、
前記第3のステータスは、前記フィールドが正しい情報を含んでいるかについての検証が完了していることを示すことを特徴とする方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/808,194 US7305129B2 (en) | 2003-01-29 | 2004-03-24 | Methods and apparatus for populating electronic forms from scanned documents |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005302011A JP2005302011A (ja) | 2005-10-27 |
JP4676225B2 true JP4676225B2 (ja) | 2011-04-27 |
Family
ID=34862070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005083418A Expired - Fee Related JP4676225B2 (ja) | 2004-03-24 | 2005-03-23 | スキャン・ドキュメントから電子フォームに取り込むための方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7305129B2 (ja) |
EP (1) | EP1580666A3 (ja) |
JP (1) | JP4676225B2 (ja) |
KR (1) | KR101122854B1 (ja) |
CN (1) | CN100465945C (ja) |
Families Citing this family (240)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8479122B2 (en) | 2004-07-30 | 2013-07-02 | Apple Inc. | Gestures for touch sensitive input devices |
US7614008B2 (en) * | 2004-07-30 | 2009-11-03 | Apple Inc. | Operation of a computer with touch screen interface |
US9239673B2 (en) | 1998-01-26 | 2016-01-19 | Apple Inc. | Gesturing with a multipoint sensing device |
US9292111B2 (en) | 1998-01-26 | 2016-03-22 | Apple Inc. | Gesturing with a multipoint sensing device |
US6931589B2 (en) * | 2001-11-29 | 2005-08-16 | Orbograph Ltd. | Distributed document processing |
US7689623B1 (en) * | 2002-04-08 | 2010-03-30 | Syncsort Incorporated | Method for performing an external (disk-based) sort of a large data file which takes advantage of “presorted” data already present in the input |
JP3827152B2 (ja) * | 2002-05-20 | 2006-09-27 | 村田機械株式会社 | ファクシミリ装置及び読取画像の送信方法 |
US20050131725A1 (en) * | 2003-10-14 | 2005-06-16 | Gretchen Sleeper | Mapping algorithm for identifying data required to file for state and federal tax credits related to enterprise zones, renewal communities, and empowerment zones |
US20060041484A1 (en) * | 2004-04-01 | 2006-02-23 | King Martin T | Methods and systems for initiating application processes by data capture from rendered documents |
US7664734B2 (en) | 2004-03-31 | 2010-02-16 | Google Inc. | Systems and methods for generating multiple implicit search queries |
US9009153B2 (en) | 2004-03-31 | 2015-04-14 | Google Inc. | Systems and methods for identifying a named entity |
US20080040315A1 (en) * | 2004-03-31 | 2008-02-14 | Auerbach David B | Systems and methods for generating a user interface |
US8631001B2 (en) | 2004-03-31 | 2014-01-14 | Google Inc. | Systems and methods for weighting a search query result |
US7693825B2 (en) * | 2004-03-31 | 2010-04-06 | Google Inc. | Systems and methods for ranking implicit search results |
US7707142B1 (en) | 2004-03-31 | 2010-04-27 | Google Inc. | Methods and systems for performing an offline search |
US8041713B2 (en) | 2004-03-31 | 2011-10-18 | Google Inc. | Systems and methods for analyzing boilerplate |
US7272601B1 (en) | 2004-03-31 | 2007-09-18 | Google Inc. | Systems and methods for associating a keyword with a user interface area |
US7697759B2 (en) * | 2004-05-11 | 2010-04-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Split-remerge method for eliminating processing window artifacts in recursive hierarchical segmentation |
JP2007537515A (ja) * | 2004-05-13 | 2007-12-20 | ロジャーズ,ロバート,ジョン | 情報を取り出すためのシステムと方法および情報を保存するためのシステムと方法 |
US7251782B1 (en) * | 2004-06-22 | 2007-07-31 | Sun Microsystems, Inc. | Method and apparatus for validating user input fields in a graphical display |
US8626730B2 (en) * | 2004-06-28 | 2014-01-07 | Sap Ag | Data processing methods, systems and computer programs for providing a payment using a web service |
US7788274B1 (en) * | 2004-06-30 | 2010-08-31 | Google Inc. | Systems and methods for category-based search |
US8131754B1 (en) | 2004-06-30 | 2012-03-06 | Google Inc. | Systems and methods for determining an article association measure |
US8381135B2 (en) | 2004-07-30 | 2013-02-19 | Apple Inc. | Proximity detector in handheld device |
US20060115145A1 (en) * | 2004-11-30 | 2006-06-01 | Microsoft Corporation | Bayesian conditional random fields |
US8606665B1 (en) | 2004-12-30 | 2013-12-10 | Hrb Tax Group, Inc. | System and method for acquiring tax data for use in tax preparation software |
US20060212798A1 (en) * | 2005-01-12 | 2006-09-21 | Lection David B | Rendering content natively on local operating system |
US8631324B2 (en) * | 2005-01-12 | 2014-01-14 | International Business Machines Corporation | Running content emitters natively on local operating system |
US7496832B2 (en) * | 2005-01-13 | 2009-02-24 | International Business Machines Corporation | Web page rendering based on object matching |
US20060179404A1 (en) * | 2005-02-08 | 2006-08-10 | Microsoft Corporation | Method for a browser auto form fill |
US8154769B2 (en) * | 2005-02-15 | 2012-04-10 | Ricoh Co. Ltd | Systems and methods for generating and processing evolutionary documents |
US20060218088A1 (en) * | 2005-03-24 | 2006-09-28 | Flora John R | Intelligent auto-fill transaction data |
US7383254B2 (en) * | 2005-04-13 | 2008-06-03 | Microsoft Corporation | Method and system for identifying object information |
US20070002375A1 (en) * | 2005-06-30 | 2007-01-04 | Lexmark International, Inc. | Segmenting and aligning a plurality of cards in a multi-card image |
TWI265715B (en) * | 2005-07-21 | 2006-11-01 | Inventec Appliances Corp | Method for collecting business card data in mobile communication apparatus |
US8935379B1 (en) * | 2005-09-07 | 2015-01-13 | Reversevision, Inc. | Methods, systems, and products for evaluating electronic data and electronic forms |
US8732570B2 (en) * | 2005-09-08 | 2014-05-20 | Ricoh Co. Ltd. | Non-symbolic data system for the automated completion of forms |
JP4719543B2 (ja) * | 2005-09-26 | 2011-07-06 | 株式会社リコー | ワークフローシステム、サーバ装置、ワークフローシステムの処理方法及びワークフロープログラム |
JP2007094818A (ja) * | 2005-09-29 | 2007-04-12 | Internatl Business Mach Corp <Ibm> | 複数データの一括コピー及びペースト方法、装置、およびコンピュータ・プログラム |
US7512574B2 (en) * | 2005-09-30 | 2009-03-31 | International Business Machines Corporation | Consistent histogram maintenance using query feedback |
DE102005048600B4 (de) * | 2005-10-06 | 2008-09-25 | Klaus Rehm | Verfahren zum Erfassen von Daten |
US8619313B2 (en) * | 2005-10-28 | 2013-12-31 | Hewlett-Packard Development Company, L.P. | Scanning device with plural image capture zones on a platen |
US20070106496A1 (en) * | 2005-11-09 | 2007-05-10 | Microsoft Corporation | Adaptive task framework |
US7822699B2 (en) * | 2005-11-30 | 2010-10-26 | Microsoft Corporation | Adaptive semantic reasoning engine |
US7606700B2 (en) * | 2005-11-09 | 2009-10-20 | Microsoft Corporation | Adaptive task framework |
US7933914B2 (en) * | 2005-12-05 | 2011-04-26 | Microsoft Corporation | Automatic task creation and execution using browser helper objects |
US20070130134A1 (en) * | 2005-12-05 | 2007-06-07 | Microsoft Corporation | Natural-language enabling arbitrary web forms |
US7831585B2 (en) * | 2005-12-05 | 2010-11-09 | Microsoft Corporation | Employment of task framework for advertising |
US20070133876A1 (en) * | 2005-12-14 | 2007-06-14 | Nokia Corporation | Device, method, and computer program product for enhancing the use of electronic forms in mobile devices |
US7529761B2 (en) * | 2005-12-14 | 2009-05-05 | Microsoft Corporation | Two-dimensional conditional random fields for web extraction |
US7631271B2 (en) * | 2005-12-16 | 2009-12-08 | Xerox Corporation | Touch screen user interface with multi-text field display |
US8177121B2 (en) * | 2006-01-13 | 2012-05-15 | Intuit Inc. | Automated aggregation and comparison of business spending relative to similar businesses |
US8509563B2 (en) * | 2006-02-02 | 2013-08-13 | Microsoft Corporation | Generation of documents from images |
US7996783B2 (en) * | 2006-03-02 | 2011-08-09 | Microsoft Corporation | Widget searching utilizing task framework |
US20070260631A1 (en) * | 2006-03-09 | 2007-11-08 | Microsoft Corporation | Embedded decision support |
DE112006003817T5 (de) * | 2006-03-29 | 2009-02-12 | Intel Corporation, Santa Clara | Vorrichtung und Verfahren für ein mobiles Personal Computer (MPC)-System mit einem eingebauten Scanner |
JP4810287B2 (ja) * | 2006-04-13 | 2011-11-09 | キヤノン株式会社 | データ処理装置及びそのデータ登録方法 |
US8001130B2 (en) * | 2006-07-25 | 2011-08-16 | Microsoft Corporation | Web object retrieval based on a language model |
US7720830B2 (en) * | 2006-07-31 | 2010-05-18 | Microsoft Corporation | Hierarchical conditional random fields for web extraction |
US7921106B2 (en) * | 2006-08-03 | 2011-04-05 | Microsoft Corporation | Group-by attribute value in search results |
JP2008059081A (ja) * | 2006-08-29 | 2008-03-13 | Sony Corp | 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム |
US8352850B1 (en) * | 2006-10-31 | 2013-01-08 | Intuit Inc. | Dynamic paragraphs |
US8098936B2 (en) * | 2007-01-12 | 2012-01-17 | Seiko Epson Corporation | Method and apparatus for detecting objects in an image |
US8244588B1 (en) * | 2007-01-22 | 2012-08-14 | Intuit Inc. | Method and apparatus for entering purchase information |
US7778953B2 (en) * | 2007-02-19 | 2010-08-17 | Kabushiki Kaisha Toshiba | Document management apparatus and document management method |
US20080249764A1 (en) * | 2007-03-01 | 2008-10-09 | Microsoft Corporation | Smart Sentiment Classifier for Product Reviews |
US8144990B2 (en) | 2007-03-22 | 2012-03-27 | Sony Ericsson Mobile Communications Ab | Translation and display of text in picture |
US8448061B1 (en) * | 2007-03-30 | 2013-05-21 | Adobe Systems Incorporated | User interfaces and methods to create electronic documents with forms implementing content input fields |
KR100835378B1 (ko) * | 2007-04-03 | 2008-06-04 | 삼성전자주식회사 | 통합리모컨의 기기 제어 방법 |
US7849398B2 (en) * | 2007-04-26 | 2010-12-07 | Xerox Corporation | Decision criteria for automated form population |
JP5303865B2 (ja) * | 2007-05-23 | 2013-10-02 | 株式会社リコー | 情報処理装置、及び、情報処理方法 |
US8635537B1 (en) | 2007-06-29 | 2014-01-21 | Amazon Technologies, Inc. | Multi-level architecture for image display |
US8601361B2 (en) * | 2007-08-06 | 2013-12-03 | Apple Inc. | Automatically populating and/or generating tables using data extracted from files |
US8635127B1 (en) | 2007-09-14 | 2014-01-21 | Hrb Innovations, Inc. | System and method for identifying tax documents to customize preparation of a tax return |
US9753908B2 (en) * | 2007-11-05 | 2017-09-05 | The Neat Company, Inc. | Method and system for transferring data from a scanned document into a spreadsheet |
JP2009124319A (ja) * | 2007-11-13 | 2009-06-04 | Murata Mach Ltd | 画像編集装置 |
US8910073B2 (en) * | 2007-11-26 | 2014-12-09 | Qualcomm Incorporated | Enhancing visual continuity in scrolling operations |
US8908998B2 (en) | 2007-12-07 | 2014-12-09 | Educational Testing Service | Method for automated quality control |
JP4631905B2 (ja) * | 2007-12-28 | 2011-02-16 | ブラザー工業株式会社 | 印刷装置および印刷システム |
US9177551B2 (en) | 2008-01-22 | 2015-11-03 | At&T Intellectual Property I, L.P. | System and method of providing speech processing in user interface |
US9846689B2 (en) * | 2008-01-29 | 2017-12-19 | Adobe Systems Incorporated | Method and system to provide portable database functionality in an electronic form |
GB2458891A (en) * | 2008-03-31 | 2009-10-07 | Triad Group Plc | Automatic form filling by extracting components form a text file |
JP5354442B2 (ja) * | 2008-04-22 | 2013-11-27 | 富士ゼロックス株式会社 | 定型情報管理装置および定型情報管理プログラム |
JP5111242B2 (ja) * | 2008-06-04 | 2013-01-09 | キヤノン株式会社 | 画像処理装置及び方法 |
US8570279B2 (en) | 2008-06-27 | 2013-10-29 | Apple Inc. | Touch screen device, method, and graphical user interface for inserting a character from an alternate keyboard |
US20100050101A1 (en) * | 2008-08-21 | 2010-02-25 | Palm, Inc. | Converting Information Objects |
US20100070360A1 (en) * | 2008-09-13 | 2010-03-18 | At&T Intellectual Property I, L.P. | System and method for creating a speech search platform for coupons |
US8225213B2 (en) | 2008-10-07 | 2012-07-17 | Siegal Bess L M | User interface (UI) control for attestation process |
US8019664B1 (en) * | 2008-10-14 | 2011-09-13 | Intuit Inc. | System and method for completing a form |
US7930447B2 (en) | 2008-10-17 | 2011-04-19 | International Business Machines Corporation | Listing windows of active applications of computing devices sharing a keyboard based upon requests for attention |
US8271005B2 (en) * | 2009-01-12 | 2012-09-18 | Jlt Group, Inc. | Mobile communication device and system with limited data transfer |
US8538071B2 (en) * | 2009-03-18 | 2013-09-17 | Raytheon Company | System and method for target separation of closely spaced targets in automatic target recognition |
US8356252B2 (en) * | 2009-09-02 | 2013-01-15 | Synchronoss Technologies, Inc. | System and method for providing a computer display form layout |
US9563815B2 (en) * | 2009-09-15 | 2017-02-07 | Tandent Vision Science, Inc. | Method and system for processing an image received from a remote source |
US10402847B2 (en) * | 2009-11-20 | 2019-09-03 | Mobisave Llc | System and method of electronically verifying required proof-of-performance to secure promotional rewards |
US20160104189A1 (en) * | 2009-11-20 | 2016-04-14 | Mobisave Llc | In-aisle competitive offer push system and method |
US8806362B2 (en) * | 2010-01-06 | 2014-08-12 | Apple Inc. | Device, method, and graphical user interface for accessing alternate keys |
EP2531965A4 (en) * | 2010-02-05 | 2015-01-07 | Medversant Technologies Llc | SYSTEM AND METHOD FOR HOMOLOGOUS REFERENCING IN AN ONLINE COMPUTER SYSTEM |
US8788583B2 (en) | 2010-05-13 | 2014-07-22 | International Business Machines Corporation | Sharing form training result utilizing a social network |
CA2707929A1 (en) * | 2010-06-15 | 2011-12-15 | Faizal Haji | Method and system for generating electronic receipts from print data |
JP5253462B2 (ja) * | 2010-07-30 | 2013-07-31 | 株式会社富士通マーケティング | 店舗別レシートデータ収集装置およびそのプログラム |
US20120050819A1 (en) * | 2010-08-30 | 2012-03-01 | Jiang Hong | Approach For Processing Scanned Document Data |
US9083826B2 (en) | 2010-08-31 | 2015-07-14 | Ricoh Company, Ltd. | Tracking the processing of electronic document data by network services using trace |
US8515930B2 (en) | 2010-08-31 | 2013-08-20 | Ricoh Company, Ltd. | Merging a scanned document with an existing document on a server |
US20120050818A1 (en) * | 2010-08-31 | 2012-03-01 | Kaoru Watanabe | Sending scanned document data through a network to a mobile device |
US9042653B2 (en) | 2011-01-24 | 2015-05-26 | Microsoft Technology Licensing, Llc | Associating captured image data with a spreadsheet |
US10409892B2 (en) | 2011-01-26 | 2019-09-10 | Microsoft Technology Licensing, Llc | Formatting data by example |
US20120197805A1 (en) * | 2011-01-31 | 2012-08-02 | Intuit Inc. | Method and apparatus for capturing financial data using a camera-equipped computing device |
US8811726B2 (en) * | 2011-06-02 | 2014-08-19 | Kriegman-Belhumeur Vision Technologies, Llc | Method and system for localizing parts of an object in an image for computer vision applications |
US11323505B2 (en) | 2011-06-20 | 2022-05-03 | Ibotta, Inc. | Computer networks for selective node delivery |
JP5844564B2 (ja) * | 2011-07-07 | 2016-01-20 | 隆均 半田 | 帳票認識システム |
US20130022257A1 (en) * | 2011-07-19 | 2013-01-24 | General Electric Company | Systems and methods for automatic generation of medical image sheets |
US10769554B2 (en) * | 2011-08-01 | 2020-09-08 | Intuit Inc. | Interactive technique for using a user-provided image of a document to collect information |
WO2013039025A1 (ja) * | 2011-09-16 | 2013-03-21 | Necカシオモバイルコミュニケーションズ株式会社 | 情報管理編集機能を備えた情報処理装置 |
US20140258243A1 (en) * | 2011-10-11 | 2014-09-11 | Applyrapid, Inc. | Online system, apparatus, and method for obtaining or apply for information programs, services and/or products |
US9858548B2 (en) | 2011-10-18 | 2018-01-02 | Dotloop, Llc | Systems, methods and apparatus for form building |
JP5878004B2 (ja) * | 2011-11-15 | 2016-03-08 | 隆均 半田 | 複数文書認識システム及び複数文書認識方法 |
US11182820B2 (en) | 2011-12-02 | 2021-11-23 | T-Mobile Usa Inc. | System and method for electronic submission of a rebate request with validation information |
KR101356629B1 (ko) | 2012-01-20 | 2014-02-04 | 한국과학기술원 | 상관 클러스터링을 이용한 이미지 분할 방법, 이를 처리하는 시스템 및 기록매체 |
US20130191714A1 (en) * | 2012-01-25 | 2013-07-25 | Microsoft Corporation | Fill by example animation and visuals |
US10044938B2 (en) * | 2012-02-08 | 2018-08-07 | Abukai, Inc. | Method and apparatus for processing images of receipts |
GB201203858D0 (en) * | 2012-03-05 | 2012-04-18 | Porta Holding Ltd | Automated processing of documents |
US9811850B2 (en) | 2012-04-08 | 2017-11-07 | Microsoft Technology Licensing, Llc | User task completion via open market of actions and/or providers |
JP5246364B1 (ja) * | 2012-05-18 | 2013-07-24 | 富士ゼロックス株式会社 | 情報処理システム及びプログラム |
US11631265B2 (en) * | 2012-05-24 | 2023-04-18 | Esker, Inc. | Automated learning of document data fields |
US9536141B2 (en) * | 2012-06-29 | 2017-01-03 | Palo Alto Research Center Incorporated | System and method for forms recognition by synthesizing corrected localization of data fields |
US9342495B2 (en) * | 2012-07-18 | 2016-05-17 | Think Research Corporation | Methods, software and devices for improving visibility of user-filled data in an electronic form |
US9430456B2 (en) * | 2012-08-10 | 2016-08-30 | Transaxy Inc. | System for entering data into a data processing system |
US9092667B2 (en) * | 2012-08-27 | 2015-07-28 | Symbol Technologies, Llc | Arrangement for and method of reading forms in correct orientation by image capture |
US10826951B2 (en) | 2013-02-11 | 2020-11-03 | Dotloop, Llc | Electronic content sharing |
US9189468B2 (en) * | 2013-03-07 | 2015-11-17 | Ricoh Company, Ltd. | Form filling based on classification and identification of multimedia data |
US20140258825A1 (en) * | 2013-03-08 | 2014-09-11 | Tuhin Ghosh | Systems and methods for automated form generation |
US20140258838A1 (en) * | 2013-03-11 | 2014-09-11 | Sap Ag | Expense input utilities, systems, and methods |
US8924259B2 (en) | 2013-03-14 | 2014-12-30 | Square, Inc. | Mobile device payments |
JP5654627B2 (ja) * | 2013-03-14 | 2015-01-14 | 株式会社富士通マーケティング | 店舗別レシートデータ収集装置およびそのプログラム |
JP5814284B2 (ja) * | 2013-03-22 | 2015-11-17 | ヤフー株式会社 | 端末装置、表示方法、表示制御プログラム及びサーバ装置 |
US9575622B1 (en) | 2013-04-02 | 2017-02-21 | Dotloop, Llc | Systems and methods for electronic signature |
US9406089B2 (en) * | 2013-04-30 | 2016-08-02 | Intuit Inc. | Video-voice preparation of electronic tax return |
KR101504156B1 (ko) * | 2013-05-20 | 2015-04-02 | 주식회사 엠앤엘솔루션 | 클라우드 서비스 기반 문서 인식 및 개인정보 공유 서비스 장치 |
US10229101B2 (en) | 2013-06-14 | 2019-03-12 | Microsoft Technology Licensing, Llc | Smart fill |
US9148771B2 (en) | 2013-07-29 | 2015-09-29 | Motorola Solutions, Inc. | Method to provide context-aware linkage between NG9-1-1 SMS and public safety incident |
US10140257B2 (en) | 2013-08-02 | 2018-11-27 | Symbol Technologies, Llc | Method and apparatus for capturing and processing content from context sensitive documents on a mobile device |
US10769362B2 (en) | 2013-08-02 | 2020-09-08 | Symbol Technologies, Llc | Method and apparatus for capturing and extracting content from documents on a mobile device |
US9710440B2 (en) * | 2013-08-21 | 2017-07-18 | Microsoft Technology Licensing, Llc | Presenting fixed format documents in reflowed format |
US10867143B2 (en) | 2013-09-17 | 2020-12-15 | Integrated Solutions International, Llc | Systems and methods for age-restricted product registration |
US11886952B2 (en) | 2013-09-17 | 2024-01-30 | Integrated Solutions International, Llc | Systems and methods for point of sale age verification |
US10867144B2 (en) | 2013-09-17 | 2020-12-15 | Integrated Solutions International Llc | Systems and methods for point of sale age verification |
US9558387B2 (en) * | 2013-09-17 | 2017-01-31 | Michael F. Sweeney | Systems and methods for decoding and using data on cards |
WO2015048291A1 (en) * | 2013-09-25 | 2015-04-02 | Chartspan Medical Technologies, Inc. | User-initiated data recognition and data conversion process |
US10061835B2 (en) | 2013-10-28 | 2018-08-28 | Motorola Solutions, Inc. | Establishing user-confidence levels of data inputs |
US9799021B1 (en) | 2013-11-26 | 2017-10-24 | Square, Inc. | Tip processing at a point-of-sale system |
CN103716670A (zh) * | 2013-11-27 | 2014-04-09 | 深圳市同洲电子股份有限公司 | 一种自定义栏位的方法和系统 |
US9286526B1 (en) * | 2013-12-09 | 2016-03-15 | Amazon Technologies, Inc. | Cohort-based learning from user edits |
KR101516684B1 (ko) * | 2013-12-19 | 2015-05-11 | 주식회사 지트레이스 | Ocr을 이용한 문서 변환 서비스 방법 |
USD738909S1 (en) * | 2014-01-09 | 2015-09-15 | Microsoft Corporation | Display screen with animated graphical user interface |
US10552525B1 (en) * | 2014-02-12 | 2020-02-04 | Dotloop, Llc | Systems, methods and apparatuses for automated form templating |
US8885916B1 (en) | 2014-03-28 | 2014-11-11 | State Farm Mutual Automobile Insurance Company | System and method for automatically measuring the dimensions of and identifying the type of exterior siding |
US20150301987A1 (en) * | 2014-04-18 | 2015-10-22 | Microsoft Corporation | Multiple monitor data entry |
KR101633974B1 (ko) * | 2014-05-14 | 2016-06-27 | 중소기업은행 | 카드사용 명세서 생성 장치 및 방법 |
CN104090648B (zh) * | 2014-05-21 | 2017-08-25 | 中兴通讯股份有限公司 | 数据录入方法及终端 |
US10824799B2 (en) | 2014-06-30 | 2020-11-03 | Microsoft Technology Licensing, Llc | Summary data autofill |
JP6399872B2 (ja) * | 2014-07-07 | 2018-10-03 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
US20160012030A1 (en) * | 2014-07-08 | 2016-01-14 | Tuyen Tran | Data form generation and gathering |
US10733364B1 (en) | 2014-09-02 | 2020-08-04 | Dotloop, Llc | Simplified form interface system and method |
US9741026B1 (en) | 2014-09-30 | 2017-08-22 | Square, Inc. | Payment by use of identifier |
US9384391B2 (en) * | 2014-10-03 | 2016-07-05 | Xerox Corporation | Methods and systems for processing documents |
EP3213504B1 (en) * | 2014-10-28 | 2022-04-13 | Hewlett-Packard Development Company, L.P. | Image data segmentation |
US20170185832A1 (en) * | 2015-02-04 | 2017-06-29 | Vatbox, Ltd. | System and method for verifying extraction of multiple document images from an electronic document |
US10621676B2 (en) * | 2015-02-04 | 2020-04-14 | Vatbox, Ltd. | System and methods for extracting document images from images featuring multiple documents |
US10755357B1 (en) | 2015-07-17 | 2020-08-25 | State Farm Mutual Automobile Insurance Company | Aerial imaging for insurance purposes |
US9519901B1 (en) | 2015-09-16 | 2016-12-13 | Square, Inc. | Biometric payment technology |
US9805511B2 (en) * | 2015-10-21 | 2017-10-31 | International Business Machines Corporation | Interacting with data fields on a page using augmented reality |
WO2017075392A1 (en) | 2015-10-30 | 2017-05-04 | Acxiom Corporation | Automated interpretation for the layout of structured multi-field files |
US10387561B2 (en) | 2015-11-29 | 2019-08-20 | Vatbox, Ltd. | System and method for obtaining reissues of electronic documents lacking required data |
US10558880B2 (en) | 2015-11-29 | 2020-02-11 | Vatbox, Ltd. | System and method for finding evidencing electronic documents based on unstructured data |
US11138372B2 (en) | 2015-11-29 | 2021-10-05 | Vatbox, Ltd. | System and method for reporting based on electronic documents |
US10509811B2 (en) | 2015-11-29 | 2019-12-17 | Vatbox, Ltd. | System and method for improved analysis of travel-indicating unstructured electronic documents |
WO2017128273A1 (en) | 2016-01-29 | 2017-08-03 | Hewlett Packard Enterprise Development Lp | Error block determination |
JP6690278B2 (ja) * | 2016-02-10 | 2020-04-28 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
CN105718432B (zh) * | 2016-03-16 | 2019-02-01 | 北京睿新科技有限公司 | 一种用于电网运行设备的信息挖掘与数据质量的校验方法 |
CN107239453B (zh) * | 2016-03-28 | 2020-10-02 | 平安科技(深圳)有限公司 | 信息写入方法和装置 |
US11507688B1 (en) | 2016-05-10 | 2022-11-22 | Ibotta, Inc. | Methods and systems for tracking and regulating the availability of syndicated data items across multiple communication channels including online and offline channels |
CN106648308A (zh) * | 2016-11-17 | 2017-05-10 | 北京小度信息科技有限公司 | 界面显示方法、信息输入方法和装置 |
US10062074B1 (en) | 2016-11-30 | 2018-08-28 | Square, Inc. | System for improving card on file transactions |
KR102004180B1 (ko) * | 2016-12-22 | 2019-10-01 | 김학현 | 시험지 인식을 통한 유사 문제 추출 장치 및 그 방법 |
CN106844567A (zh) * | 2016-12-23 | 2017-06-13 | 《中国医药科学》杂志社有限公司 | 一种纸质稿件转换为网络文本页面的方法及系统 |
US9992022B1 (en) * | 2017-02-06 | 2018-06-05 | Northern Trust Corporation | Systems and methods for digital identity management and permission controls within distributed network nodes |
JP6957889B2 (ja) * | 2017-02-08 | 2021-11-02 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及び画像処理プログラム |
CN107040592A (zh) * | 2017-03-31 | 2017-08-11 | 南京钧元网络科技有限公司 | 一种手持式一站式检测服务系统及方法 |
WO2019017873A1 (en) | 2017-07-17 | 2019-01-24 | Hewlett-Packard Development Company, L.P. | IMAGING OBJECT PROCESSING |
EP3662393A1 (en) * | 2017-08-02 | 2020-06-10 | Canoe Software Inc. | Automated reporting system |
US10268883B2 (en) * | 2017-08-10 | 2019-04-23 | Adobe Inc. | Form structure extraction network |
KR102029980B1 (ko) * | 2017-08-31 | 2019-10-08 | 한국전자통신연구원 | 대체 텍스트 생성 장치 및 그 방법 |
US10762286B2 (en) * | 2017-09-21 | 2020-09-01 | Payformix LLC | Automated electronic form generation |
US10789422B2 (en) * | 2017-09-27 | 2020-09-29 | Equifax Inc. | Synchronizing data-entry fields with corresponding image regions |
US11010677B2 (en) | 2017-09-30 | 2021-05-18 | Oracle International Corporation | Event management system |
US11301945B2 (en) | 2017-09-30 | 2022-04-12 | Oracle International Corporation | Recruiting and admission system |
US11062411B2 (en) | 2017-09-30 | 2021-07-13 | Oracle International Corporation | Student retention system |
US11151672B2 (en) | 2017-10-17 | 2021-10-19 | Oracle International Corporation | Academic program recommendation |
US10817656B2 (en) | 2017-11-22 | 2020-10-27 | Adp, Llc | Methods and devices for enabling computers to automatically enter information into a unified database from heterogeneous documents |
KR102458338B1 (ko) * | 2017-11-30 | 2022-10-25 | 삼성전자주식회사 | 컴퓨팅 장치의 정보 입력 방법 및 그 컴퓨팅 장치 |
JP7158845B2 (ja) * | 2017-11-30 | 2022-10-24 | キヤノン株式会社 | 画像読取装置、画像読取装置の制御方法、及びプログラム |
US10452904B2 (en) * | 2017-12-01 | 2019-10-22 | International Business Machines Corporation | Blockwise extraction of document metadata |
KR102023833B1 (ko) * | 2018-01-22 | 2019-09-20 | 숭실대학교산학협력단 | 광학문자인식 기반 전자 가계부 관리 시스템 및 방법, 이를 수행하기 위한 기록매체 |
JP7032692B2 (ja) | 2018-01-31 | 2022-03-09 | セイコーエプソン株式会社 | 画像処理装置および画像処理プログラム |
US10949608B2 (en) * | 2018-02-21 | 2021-03-16 | Oracle International Corporation | Data feedback interface |
KR102036915B1 (ko) * | 2018-04-03 | 2019-10-25 | 주식회사 한글과컴퓨터 | 개체 일괄 편집 방법 및 이를 이용하는 개체 일괄 편집 장치 |
WO2019197924A1 (en) * | 2018-04-13 | 2019-10-17 | Perry + Currier Inc. | System and method for automatic docketing and data entry |
US10241992B1 (en) * | 2018-04-27 | 2019-03-26 | Open Text Sa Ulc | Table item information extraction with continuous machine learning through local and global models |
US10846550B2 (en) * | 2018-06-28 | 2020-11-24 | Google Llc | Object classification for image recognition processing |
US11321519B1 (en) * | 2018-08-29 | 2022-05-03 | Applied Statistics & Management Inc. | Data parsing and verification in a network environment |
US10878402B1 (en) | 2018-08-31 | 2020-12-29 | Square, Inc. | Temporarily provisioning payment functionality to alternate payment instrument |
US10997583B1 (en) | 2018-08-31 | 2021-05-04 | Square, Inc. | Temporarily provisioning card on file payment functionality to proximate merchants |
US10713524B2 (en) | 2018-10-10 | 2020-07-14 | Microsoft Technology Licensing, Llc | Key value extraction from documents |
CN109388675A (zh) * | 2018-10-12 | 2019-02-26 | 平安科技(深圳)有限公司 | 数据分析方法、装置、计算机设备及存储介质 |
US11880438B2 (en) | 2018-10-17 | 2024-01-23 | Integrated Solutions International, Llc | Systems and methods for age restricted product activation |
US11144715B2 (en) * | 2018-11-29 | 2021-10-12 | ProntoForms Inc. | Efficient data entry system for electronic forms |
EP3895068A4 (en) * | 2018-12-12 | 2022-07-13 | Hewlett-Packard Development Company, L.P. | SCANNERS WITH ZONAL OCR USER INTERFACES |
CN109684400A (zh) * | 2018-12-29 | 2019-04-26 | 国网江苏省电力有限公司 | 一种基于rpa财务机器人的主数据管理自动化的方法 |
JP2020136728A (ja) * | 2019-02-13 | 2020-08-31 | キヤノン株式会社 | 画像処理装置、システム、方法およびプログラム |
KR20200100918A (ko) * | 2019-02-19 | 2020-08-27 | 삼성전자주식회사 | 카메라를 이용하는 어플리케이션을 통해 다양한 기능을 제공하는 전자 장치 및 그의 동작 방법 |
US11543943B2 (en) * | 2019-04-30 | 2023-01-03 | Open Text Sa Ulc | Systems and methods for on-image navigation and direct image-to-data storage table data capture |
CN111913930A (zh) * | 2019-05-10 | 2020-11-10 | 上海中晶科技有限公司 | 物种数据解析方法、系统及电脑程序产品 |
US11295072B2 (en) | 2019-06-03 | 2022-04-05 | Adp, Llc | Autoform filling using text from optical character recognition and metadata for document types |
US10839147B1 (en) * | 2019-09-24 | 2020-11-17 | Intersections Inc. | Method, a system and a machine-readable data carrier for classifying input fields and groups of input fields of a webpage |
US11423042B2 (en) | 2020-02-07 | 2022-08-23 | International Business Machines Corporation | Extracting information from unstructured documents using natural language processing and conversion of unstructured documents into structured documents |
US11392753B2 (en) * | 2020-02-07 | 2022-07-19 | International Business Machines Corporation | Navigating unstructured documents using structured documents including information extracted from unstructured documents |
JP2021149184A (ja) * | 2020-03-16 | 2021-09-27 | 富士フイルムビジネスイノベーション株式会社 | 文書処理装置、文書管理サーバ及びプログラム |
US11423219B2 (en) * | 2020-03-19 | 2022-08-23 | International Business Machines Corporation | Generation and population of new application document utilizing historical application documents |
US11803415B2 (en) * | 2020-03-31 | 2023-10-31 | Microsoft Technology Licensing, Llc | Automating tasks for a user across their mobile applications |
CN111652176A (zh) * | 2020-06-11 | 2020-09-11 | 商汤国际私人有限公司 | 信息提取方法、装置、设备及存储介质 |
US11568284B2 (en) * | 2020-06-26 | 2023-01-31 | Intuit Inc. | System and method for determining a structured representation of a form document utilizing multiple machine learning models |
US11669215B2 (en) * | 2020-09-11 | 2023-06-06 | Future Dial, Inc. | Computing device identifier retrieval |
CN112184164A (zh) * | 2020-09-27 | 2021-01-05 | 中国建设银行股份有限公司 | 租赁物信息的管理方法、装置、电子设备及存储介质 |
US11755348B1 (en) * | 2020-10-13 | 2023-09-12 | Parallels International Gmbh | Direct and proxy remote form content provisioning methods and systems |
CN112257396A (zh) * | 2020-10-20 | 2021-01-22 | 浪潮云信息技术股份公司 | 一种基于人工智能技术的手机端辅助填表方法 |
CN112306333A (zh) * | 2020-11-11 | 2021-02-02 | 天津汇商共达科技有限责任公司 | 一种数据填充的方法及装置 |
US11315353B1 (en) | 2021-06-10 | 2022-04-26 | Instabase, Inc. | Systems and methods for spatial-aware information extraction from electronic source documents |
CN113449496A (zh) * | 2021-06-25 | 2021-09-28 | 北京京东振世信息技术有限公司 | 一种自动生成维修单据的方法和装置 |
US11829701B1 (en) * | 2022-06-30 | 2023-11-28 | Accenture Global Solutions Limited | Heuristics-based processing of electronic document contents |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001155114A (ja) * | 1999-11-30 | 2001-06-08 | Pfu Ltd | 文字認識前処理装置及び方法並びにプログラム記録媒体 |
JP2001344562A (ja) * | 2000-05-31 | 2001-12-14 | Toshiba Corp | 文書読取装置および文書読取方法 |
JP2002133367A (ja) * | 2000-10-20 | 2002-05-10 | Oki Electric Ind Co Ltd | 文字認識装置 |
JP2003036260A (ja) * | 2001-07-25 | 2003-02-07 | Canon Inc | データ管理装置およびデータ管理装置の制御方法およびプログラムおよび記憶媒体 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03210688A (ja) * | 1990-01-12 | 1991-09-13 | Oki Electric Ind Co Ltd | 行検出装置 |
KR100253629B1 (ko) | 1994-04-25 | 2000-04-15 | 송정식 | 컴퓨터에의 자료입력이 용이한 명함과 명함 판독기 |
JP3727422B2 (ja) * | 1996-09-03 | 2005-12-14 | 松下電器産業株式会社 | 文字認識装置及びその方法 |
US6366696B1 (en) | 1996-12-20 | 2002-04-02 | Ncr Corporation | Visual bar code recognition method |
JPH10198688A (ja) * | 1997-01-10 | 1998-07-31 | Matsushita Electric Ind Co Ltd | 定型文書読み取り装置 |
US6108444A (en) | 1997-09-29 | 2000-08-22 | Xerox Corporation | Method of grouping handwritten word segments in handwritten document images |
JP2000353845A (ja) * | 1999-06-10 | 2000-12-19 | Sumitomo Electric Ind Ltd | 半導体レーザモジュール |
US6411313B1 (en) | 1999-06-14 | 2002-06-25 | Microsoft Corporation | User interface for creating a spreadsheet pivottable |
CN1147807C (zh) * | 2000-08-22 | 2004-04-28 | 英业达集团(上海)电子技术有限公司 | 名片自动识别方法与系统 |
US7746510B2 (en) * | 2001-02-01 | 2010-06-29 | Pandipati Radha K C | Receipts scanner and financial organizer |
US20020131636A1 (en) * | 2001-03-19 | 2002-09-19 | Darwin Hou | Palm office assistants |
KR20020076087A (ko) * | 2001-03-27 | 2002-10-09 | 황은성 | 스캐너와 컴퓨터를 이용한 인터넷 상에서의 명함정보의디지털화 및 관리방법 |
US6898316B2 (en) * | 2001-11-09 | 2005-05-24 | Arcsoft, Inc. | Multiple image area detection in a digital image |
JP3921390B2 (ja) | 2002-01-23 | 2007-05-30 | Necインフロンティア株式会社 | 電話帳情報抽出方式及びその方法 |
TW581972B (en) * | 2002-05-06 | 2004-04-01 | Newsoft Technology Corp | Method to determine adjacency relation |
-
2004
- 2004-03-24 US US10/808,194 patent/US7305129B2/en active Active
-
2005
- 2005-03-21 EP EP05102236A patent/EP1580666A3/en not_active Ceased
- 2005-03-23 JP JP2005083418A patent/JP4676225B2/ja not_active Expired - Fee Related
- 2005-03-24 CN CNB2005100561789A patent/CN100465945C/zh active Active
- 2005-03-24 KR KR1020050024559A patent/KR101122854B1/ko not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001155114A (ja) * | 1999-11-30 | 2001-06-08 | Pfu Ltd | 文字認識前処理装置及び方法並びにプログラム記録媒体 |
JP2001344562A (ja) * | 2000-05-31 | 2001-12-14 | Toshiba Corp | 文書読取装置および文書読取方法 |
JP2002133367A (ja) * | 2000-10-20 | 2002-05-10 | Oki Electric Ind Co Ltd | 文字認識装置 |
JP2003036260A (ja) * | 2001-07-25 | 2003-02-07 | Canon Inc | データ管理装置およびデータ管理装置の制御方法およびプログラムおよび記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
KR101122854B1 (ko) | 2012-03-22 |
EP1580666A2 (en) | 2005-09-28 |
JP2005302011A (ja) | 2005-10-27 |
CN100465945C (zh) | 2009-03-04 |
EP1580666A3 (en) | 2007-01-17 |
US20040181749A1 (en) | 2004-09-16 |
CN1673995A (zh) | 2005-09-28 |
KR20060044691A (ko) | 2006-05-16 |
US7305129B2 (en) | 2007-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4676225B2 (ja) | スキャン・ドキュメントから電子フォームに取り込むための方法および装置 | |
US10867171B1 (en) | Systems and methods for machine learning based content extraction from document images | |
JP4829920B2 (ja) | フォーム自動埋込方法及び装置、グラフィカルユーザインターフェース装置 | |
KR101114194B1 (ko) | 보조된 서식 채우기 | |
CN101297318B (zh) | 用于混合介质文档系统的数据组织和访问 | |
CN102289667B (zh) | 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正 | |
EP3869385A1 (en) | Method for extracting structural data from image, apparatus and device | |
CN101578597A (zh) | 转换文本 | |
US20190340429A1 (en) | System and Method for Processing and Identifying Content in Form Documents | |
US11741735B2 (en) | Automatically attaching optical character recognition data to images | |
CN111539414B (zh) | 一种ocr图像字符识别和字符校正的方法及系统 | |
CN117083605A (zh) | 用于文本-图像-布局变换器模型的迭代训练 | |
US11914567B2 (en) | Text-based machine learning extraction of table data from a read-only document | |
CN115294593A (zh) | 一种图像信息抽取方法、装置、计算机设备及存储介质 | |
JP2010061403A (ja) | 文字列認識装置及び方法、並びにプログラム | |
JP5720182B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
US20220044048A1 (en) | System and method to recognise characters from an image | |
Alzuru et al. | Cooperative human-machine data extraction from biological collections | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
KR102555809B1 (ko) | 문서 양식을 웹폼으로 변환하는 방법 및 시스템 | |
US10339376B2 (en) | System and method for automated processing of electronic documents | |
US20230289515A1 (en) | Methods and systems for adding annotations from a printed version of a document to a digital version of the document | |
Kurhekar et al. | Automated text and tabular data extraction from scanned document images | |
JP2005078287A (ja) | 文字認識装置、文字認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110121 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110127 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140204 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |