JPH07200731A - フォーム識別処理システム及び方法 - Google Patents

フォーム識別処理システム及び方法

Info

Publication number
JPH07200731A
JPH07200731A JP6290066A JP29006694A JPH07200731A JP H07200731 A JPH07200731 A JP H07200731A JP 6290066 A JP6290066 A JP 6290066A JP 29006694 A JP29006694 A JP 29006694A JP H07200731 A JPH07200731 A JP H07200731A
Authority
JP
Japan
Prior art keywords
profile
hierarchical
completed
blank
filled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6290066A
Other languages
English (en)
Other versions
JP3703157B2 (ja
Inventor
Willis J Luther
ジェイ. ルター ウイリス
Shin-Ywan Wang
ワン シン・ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Information Systems Inc
Original Assignee
Canon Information Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Information Systems Inc filed Critical Canon Information Systems Inc
Publication of JPH07200731A publication Critical patent/JPH07200731A/ja
Application granted granted Critical
Publication of JP3703157B2 publication Critical patent/JP3703157B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

(57)【要約】 【目的】 複数枚の異なる未記入用紙の走査し、走査さ
れた未記入用紙の各々の階層プロファイルの作成して記
入済み用紙を識別する。 【構成】 各々の階層用紙プロファイルが辞書に記憶さ
れる。用紙辞書が作成されると、記入済み用紙が走査さ
れる。記入済み用紙の階層プロファイルが作成され、記
入済み用紙の階層プロファイルと、記憶階層用紙プロフ
ァイルが比較される。比較の結果に基づいて、記憶階層
用紙のいずれかが、記入済み用紙階層プロファイルに対
応するものとして識別される。そして、対応する階層用
紙プロファイルの識別に基づいて、記入済み用紙は更に
別の処理にルーティングされる。また、用紙の識別に基
づいて、記入済み用紙内の、予め指定された特定用紙独
自のフィールドからデータを抽出することもできる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、記入済みの印刷された
フォームからのデータの検索回収と処理に関するもので
ある。更に詳細に述べると、本発明は、記入済みの印刷
されたフォームの特徴を識別する特徴抽出技術を利用
し、且つ書式の被識別特徴に基づいて所望データの位置
決め、所望データの抽出、所望データへの記憶装置に記
憶、そして、必要なら、後処理のために抽出データをオ
ペレータに表示する方法と装置に関するものである。
【0002】
【従来の技術】記入済みの印刷されたフォーム、すなわ
ち、用紙のデータを入力するのに、文書画像管理システ
ムのようなデータ入力および検索回収システムが広く利
用されている。一般的に、このようなシステムは、信用
状用紙、保険用紙、調査用紙、病院用紙等といった、い
ろいろなタイプの記入済み用紙のデータを処理するよう
に考案されている。多数異種の用紙を処理するために、
システムオペレータは用紙を手作業で分類し、用紙を相
似な用紙のバッチに分けなくてはならない。異種用紙は
分類されて相似なバッチに分けられると、同種の記入済
み用紙バッチがデータ入力オペレータに渡され、記入済
み用紙のデータは中央処理装置へ手作業で入力される。
データ入力工程の際、オペレータは記入済み用紙を調べ
て、手作業でキー入力するデータを判断し、各記入済み
用紙のデータを中央処理装置に手作業でキー入力する。
【0003】時間を節約するために、もっと複雑なペー
パーレス分類方法が採用されたこともあった。ペーパー
レス分類を利用した場合、記入済み用紙はディジタル式
に走査されて用紙のディジタル画像が記憶される。記入
済み用紙のディジタル画像はいったん記憶装置に記憶さ
れるか、データ入力オペレータによって、または印刷さ
れた用紙のバーコードフィールドのようなコード化され
た「指標フィールド」を最初に捜し出して指標フィール
ドに最適処理を施す自動分類工程によって、識別され
る。記入済み用紙が認識されると、用紙は自動的に分類
され、前述の通り別の処理のために適当なデータ入力オ
ペレータのワークステーションに送られる。
【0004】
【発明が解決しようとする課題】ペーパーレス分類とい
う利益にも関わらず、手動システムも、ペーパーレス分
類システムも、いずれも記入済み用紙のデータを分類し
て手作業でデータ入力するのに非常に時間がかかるとい
う点で不利益を被る。また、全部の記入済み用紙を走査
することによる自動走査業務を利用する会社では、大容
量記憶装置を大量に使う。そのため、これらの会社は、
記入済み用紙の画像を記憶するのに利用できる大容量記
憶装置の容量によって制限を受ける。記入済みの用紙を
手作業で分類するのに使われる工数を削減したとして
も、大容量記憶装置の容量は指数関数的に増加する。こ
れに関して述べると、所望とするデータは記入済み用紙
のほんの小部分に入っているので、記憶装置の大部分
は、それ自体には何も記入されていない印刷された用紙
や、名前、日付、住所等といった見出しのような、各記
入済み用紙の重複要素を記憶することによって浪費され
る。未記入部分、または「空白フィールド」および「何
も記入されていない場所」を含む画像データは、同様
に、更に大容量記憶装置を浪費する。このように、大容
量記憶装置の大部分は、無用なデータまたはノンデータ
の記憶に使用されてしまう。
【0005】これまでは、いろいろな種類の記入済みの
印刷された用紙を自動入力し、記入済み用紙から所望デ
ータを抽出し、所望に応じて記入データだけをオペレー
タに表示することは不可能であった。即ち、従来は、ひ
とたび記入済み文書を分類および記憶すると、オペレー
タが記入済み用紙の所望データを入力できるように、オ
ペレータに文書全体を表示しなくてはならなかった。従
って、データ入力および検索は面倒で不経済であった。
【0006】
【課題を解決するための手段】本発明の目的は、前述の
問題を解決することである。
【0007】本発明の一態様において、記入済み用紙の
認識方法は、複数枚の異なる種類の未記入の印刷された
用紙を走査するステップと、特徴抽出技術を利用して各
々の走査された未記入用紙の階層プロファイルを作成す
るステップと、未記入用紙プロファイル同士の相似点を
削除することによって各々の未記入用紙プロファイルを
改良および変更するステップと、改良された未記入用紙
を用紙辞書に記憶するステップと、を含む。この記入済
み用紙認識方法では、記入済み用紙が走査され、用紙辞
書を作成するのに利用される特徴抽出技術のような同一
特徴抽出技術を利用して記入済み用紙の階層プロファイ
ルが作成される。記入済み用紙のプロファイルは、記入
済み用紙の階層プロファイルが未記入用紙辞書の中の未
記入用紙のいずれかとして識別されるまで、用紙辞書の
未記入用紙プロファイルの各々と比較される。
【0008】本発明の関連態様において、用紙辞書に同
一特徴抽出技術を用いた記入済み用紙データ表示方法が
ある。記入済みの印刷された用紙が走査され、記入済み
用紙の階層プロファイルが作成される。記入済み用紙プ
ロファイルは、記入済み用紙が辞書の未記入用紙のいず
れかとして識別されるまで、用紙辞書の複数の未記入用
紙プロファイルの各々と比較される。記入済み用紙の識
別に関して、記入済み用紙プロファイルと未記入用紙プ
ロファイルが比較され、その比較に基づいて、記入済み
用紙プロファイルの非相似画像データは、オペレータ表
示用に抽出および記憶される。オペレータには非相似デ
ータだけが表示されるので、オペレータは何のデータを
キー入力すべきか容易に認識できる。所望に応じてフィ
ールド識別名を表示することもできる。
【0009】本発明の更に別の態様において、用紙記入
済み部分記憶方法は、記入済みの印刷された用紙を走査
するステップと、用紙辞書作成に利用されるものと同じ
特徴抽出技術を利用して記入済み用紙の階層プロファイ
ルを作成するステップと、記入済み用紙プロファイルと
記憶未記入用紙プロファイルとを比較するステップと、
比較結果に基づいて、記憶未記入用紙プロファイルを記
入済み用紙プロファイルのものとして識別するステップ
と、未記入用紙プロファイルと記入済み用紙プロファイ
ルとを比較して記入済み用紙プロファイルと非相似デー
タを抽出するステップと、抽出された非相似データを記
憶するステップと、識別された未記入用紙を表示するこ
とによって記入済み用紙を再構成するステップと、用紙
内の適当な位置に非相似データを重ね書きするステップ
を含む。
【0010】
【実施例】前述の本発明に関する簡単な概要は、本発明
の性質が素早く理解されるように記載されたものであ
る。添付図面に照らし合わせて本発明の以下の詳細説明
を参照することにより、更に完全な理解が得られるであ
ろう。
【0011】図1は、記入済み用紙から所望データを抽
出し且つ記憶するネットワークシステムの図である。
【0012】図1に示されているように、参照数字1は
文書画像管理システムを指す。文書画像管理システム1
は、未記入の印刷されたフォーム(帳票もしくは用紙)
および記入済みの印刷された用紙を含む印刷された用紙
用の文書スキャナ2を具備する。文書スキャナ2は、走
査した用紙からディジタル画像データを生成し、その画
像データをワークステーション3に出力する。
【0013】ワークステーション3は、米国IBM社の
パーソナルコンピュータ(以下、IBM PC)、また
はPC互換コンピュータ(以下、これらを単にPCとい
う)4のような計算機器を具備する。ワークステーショ
ン3は、ローカルエリアネットワークへのインタフェー
スをとるインタフェース6も具備しており、それによ
り、ローカルエリアネットワーク上に記憶されている画
像データファイルにワークステーション3がアクセスで
きる。ワークステーション3は、文書スキャナ2によっ
て生成された入力画像データを記憶すること、あるい
は、ローカルエリアネットワークにあるファイルサーバ
ー(図示せず)に画像データをダウンプットすることが
できる。ワークステーション3は、表示装置画面5の各
領域をユーザが指定できるようにするためのキーボード
8とマウス9も具備している。
【0014】図2に示されているように、PC4は、ハ
ードドライブ10aに記憶されているオペレータが選択
したアプリケーションプログラムのような記憶プログラ
ム命令を実行する、80386(80386は米国イン
テル社の商標)プロセッサのようなCPU10を具備す
る。文書スキャナ2によって生成された文書画像データ
はPC4に受信され、PC4は、処理に先立って、その
画像データ2をランダムアクセスメモリ10b(RA
M)のような一時記憶域に記憶する。RAM10bに画
像データが記憶されるとすぐに、CPU10がハードド
ライブ10aに記憶されている特徴抽出プログラムを実
行する。CPU10は特徴抽出プログラムに従って画像
データを処理する。処理されたデータは、(以下に論ぜ
られる)用紙辞書20に記憶されている用紙と比較され
る。その後、比較結果が表示装置画面5に表示される。
【0015】ワークステーション3のデータ検索回収工
程の利用に先立ち、ワークステーション3に用紙辞書が
装備されなくてはならない。即ち、ワークステーション
3は、システムで使用される全部の用紙の用紙辞書を作
成しなくてはならない。この用紙辞書作成工程は、デー
タ検索回収システムで使用される各種未記入の用紙(フ
ォーム)を走査すること、および、各用紙の用紙辞書の
ベクトル命令化データの階層用紙プロファイルを記憶す
ることを含む。
【0016】図3から図5は、用紙辞書(フォーム辞
書)20が作成される方法を更に詳しく扱ったものであ
る。
【0017】図3は、用紙辞書20の作成方法を説明す
る機能的ブロック図である。図3に示されているよう
に、処理用の画像データを入力するために、スキャナ2
によって複数種類の未記入用紙(A、B、C、D)が走
査される。用紙辞書作成方法は、未記入用紙各種につい
て同じであるので、簡潔のために、以下の用紙辞書20
の構築方法の説明は、図4Aの未記入用紙11について
のみ説明する。
【0018】図4Aにおいて、文書スキャナ2によって
未記入用紙11が入力される。文書スキャナ2は、ワー
クステーション3に出力される画像データを生成する。
未記入用紙11の画像データを受信すると、画像データ
は、ローカルエリアネットワークステーションのファイ
ルサーバーに一時的に記憶されるか、あるいは、PC4
のRAM10bに記憶される。未記入用紙11の全体画
像データが受信されると、PC4は、参照により本明細
書にその内容が組み込まれている合衆国出願第07/8
73,012号で開示されている特徴抽出技術のような
特徴抽出プログラム、あるいは階層プロファイルを作成
する他の適切なタイプの特徴抽出工程に従って画像デー
タを処理する。記憶特徴抽出プログラムはハードドライ
ブ10aから検索して、RAM10bに記憶されること
になる。プログラムがRAMに記憶されると、CPU1
0はRAM10bの実行用工程ステップを実行する。
【0019】プログラムが開始すると、図4Bのよう
な、未記入用紙11の未記入用紙テンプレートを形成す
るため、特徴抽出プログラが用紙11内のデータブロッ
クを指定する。未記入用紙テンプレート上の各データブ
ロックは、ブロックのインデックス番号、(x,y)座
標、長さ寸法および幅寸法によって指定される。例え
ば、図4Aの「GANON Information
Systems: インボイス」という見出しは、図4
Bにおいて、「GANON Information
Systems」に対応するブロック1.1ならびに
「インボイス」に対応するブロック1.2として指定さ
れる。
【0020】テンプレートが作成されると、ベクトル命
令化データの階層用紙プロファイルを作成する特徴抽出
プログラムによって、そのテンプレートからコンピュー
タ使用可能フォーマットが生成される。図4Cに示され
ているように、コンピュータ使用可能フォーマット11
aは、ブロックの(x,y)座標と長さ寸法と幅寸法と
属性とでブロックの位置を識別することによって作成さ
れる。属性情報は、テキスト、グラフィックス等のよう
な、ブロック内の情報タイプに関するものである。
【0021】場合によっては、ブロック1.11のよう
な、ルーティング情報と識別情報の両方を具備するブロ
ックが、サブブロックに分割されることもある。例え
ば、図4Bに示されているように、ブロック1.11
は、顧客参照番号を指定するブロック1.11.3.1
のような、いくつかのサブブロックに分割される。ブロ
ック1.11.3.1は、図4Cにおいて、x=45,
y=199,l=10,att=1と定義される。
【0022】図4Aに戻り、階層用紙プロファイル11
aがベクトル命令化データとして作成および記憶される
と、未記入用紙11について数枚の典型的な記入済み用
紙が走査されシステムに入力される。各々の典型的記入
済み用紙12、13、14(図3参照)は、各々の記入
済み用紙のベクトル命令化データの記入済み用紙プロフ
ァイルを作成するために特徴抽出プログラムによって処
理される。記入済み用紙プロファイル12a,13a,
14aが作成されると、記入済み用紙プロファイル12
a,13a,14aは互いに比較され、不変要素が抽出
される。不変要素は集約され、記入済み用紙プロファイ
ル11bが作成される。未記入用紙11の未記入用紙プ
ロファイル11aと記入済み用紙プロファイル11bが
対比され、未記入用紙プロファイル11cが作られる。
未記入用紙プロファイル11cは用紙辞書20にベクト
ル命令化データとして記憶される。システムで複数枚の
未記入用紙が使用される場合には、システムで使用され
る未記入用紙のタイプごとに前述の工程が繰り返され
る。
【0023】システムが複数の未記入用紙を利用する場
合には、(用紙プロファイル11cに相当する)結果と
して得られる用紙プロファイルが後処理されて、各用紙
プロファイル間の曖昧さが除かれる。曖昧さが除かれる
と、各未記入用紙プロファイルは用紙辞書20に記憶さ
れる。未記入用紙辞書20が完成すると、データ入力シ
ステムが用意されて、記入済み用紙のデータを識別およ
び記憶される。
【0024】図5の流れ図は、用紙辞書20を構築する
工程を殊更に詳しく説明するものである。ステップS5
01で未記入用紙が走査され、画像データが作成されて
ワークステーション3に送られる。画像データは、ハー
ドドライブ10aに記憶された特徴抽出プログラムを使
用して、PC4によって処理される。特徴抽出プログラ
ムは、未記入用紙プロファイルのコンピュータ使用可能
ベクトル命令化データの元となる未記入用紙11のテン
プレートを作成する。前述の通り、図4Cに関して言え
ば、階層用紙プロファイルは、 インデックス番号と、
(x,y)座標と、長さ寸法と、幅寸法と、ブロックの
種類、即ち、テキスト、テーブル、グラフィックス等を
定義する属性情報と、によってブロックを定義するベク
トル命令化データを含む。
【0025】ステップS502で階層用紙プロファイル
を作成した後、ステップS504で、スキャナ2によっ
て未記入用紙11の、複数枚の典型的記入済み用紙1
2、13、14が走査される。ステップS505で、特
徴抽出プログラムが作用して、各々の記入済み用紙ベク
トル命令化データの階層用紙プロファイルを作成する。
ステップS506で、各々の記入済み用紙プロファイル
が比較され、各々の記入済み用紙プロファイルの不変要
素が抽出される。抽出された不変要素は集約されて典型
的記入済み用紙プロファイル11bが作成される。
【0026】ステップS508で、未記入用紙プロファ
イル11aと典型的記入済み用紙11bが集約されて未
記入用紙プロファイル11cが形成される。データシス
テムで複数の未記入用紙が使用される場合は、ステップ
S509に進み、そこでシステムで使用される各未記入
用紙ごとにS501−S508を繰り返す。
【0027】ステップS510で、異なる用紙プロファ
イルは、各々、全部の用紙プロファイル間の曖昧さを除
去することによって後処理される。その結果として得ら
れる、曖昧さを除いた階層用紙プロファイルは、ステッ
プS511で用紙辞書20に記憶される。用紙辞書20
が完成すれば、用紙同士を区別するのに要する全部の情
報が用紙辞書20に備わる。二枚の異なる用紙が同一階
層構造を有する場合には、用紙下部にある用紙番号のよ
うな、恐らく他の用紙と異なるであろう用紙特徴を識別
するために、各用紙にOCR処理を施す。この工程は、
通常は、異なる用紙中の相似特徴をなくすためにオペレ
ータを支援する後処理ステップである。前述のステップ
が終了すれば、用紙辞書20が完成する。
【0028】用紙辞書20が作成されれば、記入済み用
紙を識別することができ、所望のデータを記入済み用紙
から抽出することができる。例えば、図6は記入済み用
紙40の一例を示すものである。図示の通り、用紙40
の小部分にのみ所望データが含まれている。即ち、イン
ボイス番号、日付、項目説明、数量、価格のような、所
定項目に関する情報だけを抽出することが望ましく、ま
た、その方が効率的である。用紙上の残りの情報は無用
なデータと見なされ、それ故、抽出されない。
【0029】抽出データ量を求め、限定するために、記
入済み用紙40に識別工程が施される。記入済み用紙の
識別に従って、データ抽出工程により記入済み用紙から
予め選択されたデータフィールドが抽出される。
【0030】図7は、識別しようとする用紙を識別、抽
出、ルーティングする工程を説明する概略ブロック図で
ある。図7に示されているように、用紙辞書20を作成
するための同一特徴抽出方法を利用する階層プロファイ
ル作成器41によって、記入済み用紙40の画像データ
が処理されて、ベクトル命令化データの階層プロファイ
ルが作成される。作成された階層プロファイルは、階層
プロファイル比較器42によって、用紙辞書20に記憶
されている用紙の階層プロファイルと比較される。階層
プロファイル比較器42は用紙辞書20に対応する用紙
を識別し、記入済み用紙40の画像データは、その用紙
の識別に従って、用紙ルーター45によって適当な処理
ステーションにルーティングされる。
【0031】更に詳細に述べると、所望のデータを抽出
するために、特徴抽出プログラムは、図8Aに示される
ように記入済み用紙40のテンプレートを形成する。テ
ンプレートは、図8B、8Cの記入済み用紙を定義する
ためのベクトル命令化データを作成する工程を容易にす
る。記入済み用紙が識別されると、記入済み用紙の識別
に従って、PC4が、更なる処理のために記入済み用紙
をどこにルーティングすべきか判断する。
【0032】記入済み用紙を識別して所望のデータを抽
出するための方法は、図9に記載された流れ図に関して
殊更に詳しく論ぜられる。
【0033】ステップS901で、記入済み用紙が走査
され、記入済み用紙40の画像データが処理のためにワ
ークステーション3に出力される。ワークステーション
3のPC4は、記憶されている特徴抽出技術に従って記
入済み用紙40の画像データを処理する。ステップS9
02で、特徴抽出プログラムが、記入済み用紙40をブ
ロックに分割するように作用して階層プロファイルを作
成する。記入済み用紙プロファイルは、記入済み用紙4
0のブロック配置を定義するベクトル命令化データを含
む。ステップS903で、図8B、8Cに示された記入
済み用紙プロファイルは、用紙辞書20の未記入用紙プ
ロファイルと比較される。ステップS903で、記入済
み用紙プロファイルと用紙辞書20の用紙プロファイル
の間の不変要素が比較される。
【0034】ステップS904で、記入済み用紙プロフ
ァイルと辞書20の中の少なくとも一個の未記入用紙プ
ロファイルとの間で所定レベルの不変要素が識別された
か否かをCPU10が判定する。多数の不変要素が所定
レベルに達しない場合には、ステップS905で、その
用紙が識別されなかったことがデータ入力オペレータに
知らされ、記入済み用紙はオペレータの手作業識別分と
して拒絶されるか、あるいは、識別されない用紙にOC
Rを施すこともできる。
【0035】ステップS906で、オペレータまたはC
PU10のいずれかによって用紙が識別される。即ち、
CPU10は、記入済み用紙プロファイルと同じ不変要
素を最も多く有する未記入用紙プロファイルを選択す
る。この未記入用紙プロファイルが、記入済み用紙に対
応する用紙であるか判定がなされる。
【0036】用紙識別がなされると、ステップS907
で、その特定識別に従って記入済み用紙はルーティング
される。例えば、記入済み用紙が就職願書であれば人事
部へ、保険金請求用紙であれば損害賠償部へ等と、ルー
ティングされることがある。一方、記入済み用紙は、用
紙の所定部分の特定データフィールドを抽出して、その
抽出フィールドを光学式文字認識にかけるといった、更
なる処理のためにルーティングされることもある。
【0037】ルーティングという特色に加えて、記入済
み文書の中には数種類のデータが入っているものもある
ので、記入済み文書に更に別の処理が施されることもあ
る。例えば、記入済み文書は、画像、テキスト、グラフ
等が入った混成文書でもよく、それ故、画像認識処理以
外の認識処理がテキスト部分に施される。即ち、一般に
画像にはハーフトーン処理が施されるが、一般にテキス
トには光学式文字認識が施される。
【0038】次に、図10A,10Bを参照して本発明
の第2実施例を説明する。以下に説明される本発明は、
既に上で述べた用紙辞書20を利用するものであり、従
って、辞書20の作成に関わる詳細は簡潔のために省略
する。
【0039】図10Aを参照すると、予め指定された
「データフィールド」を抽出し、且つそれらのデータフ
ィールドだけをオペレータに表示する方法の、機能的ブ
ロック図が記載されている。図10Aに示されているよ
うに、未記入用紙が走査され、特徴抽出によって用紙の
階層プロファイルが作成される。
【0040】オペレータは、未記入用紙の階層プロファ
イルを作成する前生成段階のときに、記入済み用紙のデ
ータフィールドの中から抽出される特定データフィール
ドを指定することができる。前生成段階では、その中の
データ抽出する未記入用紙のデータフィールドは、オペ
レータが指定する。各データフィールドの指定内容は、
未記入用紙プロファイルと一緒に用紙辞書20に記憶さ
れる。階層用紙プロファイルの前生成が完了すると、記
入済み用紙が処理される。
【0041】記入済み用紙が走査されると、特徴抽出技
術によって記入済み用紙の階層プロファイルが作成され
る。完成したプロファイルは、用紙辞書20の中の全部
の階層用紙プロファイルと比較される。記入済み用紙が
用紙辞書の中の未記入用紙のいずれかとして識別された
とすると、未記入用紙と記入済み用紙プロファイルが比
較され、記入済み用紙プロファイル中の非相似要素が抽
出される。
【0042】予め指定された情報に従って、非相似要素
と予め指定されたフィールドとが、もう一度比較され
る。予め選択されたフィールドの中に入っている非相似
要素は記憶され、残りの非相似要素は廃棄される。予め
選択されたフィールドの中のデータは、更に別の処理が
施されるか、あるいは、手作業入力用としてデータ入力
オペレータに表示されるか、する。
【0043】例えば、図10Bで、数ある項目の中で、
インボイス番号、発信元および受信先情報、数量情報、
内容情報が入っている記入済み用紙が記載されている。
これらのデータフィールドは前生成定義段階のときに予
め指定されたものなので、これら各フィールドのデータ
が記入済み用紙から抽出されるのである。従って、用紙
から全部の無関係な項目を除去するため、用紙(フォー
ムデータ)はデータ入力および検索回収システムに入力
され、本発明により、所望の情報だけが手作業入力用と
してデータ入力オペレータに表示される。その結果、デ
ータ入力オペレータは記入済み用紙の有用なデータを確
認する時間を短縮できる。
【0044】このように、図11について示されている
ように、記入済み用紙40の画像データは、階層プロフ
ァイル作成器50によって処理されて階層プロファイル
が作成される。プロファイルは、階層プロファイル比較
器51によって比較されて用紙辞書20の階層用紙プロ
ファイルとして識別される。階層プロファイル比較器5
1は、識別された辞書20の用紙と、記入済み用紙40
の階層プロファイルとを比較する。非相似データは、非
相似データおよびフィールド見出し抽出器54によっ
て、各フィールド見出し情報と一緒に記入済み用紙から
抽出あれる。抽出データは、記憶することもできるし、
あるいは、すぐにオペレータに表示することもできる。
【0045】図12は、記入済み用紙から所望のフィー
ルドを抽出する工程を殊更に詳しく扱ったものである。
ステップS1201で、記入済み文書が走査されて、画
像データに特徴抽出が施される。ステップS1202
で、特徴抽出プログラムが、用紙辞書20の作成に使用
される同様の特徴抽出技術を使用して、記入済み用紙の
階層用紙プロファイルを作成する。ステップS1204
で、記入済み用紙プロファイルは、用紙辞書中の未記入
用紙プロファイルの各々と比較される。ステップS12
05で、未記入用紙プロファイルのいずれかと記入済み
用紙プロファイルとの間に一致があるか否か、CPU1
0が判定する。
【0046】一致が判定されなかった場合には、ステッ
プS1206で、記入済み用紙が識別できないこと、お
よび、記入済み用紙はデータ入力オペレータによって手
作業で識別される、または、記入済み用紙は光学式文字
認識のような別の処理にルーティングされることが、デ
ータ入力オペレータに知らされる。ステップ1207
で、記入済み用紙は、オペレータまたはCPU10のい
ずれかによって識別される。ステップS1208で、記
入済み用紙プロファイルが、用紙辞書の中の未記入用紙
プロファイルと一致する場合は、一致した未記入用紙プ
ロファイルが、記入済み用紙プロファイルと比較され
る。ステップS1209で、記入済み用紙プロファイル
から非相似要素が各フィールド見出し情報と一緒に抽出
される。抽出された情報とフィールド見出し情報は、記
憶装置に記憶される。
【0047】図10Aについて上に説明されている通
り、未記入用紙プロファイルの前生成定義のとき、デー
タ抽出可能な所定フィールドを予め指定しておくことが
好ましい。この場合、記入済み文書プロファイルからの
記憶データおよび見出し情報は、予め指定されたデータ
フィールドリストと比較される。予め指定されたリスト
によって指定されたデータフィールドは、各フィールド
見出し情報と一緒に、手作業入力用としてオペレータに
表示される。あるいは、予め指定されたリストが存在し
ない場合には、全部と抽出データが各フィールド見出し
情報と一緒に、手作業入力用としてデータ入力オペレー
タに表示される。
【0048】本発明の第3実施例を図13−図15を参
照して説明する。以下に説明される本発明は、先に説明
された用紙辞書20を利用するものである。
【0049】本発明の第3実施例において、走査された
記入済み用紙の全部の画像データを記憶する必要なく、
記入済み用紙全体を表示することができる。例えば、図
13と図14に示されているように、記入済み用紙40
はデータ入力および検索回収システムに入力される。記
入済み用紙40の画像データは、用紙辞書20の作成に
使用される同一特徴抽出技術を使用して、階層プロファ
イル作成器60によって、ベクトル命令化データと属性
データより成る階層用紙プロファイルに加工される。階
層用紙比較器61によって、記入済み用紙40の階層プ
ロファイルと、用紙辞書20に記憶されている用紙の階
層プロファイルとが比較される。階層用紙比較器61
は、記入済み用紙を用紙辞書20の中の用紙のいずれか
として識別する。抽出器62によって、対応用紙と記入
済み用紙が比較されて、非相似データが各フィールド見
出し情報と一緒に記入済み用紙プロファイルから抽出さ
れる。抽出された非相似データは、各見出し情報と一緒
に用紙記憶装置に記憶される。比較および識別の他に、
階層プロファイル比較記入済み用紙61は、用紙辞書2
0から未記入用紙識別器64に対応用紙の指標を送る。
未記入用紙識別器64、抽出データと一緒に用紙指標を
用紙記憶装置に記憶する。
【0050】記憶装置から記入済み用紙40を検索ロー
ドすることをデータ入力オペレータが希望する場合、C
PU10が用紙辞書20の対応用紙を検索ロードする。
CPU10は、記憶ベクトル命令化データに従って未記
入用紙を描画する。未記入用紙が完成すると、未記入用
紙内の適当なフィールドに抽出データが重ね合わされ
る。図13の130に示されているように、未記入用紙
に重ね合わされたデータは、走査の結果、上下左右にス
キューされたり、あるいは、未記入用紙をコピーするこ
とによって拡大変化が生じることがある。スキューを修
正するために、記入済み用紙を表示する前にデータにス
キュー修正プログラムを適用できる。
【0051】図15を参照すると、記入済み用紙を識別
し、記入済み用紙からデータを抽出し、記入済み用紙か
ら抽出されたデータを、対応する未記入用紙と一緒に用
紙辞書に記憶し、記憶装置から対応する未記入用紙を検
索ロードして記入済み用紙から抽出されたデータを未記
入用紙の適当なフィールドに重ね合わせることによって
記入済み用紙を再構成する方法を説明する流れ図が記載
されている。
【0052】更に詳細に述べると、ステップS1501
で、記入済み用紙が走査されて、画像データは処理のた
めにワークステーション3に出力される。ステップS1
502で、ワークステーション3の特徴抽出プログラム
が、記入済み用紙の階層プロファイルを作成する。ステ
ップS1503で、記入済み用紙プロファイルは、用紙
辞書の未記入用紙プロファイルの各々と比較される。ス
テップS1505で、記入済み用紙プロファイルと用紙
辞書の未記入用紙プロファイルとの間に一致が識別され
たか否かをCPU10が判定する。
【0053】記入済み用紙は用紙辞書20の未記入用紙
と一致しないとCPU10が判定した場合には、ステッ
プS1506で、記入済み用紙について一致が識別され
なかったこと、および、識別されない用紙は手作業入力
用として拒絶されることが、データ入力オペレータに知
らされる。ステップ1507で、記入済み用紙は、オペ
レータまたはCPU10のいずれかによって識別され
る。
【0054】ステップS1508で、記入済み用紙プロ
ファイルが、一致した未記入用紙プロファイルと比較さ
れ、記入済み用紙プロファイルから非相似要素が抽出さ
れる。ステップS1509で、記入済み用紙プロファイ
ルから抽出されたデータは、データが抽出されたフィー
ルドの見出し情報と一緒に記憶される。抽出データと画
フィールド見出し情報の記憶に加えて、用紙辞書の中の
対応する未記入用紙の指標も記憶される。
【0055】ステップS1510で、記入済み用紙は、
記憶指標に従って、対応する未記入用紙用紙のベクトル
命令化データを記憶装置から検索ロードすることによっ
て再構成される。ベクタライズ情報に従って未記入用紙
が一行(1ライン)ずつ描画される。未記入用紙が完全
に引かれた後、抽出データが画フィールド見出し情報と
一緒に、未記入用紙の適当な位置に重ね合わせられる。
ステップS1511で、最構成された記入済み用紙のス
キューが修正され、その結果がオペレータに表示され
る。
【0056】
【発明の効果】以上説明したように本発明によれば、フ
ォームを識別するのに、簡単に、且つ、多量の記憶装置
を必要とすることなく、効率良く行えるようになる。
【図面の簡単な説明】
【図1】記入済み用紙の画像を取り込むためのネットワ
ークシステムの代表図である。
【図2】本発明のデータ入力および検索回収システムの
ブロック図である。
【図3】本発明の未記入用紙辞書作成方法の機能的ブロ
ック図である。
【図4A】本発明で利用される未記入用紙の一例を示す
図である。
【図4B】特徴抽出において利用される未記入用紙テン
プレートの微細構成図である。
【図4C】ベクトル命令化データの階層用紙プロファイ
ルの図である。
【図5】未記入用紙辞書の作成方法を説明する流れ図で
ある。
【図6】本発明で使用される記入済み用紙の一例を示す
図である。
【図7】記入済みの用紙を識別し且つルーティングする
工程の概略ブロック図である。
【図8A】図6の記入済み用紙の記入済み用紙テンプレ
ートの微細構成図である。
【図8B】図6の記入済み用紙のベクタライズバージョ
ンの、コンピュータ使用可能フォーマットの図である。
【図8C】図6の記入済み用紙のベクタライズバージョ
ンの、コンピュータ使用可能フォーマットの図である。
【図9】図6の記入済み用紙から所望データを検索回収
する方法を説明する流れ図である。
【図10A】記入済み用紙から所望データとフィールド
の見出しを抽出する方法の機能的ブロック図である。
【図10B】記入済み用紙からの所望データの抽出およ
び表示の一例を示す図である。
【図11】記入済み用紙から所望データを抽出し且つ表
示する工程の概略ブロック図である。
【図12】本発明の第二実施例において、記入済み用紙
からデータを抽出し、抽出データをフィールドの見出し
情報と共にオペレータに表示する方法を説明する流れ図
である。
【図13】抽出されたデータと記憶されている対応する
未記入用紙とから記入済み用紙を再作成する一例を示す
図である。
【図14】記入済み用紙からデータを抽出し、対応する
未記入用紙の指標を記憶し、記入済み用紙を再作成する
工程の、概略ブロック図である。
【図15】本発明の第3実施例において、記入済み用紙
からデータを抽出し、抽出データならびに用紙辞書の未
記入用紙の識別を記憶し、未記入用紙の適当なフィール
ド位置に抽出データを重ね合わせた識別未記入用紙を表
示することによって記入済み文書を再作成する作業を説
明する流れ図である。
【符号の説明】
1 文書画像管理システム 2 文書スキャナ 3 ワークステーション 4 計算機 5 画面表示装置 6 ローカルエリアネットワークインタフェース 8 キーボード 9 マウス 10 CPU 10a ハードドライブ 10b RAM 11 未記入用紙 11a コンピュータ使用可能フォーマットの未記入用
紙プロファイル 11b 記入済み用紙プロファイル 11c 未記入用紙プロファイル 12、13、14 記入済み用紙 12a、13a、14a 記入済み用紙プロファイル 20 用紙辞書 40 記入済み用紙 41 階層プロファイル作成器 42 階層プロファイル比較器 45 用紙ルーター
───────────────────────────────────────────────────── フロントページの続き (72)発明者 シン・ヤン ワン アメリカ合衆国 カリフォルニア州 92680, タスチン, ライカン レイン 2251

Claims (41)

    【特許請求の範囲】
  1. 【請求項1】 フォーム識別処理システムにおけるフォ
    ーム辞書作成方法であって、 第一未記入フォームを走査する工程と、 第一未記入フォームの階層プロファイルを作成する工程
    と、 第一未記入フォームの、複数枚の典型的記入済みフォー
    ムを走査する工程と、 典型的記入済みフォームの各々の階層プロファイルを作
    成する工程と、 各々の記入済みフォーム階層プロファイル間で比較して
    不変要素を抽出する工程と、 未記入フォーム階層プロファイルと抽出不変要素とを相
    関させて第一改良型未記入フォーム階層プロファイルを
    作成する工程と、 第一改良型未記入フォーム階層プロファイルをフォーム
    辞書に記憶する工程とを備えることを特徴とするフォー
    ム辞書作成方法。
  2. 【請求項2】 更に、 第二未記入フォームを走査する工程と、 第二未記入フォームの階層プロファイルを作成する工程
    と、 第二未記入フォームの、複数枚の典型的記入済みフォー
    ムを走査する工程と、 典型的記入済みフォームの各々の階層プロファイルを作
    成する工程と、 各々の記入済みフォーム階層プロファイル間で比較して
    不変要素を抽出する工程と、 第二未記入フォーム階層プロファイルと抽出不変要素と
    を相関させて第二改良型未記入フォーム階層プロファイ
    ルを作成する工程と、 第二改良型未記入フォーム階層プロファイルをフォーム
    辞書に記憶する工程と、 を更に備えることを特徴とする請求項1記載のフォーム
    辞書作成方法。
  3. 【請求項3】 第一改良型未記入階層プロファイルと第
    二改良型未記入プロファイルの曖昧さを除く工程を更に
    備えることを特徴とする請求項2に記載のフォーム辞書
    作成方法。
  4. 【請求項4】 曖昧さを除く工程は、 第一改良型階層プロファイルと第二改良型階層プロファ
    イルを比較して不変要素を抽出する工程と、 不変要素を廃棄する工程と、 第一および第二未記入フォームの、曖昧さを除いた階層
    プロファイルをフォーム辞書に記憶する工程と、 を備えることを特徴とする請求項3に記載のフォーム辞
    書作成方法。
  5. 【請求項5】 階層フォームプロファイルのフォーム辞
    書を使用する記入済みフォーム識別方法であって、 記入済みフォームを走査する工程と、 記入済みフォームの階層プロファイルを作成する工程
    と、 記入済みフォーム階層プロファイルとフォーム辞書の中
    の階層フォームプロファイルとを比較する工程と、 比較工程に従って、記入済みフォームに対応するものと
    して階層フォームプロファイルのいずれかを識別する工
    程とを備えることを特徴とするフォーム識別方法。
  6. 【請求項6】 更に、記入済みフォームの階層プロファ
    イルの、識別された階層フォームプロファイルと異なる
    部分を抽出する工程を備えることを特徴とする請求項5
    に記載のフォーム識別方法。
  7. 【請求項7】 更に、対応する階層フォームプロファイ
    ルの識別に従って、抽出部分を処理のためにルーティン
    グする工程を備えることを特徴とする請求項6に記載の
    フォーム識別方法。
  8. 【請求項8】 更に、対応する階層フォームプロファイ
    ルの識別に従って、抽出部分から予め指定されたデータ
    を記憶する工程を備えることを特徴とする請求項5に記
    載のフォーム識別方法。
  9. 【請求項9】 更に、対応する階層フォームプロファイ
    ルの識別に従って、抽出部分から選択されたデータを表
    示する工程を備えることを特徴とする請求項5に記載の
    フォーム識別方法。
  10. 【請求項10】 更に、対応する階層フォームプロファ
    イルの識別に従って、抽出部分から選択されたデータの
    光学式文字認識を行う工程を備えることを特徴とする請
    求項5に記載のフォーム識別方法。
  11. 【請求項11】 フォーム記入部分表示方法であって、 記入済みフォームを走査する工程と、 記入済みフォームの階層プロファイルを作成する工程
    と、 記入済みフォームの階層プロファイルと、未記入フォー
    ムの記憶された階層プロファイルを比較する工程と、 記入済みフォーム階層プロファイルの非相似部分を表示
    する工程とを備えることを特徴とするフォーム記入部分
    表示方法。
  12. 【請求項12】 更に、記入済みフォームの階層プロフ
    ァイルの、未記入フォームの階層プロファイルと異なる
    部分を抽出する工程を備えることを特徴とする請求項1
    1に記載のフォーム記入部分表示方法。
  13. 【請求項13】 前記表示工程は、抽出する工程は、記
    入済みフォームの階層プロファイルの抽出部分のフィー
    ルド見出し情報を抽出して、抽出部分をフィールド見出
    し情報と一緒に表示することを特徴する請求項11に記
    載のフォーム記入部分表示方法。
  14. 【請求項14】 更に、記入済みフォームと、フォーム
    辞書に記憶された未記入フォームとを比較することによ
    って、走査された記入済みフォームを識別する工程を更
    に備えることを特徴する請求項11に記載のフォーム記
    入部分表示方法。
  15. 【請求項15】 更に、 未記入フォームの階層プロファイルを作成する工程と、 対応する典型的記入済みフォームを走査する工程と、 典型的記入済みフォームの各々の階層プロファイルを作
    成する工程と、 記入済みフォーム階層プロファイルを比較して不変要素
    を抽出する工程と、 未記入フォーム階層プロファイルと、記入済みフォーム
    プロファイルから抽出された不変要素とを相関させて改
    良型未記入フォーム階層プロファイルを作成する工程
    と、 改良型未記入フォーム階層プロファイルをフォーム辞書
    に記憶する工程と、を更に備えることを特徴とする請求
    項11に記載のフォーム記入部分表示方法。
  16. 【請求項16】 記入済みフォームおよび未記入フォー
    ムの階層プロファイルは、各々、ベクトル命令化データ
    と属性データを含むことを特徴する請求項11に記載の
    フォーム記入部分表示方法。
  17. 【請求項17】 記入済みフォームルーティング方法で
    あって、 複数枚の異なる未記入フォームを走査する工程と、 走査された未記入フォームの各々の階層プロファイルを
    作成および記憶する工程と、 記入済みフォームを走査する工程と、 記入済みフォームの階層プロファイルを作成する工程
    と、 記入済みフォームの階層プロファイルと記憶階層プロフ
    ァイルとを比較する工程と、 比較結果に従って、記憶階層プロファイルのいずれか
    を、記入済みフォーム階層プロファイルに対応するもの
    として識別する工程と、 対応する記憶階層プロファイルの識別に従って、記入済
    みフォームを処理のためにルーティングする工程とを備
    えることを特徴とする記入済みフォームルーティング方
    法。
  18. 【請求項18】 未記入フォームの階層プロファイルを
    作成する工程は、 未記入フォームの階層プロファイルを作成する工程と、 未記入フォームごとに複数枚の対応する典型的記入済み
    フォームを走査する工程と、 典型的記入済みフォームごとに階層プロファイルを作成
    する工程と、 記入済みフォーム階層プロファイルを比較して不変要素
    を抽出する工程と、 各未記入フォームプロファイルを、対応する記入済みフ
    ォームプロファイルの抽出された不変要素と相関させて
    改良型の未記入フォーム階層プロファイルを作成する工
    程と、 を含むことを特徴とする請求項17に記載の記入済みフ
    ォームルーティング方法。
  19. 【請求項19】 記入済みフォームおよび未記入フォー
    ムの階層プロファイルは、各々、ベクトル命令化データ
    と属性データを含むことを特徴とする請求項17に記載
    の記入済みフォームルーティング方法。
  20. 【請求項20】 フォーム記入部分の記憶および検索方
    法であって、 複数枚の異なる未記入フォームを走査する工程と、 走査された未記入フォームの各々の階層プロファイルを
    作成および記憶する工程と、 記入済みフォームを走査する工程と、 記入済みフォームの階層プロファイルを作成する工程
    と、 記入済みフォームの階層プロファイルと記憶階層プロフ
    ァイルを比較する工程と、 比較の結果に従って、記憶階層プロファイルを、記入済
    みフォーム階層プロファイルに対応するものとして識別
    する工程と、 記入済みフォームの、識別された記憶階層プロファイル
    と異なる記入部分を、各見出し情報と一緒に抽出する工
    程と、 抽出された記入部分と各見出し情報を表示する工程とを
    備えることを特徴とするフォーム記入部分の記憶および
    検索方法。
  21. 【請求項21】 未記入フォームの階層プロファイルを
    作成する工程は、 未記入フォームの階層プロファイルを作成する工程と、 未記入フォームごとに複数枚の対応する典型的記入済み
    フォームを走査する工程と、 典型的記入済みフォームごとに階層プロファイルを作成
    する工程と、 記入済みフォーム階層プロファイルを比較して不変要素
    を抽出する工程と、 未記入フォームプロファイルを、対応する記入済みフォ
    ームプロファイルの抽出された不変要素と相関させて、
    改良型の未記入フォーム階層プロファイルを作成する工
    程とを含むことを特徴とする請求項20に記載のフォー
    ム記入部分の記憶および検索方法。
  22. 【請求項22】 記入済みフォームおよび未記入フォー
    ムの階層プロファイルは、各々、ベクトル命令化データ
    および属性データを含むことを特徴とする請求項20に
    記載のフォーム記入部分の記憶および検索方法。
  23. 【請求項23】 記憶する工程は、識別された記憶階層
    プロファイルの指標を記憶すること含むこと特徴とする
    請求項20に記載のフォーム記入部分の記憶および検索
    方法。
  24. 【請求項24】 記憶指標に従って検索回収された対応
    未記入フォームを表示して、記入済みフォームから抽出
    された記入部分を各見出し情報と一緒に、未記入フォー
    ムの適当な位置に重ね合わせることによって、記入済み
    フォームを表示する工程を更に備えることを特徴とする
    請求項20に記載のフォーム記入部分の記憶および検索
    方法。
  25. 【請求項25】 階層フォームプロファイルのフォーム
    辞書を使用して記入済みフォームを識別する装置であっ
    て、 記入済みフォームを走査するための走査手段と、 記入済みフォームの階層プロファイルを作成するための
    プロファイル作成手段と、 記入済みフォームの階層プロファイルとフォーム辞書の
    中の階層プロファイルを比較するための比較手段と、 比較の結果に従って、記入済みフォームに対応するもの
    として階層プロファイルのいずれかを識別するための識
    別手段と、 記入済みフォームの階層プロファイルの、識別された階
    層フォームプロファイルと異なる部分を抽出する抽出手
    段とを備えることを特徴とするフォーム識別装置。
  26. 【請求項26】 更に、対応する階層フォームプロファ
    イルの識別に従って処理のために抽出部分をルーティン
    グするルーティング手段を備えることを特徴とする請求
    項25に記載のフォーム識別装置。
  27. 【請求項27】 更に、対応する階層フォームプロファ
    イルの識別に従って抽出部分の予め指定されたデータを
    記憶する記憶手段を備えることを特徴とする請求項25
    に記載のフォーム識別装置。
  28. 【請求項28】 更に、対応する階層フォームプロファ
    イルの識別に従って抽出部分から選択されたデータを表
    示するための表示手段を備えることを特徴とする請求項
    25に記載のフォーム識別装置。
  29. 【請求項29】 更に、対応する階層フォームプロファ
    イルの識別に従って抽出部分から選択されたデータを認
    識するための文字認識手段を備えることを特徴とする請
    求項25に記載のフォーム識別装置。
  30. 【請求項30】 フォームの記入部分を表示するための
    装置において、 記入済みフォームを走査するための走査手段と、 記入済みフォームの階層プロファイルを作成するための
    プロファイル作成手段と、 記入済みフォームの階層プロファイルとフォーム辞書に
    記憶された未記入フォームの階層プロファイルを比較す
    るための比較手段と、 記入済みフォームの階層プロファイルの、未記入フォー
    ムの階層プロファイルと異なる部分を抽出するための抽
    出手段と、 記入済み階層プロファイルの抽出部分を表示するための
    表示手段とを備えることを特徴とするフォーム表示装
    置。
  31. 【請求項31】 更に、記入済みフォームを、フォーム
    辞書に記憶されている未記入フォームと比較することに
    よって、走査された記入済みフォームを識別するための
    識別手段を備えることを特徴とする請求項30に記載の
    フォーム表示装置。
  32. 【請求項32】 抽出手段は、記入済みフォームの階層
    プロファイルの抽出部分と一緒に各フィールド見出し情
    報を抽出するための手段を含み、表示手段は、各見出し
    情報と一緒に抽出部分を表示することを特徴とする請求
    項30に記載のフォーム表示装置。
  33. 【請求項33】 更に、 複数枚の対応する典型的記入済みフォームを走査するた
    めの走査手段と、 未記入フォームの階層プロファイルを作成し、典型的記
    入済みフォームの各々の階層プロファイルを作成するた
    めのプロファイル作成手段と、 記入済みフォーム階層プロファイルを比較して不変要素
    を抽出するための比較および抽出手段と、 未記入フォームプロファイルと、記入済みフォームプロ
    ファイルから抽出された不変要素を相関させて改良型の
    未記入フォーム階層プロファイルを作成するための相関
    手段とを備えることを特徴とする請求項30に記載のフ
    ォーム表示装置。
  34. 【請求項34】 記入済みフォームと未記入フォームの
    階層プロファイルは、各々、ベクトル命令化データと属
    性データを含むことを特徴とする請求項30に記載のフ
    ォーム表示装置。
  35. 【請求項35】 記入済みフォームを識別するための装
    置であって、 複数枚の異なる未記入フォームの階層プロファイルを記
    憶するための記憶装置手段と、 記入済みフォームを走査するための走査手段と、 記入済みフォームの階層プロファイルを作成するための
    作成手段と、 記入済みフォームの階層プロファイルと記憶階層プロフ
    ァイルを比較するための比較手段と、 比較の結果に従って、記入済みフォームに対応するもの
    として記憶階層プロファイルのいずれかを識別するため
    の識別手段と、 対応する記憶階層プロファイルの識別に従って処理のた
    めに抽出部分をルーティングするルーティング手段とを
    備えることを特徴とするフォーム識別装置。
  36. 【請求項36】 記入済みフォーム識別器であって、 記入済みフォームを走査するためのスキャナと、 走査された記入済みフォームの階層プロファイルを作成
    するための階層プロファイル作成器と、 走査されたフォームの階層プロファイルと、フォーム辞
    書に記憶されている種々の未記入フォームの階層プロフ
    ァイルを比較するための比較器と、 比較器の比較結果に基づいて、記入済みフォームを識別
    するためのフォーム識別器と、 その識別に基づいて、別の処理のためにフォームをルー
    ティングするフォームルーターと、 から成るフォーム識別器。
  37. 【請求項37】 記入済みフォームから抽出されたデー
    タを表示するための装置であって、 記入済みフォームを走査するためのスキャナと、 走査されたフォームの階層プロファイルを作成するため
    の階層プロファイル作成器と、 記入済みフォームの階層プロファイルと、フォーム辞書
    に記憶されている種々の未記入フォームの階層プロファ
    イルを比較するための比較器と、 記入済みフォームを識別し、その識別に基づいて記入済
    みフォームデータを抽出するためのフォーム識別器と、 抽出されたデータを表示するための表示画面とを備える
    ことを特徴とするデータ表示装置。
  38. 【請求項38】 記入済みフォームを表示するための装
    置であって、 記入済みフォームを走査するためのスキャナと、 走査されたフォームに対応する、ベクトル命令化データ
    の階層プロファイルを作成するための階層プロファイル
    作成器と、 記入済みフォームの階層プロファイルと、フォーム辞書
    の中の未記入フォームに対応するベクトル命令化データ
    の階層プロファイルを比較して、記入済みフォームプロ
    ファイルに一致する未記入フォーム階層プロファイルを
    捜し出すための比較器と、 データ識別名と、一致する未記入フォーム階層構造と非
    相似なデータを、記入済みフォームの階層プロファイル
    から抽出するためのデータ抽出器と、 抽出データ、データ識別名、一致未記入フォームの指標
    を記憶するための記憶装置と、 一致未記入フォームに重ね合わされた抽出データを表示
    するための表示画面とを備え、 一致未記入フォームフォームは階層プロファイルのベク
    トル命令化データに従って描画され、抽出データは抽出
    データの識別名に従って未記入フォームの適当な位置に
    重ね合わされることを特徴とするフォーム表示装置。
  39. 【請求項39】 階層フォームプロファイルのフォーム
    辞書を使用して記入済みフォームを識別するためのフォ
    ーム識別器の制御方法であって、 前記フォーム識別器は、 記憶されたプログラム工程を実行するためのコンピュー
    タを含む演算処理装置と、 階層フォームプロファイルのフォーム辞書と、演算処理
    装置によって実行される工程工程を記憶するための記憶
    装置と、 記入済みフォームを走査するためのスキャナを備え、 記憶装置に記憶される工程は、 走査された記入済みフォームの階層プロファイルを作成
    する工程と、 記入済みフォームの階層プロファイルと記憶装置の中の
    階層フォームプロファイルを比較する工程と、 記入済みフォームの階層プロファイルを、記憶装置の中
    の階層フォームプロファイルのいずれかに適合させる工
    程と、 適合された階層フォームプロファイルの識別に基づいて
    記入済みフォームを様式処理する工程を含むことを特徴
    とするフォーム識別器の制御方法。
  40. 【請求項40】 フォーム処理の工程は、適当なキー入
    力オペレータへの記入済みフォームのルーティングを含
    むことを特徴とする請求項39に記載のフォーム識別器
    の制御方法。
  41. 【請求項41】 フォーム処理の工程工程は、適合され
    た階層フォームプロファイルとのもとづいて記入済みフ
    ォーム階層プロファイルから不変要素を抽出して、抽出
    された不変要素をキー入力オペレータに表示することを
    含むことを特徴とする請求項39に記載のフォーム識別
    器の制御方法。
JP29006694A 1993-11-24 1994-11-24 フォーム処理方法及び装置 Expired - Fee Related JP3703157B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15670593A 1993-11-24 1993-11-24
US08/156705 1993-11-24

Publications (2)

Publication Number Publication Date
JPH07200731A true JPH07200731A (ja) 1995-08-04
JP3703157B2 JP3703157B2 (ja) 2005-10-05

Family

ID=22560709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29006694A Expired - Fee Related JP3703157B2 (ja) 1993-11-24 1994-11-24 フォーム処理方法及び装置

Country Status (4)

Country Link
US (1) US5721940A (ja)
EP (1) EP0654746B1 (ja)
JP (1) JP3703157B2 (ja)
DE (1) DE69432114T2 (ja)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822454A (en) * 1995-04-10 1998-10-13 Rebus Technology, Inc. System and method for automatic page registration and automatic zone detection during forms processing
ATE208515T1 (de) 1996-02-05 2001-11-15 Decamps Viviane Renee Verfahren zur verwendung eines computers zum verwalten des informationsaustausches zum erstellen von formularen
US5719960A (en) * 1996-06-26 1998-02-17 Canon Kabushiki Kaisha System for dispatching task orders into a user network and method
US6327387B1 (en) 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
EP0976068A1 (en) * 1997-04-15 2000-02-02 BRITISH TELECOMMUNICATIONS public limited company Service creation
DE19730880A1 (de) * 1997-07-18 1999-01-21 Basf Ag Verfahren zur selektiven Herstellung von racemischen ansa-Metallocenkomplexen
US7038805B1 (en) 1997-08-29 2006-05-02 Oce Printings Systems Gmbh Method and device for electronic archiving of a computer data flow
US6247029B1 (en) * 1998-05-01 2001-06-12 International Business Machines Corporation Web browser form enhancements
DE69926699T2 (de) * 1998-08-31 2006-06-08 International Business Machines Corp. Unterscheidung zwischen Formularen
US6351574B1 (en) * 1998-12-11 2002-02-26 International Business Machines Corporation Interactive verification of OCRed characters
US7617240B2 (en) 1999-05-04 2009-11-10 Accenture Llp Component based task handling during claim processing
US7013284B2 (en) * 1999-05-04 2006-03-14 Accenture Llp Component based interface to handle tasks during claim processing
US7979382B2 (en) 1999-05-04 2011-07-12 Accenture Global Services Limited Component based information linking during claim processing
JP4454789B2 (ja) * 1999-05-13 2010-04-21 キヤノン株式会社 帳票分類方法及び装置
US7350139B1 (en) * 2000-06-16 2008-03-25 American Express Travel Related Services Company, Inc. System and method for utilizing a drag and drop technique to complete electronic forms
US20020002563A1 (en) * 1999-08-23 2002-01-03 Mary M. Bendik Document management systems and methods
SE517445C2 (sv) * 1999-10-01 2002-06-04 Anoto Ab Positionsbestämning på en yta försedd med ett positionskodningsmönster
FR2801997A1 (fr) * 1999-12-02 2001-06-08 Itesoft Technologie adaptative d'analyse automatique de document
US7203663B1 (en) * 2000-02-15 2007-04-10 Jpmorgan Chase Bank, N.A. System and method for converting information on paper forms to electronic data
US7149347B1 (en) 2000-03-02 2006-12-12 Science Applications International Corporation Machine learning of document templates for data extraction
US6950553B1 (en) * 2000-03-23 2005-09-27 Cardiff Software, Inc. Method and system for searching form features for form identification
US20020050982A1 (en) * 2000-04-05 2002-05-02 Petter Ericson Data form having a position-coding pattern detectable by an optical sensor
US20060082557A1 (en) * 2000-04-05 2006-04-20 Anoto Ip Lic Hb Combined detection of position-coding pattern and bar codes
US20020037097A1 (en) * 2000-05-15 2002-03-28 Hector Hoyos Coupon recognition system
WO2001088661A2 (en) * 2000-05-16 2001-11-22 U.S. Army Medical Research And Material Command System and method for providing access to forms and maintaining the data used to complete the forms
US7305355B2 (en) 2000-06-12 2007-12-04 American Express Travel Related Services Company, Inc. Universal shopping cart and order injection system
US20080162298A1 (en) * 2000-06-15 2008-07-03 American Express Travel Related Services Company, Inc. Online ordering system and method
US20080306835A1 (en) * 2000-06-15 2008-12-11 American Express Travel Related Services Company, Inc. System and method for customizing an email message
US7376635B1 (en) 2000-07-21 2008-05-20 Ford Global Technologies, Llc Theme-based system and method for classifying documents
JP2002163594A (ja) * 2000-11-27 2002-06-07 Hitachi Ltd 帳票処理システム、帳票識別辞書管理センタ装置、帳票処理端末及び帳票識別辞書配信方法
US7039256B2 (en) * 2001-07-12 2006-05-02 International Business Machines Corporation Efficient verification of recognition results
US7499602B2 (en) * 2001-07-12 2009-03-03 International Business Machines Corporation Efficiency and speed in verification of recognition results
GB2395041A (en) * 2001-08-14 2004-05-12 Bloomberg Lp Distribution and mapping of financial records from data stream
GB2380009A (en) * 2001-09-21 2003-03-26 Hewlett Packard Co Apparatus and automated method of contract drafting
US7212301B2 (en) * 2001-10-31 2007-05-01 Call-Tell Llc System and method for centralized, automatic extraction of data from remotely transmitted forms
US7426486B2 (en) * 2001-10-31 2008-09-16 Call-Tell Llc Multi-party reporting system and method
US7561734B1 (en) 2002-03-02 2009-07-14 Science Applications International Corporation Machine learning of document templates for data extraction
US7171615B2 (en) * 2002-03-26 2007-01-30 Aatrix Software, Inc. Method and apparatus for creating and filing forms
US20070198910A1 (en) * 2002-03-26 2007-08-23 Aatrix Software, Inc. Method and apparatus for creating and filing forms
US7142728B2 (en) * 2002-05-17 2006-11-28 Science Applications International Corporation Method and system for extracting information from a document
US7133563B2 (en) * 2002-10-31 2006-11-07 Microsoft Corporation Passive embedded interaction code
US7116840B2 (en) 2002-10-31 2006-10-03 Microsoft Corporation Decoding and error correction in 2-D arrays
US7305612B2 (en) * 2003-03-31 2007-12-04 Siemens Corporate Research, Inc. Systems and methods for automatic form segmentation for raster-based passive electronic documents
US8126742B2 (en) 2003-05-09 2012-02-28 Accenture Global Services Limited Automated assignment of insurable events
JP4269059B2 (ja) * 2003-05-30 2009-05-27 株式会社Pfu 帳票処理プログラム、方法及び装置
US7583842B2 (en) * 2004-01-06 2009-09-01 Microsoft Corporation Enhanced approach of m-array decoding and error correction
US7263224B2 (en) * 2004-01-16 2007-08-28 Microsoft Corporation Strokes localization by m-array decoding and fast image matching
JP2006065547A (ja) * 2004-08-26 2006-03-09 Kyocera Corp 携帯端末、コンピュータの制御方法及びプログラム
US7933048B2 (en) * 2005-01-31 2011-04-26 Canon Kabushiki Kaisha Image reading apparatus, server apparatus, and image processing system
US7607076B2 (en) * 2005-02-18 2009-10-20 Microsoft Corporation Embedded interaction code document
US7826074B1 (en) 2005-02-25 2010-11-02 Microsoft Corporation Fast embedded interaction code printing with custom postscript commands
US20060215913A1 (en) * 2005-03-24 2006-09-28 Microsoft Corporation Maze pattern analysis with image matching
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US8885229B1 (en) 2013-05-03 2014-11-11 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
US7599560B2 (en) 2005-04-22 2009-10-06 Microsoft Corporation Embedded interaction code recognition
US7421439B2 (en) 2005-04-22 2008-09-02 Microsoft Corporation Global metadata embedding and decoding
US20060242562A1 (en) * 2005-04-22 2006-10-26 Microsoft Corporation Embedded method for embedded interaction code array
US7400777B2 (en) * 2005-05-25 2008-07-15 Microsoft Corporation Preprocessing for information pattern analysis
US7729539B2 (en) * 2005-05-31 2010-06-01 Microsoft Corporation Fast error-correcting of embedded interaction codes
US7580576B2 (en) * 2005-06-02 2009-08-25 Microsoft Corporation Stroke localization and binding to electronic document
US7619607B2 (en) 2005-06-30 2009-11-17 Microsoft Corporation Embedding a pattern design onto a liquid crystal display
US7622182B2 (en) * 2005-08-17 2009-11-24 Microsoft Corporation Embedded interaction code enabled display
US7817816B2 (en) * 2005-08-17 2010-10-19 Microsoft Corporation Embedded interaction code enabled surface type identification
JP4719543B2 (ja) * 2005-09-26 2011-07-06 株式会社リコー ワークフローシステム、サーバ装置、ワークフローシステムの処理方法及びワークフロープログラム
US7630519B2 (en) * 2005-09-29 2009-12-08 Xerox Corporation Systems and methods for printing on pre-printed forms
US7933786B2 (en) * 2005-11-01 2011-04-26 Accenture Global Services Limited Collaborative intelligent task processor for insurance claims
US20070168382A1 (en) * 2006-01-03 2007-07-19 Michael Tillberg Document analysis system for integration of paper records into a searchable electronic database
US9740692B2 (en) 2006-08-01 2017-08-22 Abbyy Development Llc Creating flexible structure descriptions of documents with repetitive non-regular structures
JP5303865B2 (ja) * 2007-05-23 2013-10-02 株式会社リコー 情報処理装置、及び、情報処理方法
US8108764B2 (en) * 2007-10-03 2012-01-31 Esker, Inc. Document recognition using static and variable strings to create a document signature
US8094976B2 (en) * 2007-10-03 2012-01-10 Esker, Inc. One-screen reconciliation of business document image data, optical character recognition extracted data, and enterprise resource planning data
US20090217146A1 (en) * 2008-02-22 2009-08-27 Eugene Goldfarb Page navigation generation system for a customizable application
US8478769B2 (en) * 2008-02-22 2013-07-02 Accenture Global Services Limited Conversational question generation system adapted for an insurance claim processing system
US8515786B2 (en) * 2008-02-22 2013-08-20 Accenture Global Services Gmbh Rule generation system adapted for an insurance claim processing system
JP2010039542A (ja) * 2008-07-31 2010-02-18 Ricoh Co Ltd 業務情報管理システム
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US9704111B1 (en) 2011-09-27 2017-07-11 3Play Media, Inc. Electronic transcription job market
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
US8918311B1 (en) * 2012-03-21 2014-12-23 3Play Media, Inc. Intelligent caption systems and methods
US9536141B2 (en) * 2012-06-29 2017-01-03 Palo Alto Research Center Incorporated System and method for forms recognition by synthesizing corrected localization of data fields
GB2510626A (en) 2013-02-11 2014-08-13 Face Recording And Measurement Systems Ltd Organising data entry forms
US9298685B2 (en) * 2013-02-28 2016-03-29 Ricoh Company, Ltd. Automatic creation of multiple rows in a table
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9311531B2 (en) 2013-03-13 2016-04-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9384180B2 (en) * 2013-04-10 2016-07-05 Xerox Corporation Methods and systems for processing filled forms
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
US9456170B1 (en) 2013-10-08 2016-09-27 3Play Media, Inc. Automated caption positioning systems and methods
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US10114800B1 (en) 2013-12-05 2018-10-30 Intuit Inc. Layout reconstruction using spatial and grammatical constraints
KR101918081B1 (ko) * 2014-04-17 2018-11-13 에이치피프린팅코리아 유한회사 화상형성장치 및 화상형성방법
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US9965679B2 (en) * 2014-11-05 2018-05-08 Accenture Global Services Limited Capturing specific information based on field information associated with a document class
CN105631393A (zh) * 2014-11-06 2016-06-01 阿里巴巴集团控股有限公司 信息识别方法及装置
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US11861302B2 (en) 2019-02-04 2024-01-02 Aatrix Software, Inc. AUF XML specification compiler
US11537786B2 (en) * 2020-11-16 2022-12-27 Dropbox, Inc. Generating fillable documents and fillable templates in a collaborative environment
US11735186B2 (en) 2021-09-07 2023-08-22 3Play Media, Inc. Hybrid live captioning systems and methods
US11829701B1 (en) * 2022-06-30 2023-11-28 Accenture Global Solutions Limited Heuristics-based processing of electronic document contents

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3726993A (en) * 1971-12-10 1973-04-10 Xerox Corp Data compression methods and apparatus
US4318184A (en) * 1978-09-05 1982-03-02 Millett Ronald P Information storage and retrieval system and method
JPS5771072A (en) * 1980-10-20 1982-05-01 Sharp Corp Electronic computer
US4481603A (en) * 1981-05-18 1984-11-06 International Business Machines Corporation File processing method using expanding display windows for selected records and text fields
JPS58130673A (ja) * 1982-01-29 1983-08-04 Fuji Xerox Co Ltd 画像処理装置
JPH07107694B2 (ja) * 1984-08-31 1995-11-15 株式会社日立製作所 文書処理装置
US4646250A (en) * 1984-10-18 1987-02-24 International Business Machines Corp. Data entry screen
JPH0785254B2 (ja) * 1985-09-27 1995-09-13 株式会社東芝 文字画像読取装置
US4750135A (en) * 1986-05-01 1988-06-07 Reuters Limited Method for dynamically creating a receiver definable local trading instrument displayable record from a remotely transmitted trading instrument common data stream
JPS63618A (ja) * 1986-06-20 1988-01-05 Brother Ind Ltd ワ−ドプロセツサ
US4813077A (en) * 1986-07-30 1989-03-14 Scan-Optics, Inc. Sales transaction record processing system and method
JPS63155386A (ja) * 1986-12-19 1988-06-28 Ricoh Co Ltd 帳票デ−タ読取装置
US5179650A (en) * 1988-01-21 1993-01-12 Kabushiki Kaisha Toshiba Method and apparatus for editing documents
US4951196A (en) * 1988-05-04 1990-08-21 Supply Tech, Inc. Method and apparatus for electronic data interchange
US4949392A (en) * 1988-05-20 1990-08-14 Eastman Kodak Company Document recognition and automatic indexing for optical character recognition
US5054096A (en) * 1988-10-24 1991-10-01 Empire Blue Cross/Blue Shield Method and apparatus for converting documents into electronic data for transaction processing
JP2796628B2 (ja) * 1988-11-29 1998-09-10 カシオ計算機株式会社 印字装置
US5001769A (en) * 1988-12-20 1991-03-19 Educational Testing Service Image processing system
JPH02201588A (ja) * 1989-01-31 1990-08-09 Toshiba Corp 文字読取装置
US5140650A (en) * 1989-02-02 1992-08-18 International Business Machines Corporation Computer-implemented method for automatic extraction of data from printed forms
US5159667A (en) * 1989-05-31 1992-10-27 Borrey Roland G Document identification by characteristics matching
US5010580A (en) * 1989-08-25 1991-04-23 Hewlett-Packard Company Method and apparatus for extracting information from forms
EP0419259B1 (en) * 1989-09-20 1996-04-24 Nec Corporation Accurate recognition of input patterns
CA1321026C (en) * 1989-09-28 1993-08-03 Arny I. Sokoloff Method and apparatus for optically reading pre-printed survey pages
JP2713622B2 (ja) * 1989-11-20 1998-02-16 富士通株式会社 表形式文書読取装置
US5038392A (en) * 1990-02-12 1991-08-06 International Business Machines Corporation Method and apparatus for adaptive image processing by recognizing a characterizing indicium in a captured image of a document
US5119433A (en) * 1990-03-12 1992-06-02 International Business Machines Corporation Method and system for locating the amount field on a document
US5134669A (en) * 1990-06-13 1992-07-28 National Computer Systems Image processing system for documentary data
JP2855797B2 (ja) * 1990-06-15 1999-02-10 富士ゼロックス株式会社 文書処理装置
JP2745794B2 (ja) * 1990-08-24 1998-04-28 富士ゼロックス株式会社 文書処理装置
US5333313A (en) * 1990-10-22 1994-07-26 Franklin Electronic Publishers, Incorporated Method and apparatus for compressing a dictionary database by partitioning a master dictionary database into a plurality of functional parts and applying an optimum compression technique to each part
JPH04157563A (ja) * 1990-10-22 1992-05-29 Hitachi Ltd 帳票作成方法
JPH05303531A (ja) * 1991-01-31 1993-11-16 Fields Software Group Inc 電子書式処理システム及び方法
JPH04284768A (ja) * 1991-03-13 1992-10-09 Ricoh Co Ltd ミクストモード文書作成装置
FR2679353B1 (fr) * 1991-07-17 1997-01-03 Bull Sa Procede de mise en page de documents structures.
US5293429A (en) * 1991-08-06 1994-03-08 Ricoh Company, Ltd. System and method for automatically classifying heterogeneous business forms
US5416896A (en) * 1992-04-30 1995-05-16 Ricoh Company, Ltd. Command definition dictionary handling and context declaration in a document publishing page description language (PDL)
US5317646A (en) * 1992-03-24 1994-05-31 Xerox Corporation Automated method for creating templates in a forms recognition and processing system
US5438657A (en) * 1992-04-24 1995-08-01 Casio Computer Co., Ltd. Document processing apparatus for extracting a format from one document and using the extracted format to automatically edit another document

Also Published As

Publication number Publication date
EP0654746B1 (en) 2003-02-12
EP0654746A3 (en) 1995-12-13
US5721940A (en) 1998-02-24
DE69432114D1 (de) 2003-03-20
DE69432114T2 (de) 2003-10-30
JP3703157B2 (ja) 2005-10-05
EP0654746A2 (en) 1995-05-24

Similar Documents

Publication Publication Date Title
JPH07200731A (ja) フォーム識別処理システム及び方法
US6397213B1 (en) Search and retrieval using document decomposition
JP4118349B2 (ja) 文書選択等の方法及び文書サーバ
EP0202671B1 (en) Method of storing and retrieving image data
US5926565A (en) Computer method for processing records with images and multiple fonts
JP3095709B2 (ja) ユーザインターフェイスフォームの生成方法
JP3289968B2 (ja) 電子的文書処理のための装置および方法
US5465353A (en) Image matching and retrieval by multi-access redundant hashing
US8520889B2 (en) Automated generation of form definitions from hard-copy forms
US5809167A (en) Page segmentation and character recognition system
US5867277A (en) Reduced resolution document storage and retrieval system
US20010042083A1 (en) User-defined search template for extracting information from documents
US7035463B1 (en) Document image processor, method for extracting document title, and method for imparting document tag information
US20060085442A1 (en) Document image information management apparatus and document image information management program
US20040220962A1 (en) Image processing apparatus, method, storage medium and program
US6061478A (en) Content-based filing and retrieval system for name cards and hankos
JPH10162150A (ja) ページ解析システム
US20100198827A1 (en) Method for finding text reading order in a document
US20040243602A1 (en) Document processing apparatus
JP2000182064A (ja) ドキュメント処理システム及びインデックス情報獲得方法
Kim et al. Automated labeling in document images
Cullen et al. Document image database retrieval and browsing using texture analysis
JPH0314184A (ja) 文書画像再配置ファイリング装置
JP2002342343A (ja) 文書管理システム
WO2001013279A2 (en) Word searchable database from high volume scanning of newspaper data

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050719

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080729

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090729

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090729

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100729

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100729

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110729

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120729

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120729

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130729

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees