JP2968145B2 - 高度なデータ収集方法及びデータ処理システム - Google Patents

高度なデータ収集方法及びデータ処理システム

Info

Publication number
JP2968145B2
JP2968145B2 JP5060368A JP6036893A JP2968145B2 JP 2968145 B2 JP2968145 B2 JP 2968145B2 JP 5060368 A JP5060368 A JP 5060368A JP 6036893 A JP6036893 A JP 6036893A JP 2968145 B2 JP2968145 B2 JP 2968145B2
Authority
JP
Japan
Prior art keywords
field
data
name
processor
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5060368A
Other languages
English (en)
Other versions
JPH0696276A (ja
Inventor
ビー. アンダーソン ジェラルド
エイチ. バンフォード ジェイムズ
エス. ベッツ ティモスィー
エム. カッラス ヴァレリー
シー. コンカー マイケル
イー. ダレイ マイケル
エム. ホーキンス ジェイムズ
エム. ジャカブ ピーター
ビー. ネクト ルイス
ダブリュー. クラトクヴィル フレドリック
リウ シン−ヤ
エル. ポールソン トーマス
ラジャゴパル ドレイスウェミー
ケイ. ティワリ マノジ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0696276A publication Critical patent/JPH0696276A/ja
Application granted granted Critical
Publication of JP2968145B2 publication Critical patent/JP2968145B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は概してデータ処理システ
ム及び方法に関し、特に文書フォームの走査されたイメ
ージから導出される文字認識情報を収集(捕獲)するた
めの技術に関する。
【0002】
【従来の技術】本特許出願は、係属出願である米国特許
出願第07/787、129号に関連し、ここで参照の
ため本発明に組み込まれる。
【0003】本特許出願は、また係属出願である米国特
許出願第07/787、507号に関連し、ここで参照
のため組み込まれる。
【0004】本特許出願は、また係属出願である米国特
許出願第07/573、942号に関連し、ここで参照
のため組み込まれる。
【0005】本特許出願は、また係属出願である米国特
許出願第07/693、739号に関連し、ここで参照
のため組み込まれる。
【0006】本特許出願は、また係属出願である米国特
許出願第07/305、828号に関連し、ここで参照
のため組み込まれる。
【0007】本特許出願は、また米国特許第4、99
2、650号に関連し、ここで参照のため組み込まれ
る。
【0008】本特許出願は、また米国特許第5、05
8、185号に関連し、ここで参照のため組み込まれ
る。
【0009】本特許出願は、また米国特許第5、09
3、911号に関連し、ここで参照のため組み込まれ
る。
【0010】ビジネス関連データの提出用に使用される
文書フォームは、狭義のビジネスであってもレイアウト
はさまざまである。これによって、文書フォームの自動
読み出しが挑戦的なタスクになる。文書フォームにおい
は、特定の事柄の範疇に関する情報は、フォーム上の
名前の付いたフィールドにそれぞれ分離して記載され
。もしフォーム上に書き込まれたデータ自動的に見
つけられ、かつそれを自動的に読み出すことができれ
ば、そのデータを、ビジネスタスクを実行するために設
計されたコンピュータプログラムに対してのオペランド
として入力することができる。
【0011】関連ビジネスにデータ処理タスクを統合す
ることによって、経済性が得られる。しかしながら、デ
ータが必要とされる事柄の範疇の数は、それぞれのビジ
ネスエリアによって異なる可能性が極めて高い。関連ビ
ジネスがそれぞれのビジネスに関連するデータの提出に
文書フォームを用いる場合、文書フォームは異なる数の
フィールドを有し、異なる順序で順序付けられ、異なる
パターンで配置され、それぞれのビジネスエリアで異な
る範疇の名前で名付けられる可能性が高い。
【0012】この一例として保険業がある。保険会社
は、火災保険、傷害保険及び健康保険を提供する。これ
らの関連ビジネスは、経済性のためにデータ処理タスク
を統合させる可能性が高い。しかしながら、提出された
データに必要な事柄の範疇の数が同じである可能性が低
いため、保険会社に提出される請求フォームは保険のそ
れぞれのタイプによって異ならなければならない。
【0013】将来は、フォームのレイアウト、フィール
ドの順序、フィールドの数、又はフィールドの名前を変
更することによって、特定のビジネスへの現在の文書フ
ォームが改正されるであろう。
【0014】フォーム上のフィールドの順序、配置、名
前及び数が変更されたとしても、自動的に処理されるこ
とが可能な、新たな文書フォームを自由に生成するため
の手段が必要である。
【0015】
【発明が解決しようとする課題】従って、本発明の目的
は、改良された方法で、自動的に処理され、それによっ
て、新たな文書フォームを自由に生成することを可能に
するための手段を提供することである。
【0016】本発明の他の目的は、フォーム上のフィー
ルドの順序、配置、名前及び数が変更されたとしても、
自動的に処理され、それによって、新たな文書フォーム
を柔軟に生成することを可能にするための手段を提供す
ることである。
【0017】本発明の追加の目的は、書き込まれたフォ
ームの情報を認識又は使用するデータプロセッサの再プ
ログラミングを必要としない、自動的に処理され、それ
によって、新たな文書フォームを自由に生成することを
可能にするための手段を提供することである。
【0018】
【課題を解決するための手段と作用】本発明は高度なデ
ータ収集アーキテクチャである。本発明は、完成したフ
ォーム上でデータを収集及び使用するデータプロセッサ
の再プログラミングを必要とせずに、ユーザが、文書フ
ォームのフォーマットを自由に定義又は再定義すること
を可能にする。
【0019】高度なデータ収集アーキテクチャの本発明
は、データ処理システムにおいて、ホストプロセッサと
少なくとも1つのワークステーションの対話動作を含
む。本発明は、ホストプロセッサ及びワークステーショ
ンの間の対話を含み、ホストプロセッサで実行されるア
プリケーションプログラムに意味のある共通のオペラン
ド名のリストを提供する。本発明は、書き込まれたフォ
ームの文字認識を実行し、その情報を符号化データに変
換するワークステーションを含む。本発明は、各フィー
ルドのフィールドデータセグメントをアセンブルし、共
通のオペランド、符号化データ及びフィールドの一般名
を含有するワークステーションを含む。
【0020】また、本発明はワークステーションからア
センブルされたフィールドデータセグメントを受信し、
フォームから読み出された情報を処理するアプリケーシ
ョンプログラムに符号化データを提供するホストプロセ
ッサの動作を含む。
【0021】本発明は、IBM社のフォルダー適用業務
プログラム(FAF)等の操作環境アプリケーションプ
ログラムを実行するホストプロセッサを含むデータ処理
システムに適用される。操作環境プログラムは、多重タ
スキングモード又は多重処理モードで同時に実行される
他のアプリケーションプログラムにサービスを提供す
る。FAF操作環境プログラムによって実行されるサー
ビスは、ディジタル化された文書イメージ及び関連す
る符号化データ(集合的に、オブジェクトと称される)
のためのフォルダーグループシステムを管理することが
含まれ、これは、オブジェクトを特定のフォルダーグル
ープに関連付ける、共通の索引値をオブジェクトに割り
当てることによって行われる。オブジェクトルーティン
グサービスは、FAF操作環境プログラムによっても提
供され、データ処理システムにおけるさまざまな目的地
にオブジェクトを伝送することができる。
【0022】ユーザのビジネスには、ビジネスを行うた
めに必要な情報が書き込まれている文書フォームの受信
を含んでいる。ユーザは、FAF操作環境プログラムと
同時にホストコンピュータで実行されるアプリケーショ
ンプログラムを有する。アプリケーションプログラム
は、フォームの情報を受信し、ビジネスの必要性に従っ
てその情報を処理する。アプリケーションプログラムは
FAF操作環境プログラムと対話して、文書フォームの
さまざまなフィールドで表示される符号化データとして
情報を受信する。
【0023】本発明に従って、FAF操作環境プログラ
ム及びアプリケーションプログラムは、高度なデータ収
集プログラムから必要とする符号化データを受信する。
高度なデータ収集プログラムは、第1レベルマッピング
テーブルを利用して、符号化データをFAF操作環境プ
ログラムに渡す。また、高度なデータ収集プログラムは
第2レベルマッピングテーブルを利用して、符号化デー
タをアプリケーションプログラムに渡す。
【0024】第1レベルマッピングテーブル及び第2レ
ベルマッピングテーブルには、フィールド関連リスト
含まれ、フィールド関連リストは、FAF操作環境プロ
グラム及びアプリケーションプログラムの双方のプログ
ラム変数に対するオペランド名のセットを提供する。
オペランド名は、フィールド関連名と称される。本発
明に従って、フィールド関連リストは、ユーザが文書フ
ォームの生成を望むデータ処理ネットワークのワークス
テーションに伝送される。
【0025】本発明に従って、ワークステーションにお
いて、ユーザがホストプロセッサでアプリケーションプ
ログラムに情報を提供するのを目的とする文書フォーム
を生成するとき、ユーザはそれぞれのフィールドデータ
セグメントのフォーム上の各フィールドの特徴を特定す
る。ユーザが生成する各フィールドにおいて、フィール
ド関連リストに提供されるフィールド関連名の内の1つ
を選択し、フィールドデータセグメントに入力しなけれ
ばならない。次に、ユーザはフィールドデータセグメン
トに便利なフィールド名を追加するが、これはワークス
テーションにおいて手動データ修復又はデータ入力を行
う人にとって意味がある。
【0026】生成されるそれぞれのフィールドに対応す
各データセグメントには、その他の特徴も含められ
。次に、フォームのために生成され全てのフィール
に対応する全てのデータセグメントの集合が、ワーク
ステーションにおいてマスター機械生成データ構造(M
GDS)として記憶される。
【0027】書き込まれたフィールドがネットワークの
ワークステーションで受信されると、スキャンインされ
て、デジタル化されたイメージを形成する。いったんフ
ォームが認識されると、マスターMGDSに関連するフ
ィールド座標はそれぞれのフィールドを配置するために
使用できる。次に、フィールドが文字認識され、結果と
なる符号化データがMGDSのそれぞれのフィールドデ
ータに記憶される。
【0028】MGDSは、その符号化データが目的とさ
れるアプリケーションプログラムへの参照を含む。符号
化データを含むMGDSがホストプロセッサによって受
信されると、高度なデータ収集プログラムは対応する第
1レベルマッピングテーブル及び第2レベルマッピング
テーブルを選択する。
【0029】高度な収集プログラムは、それぞれのフィ
ールドデータセグメントのフィールド関連名を用いて、
第1レベルマッピングテーブルにおいてテーブルルック
アップ操作を実行し、FAF操作環境プログラムにおい
て対応するプログラム変数を識別する。識別されたプロ
グラム変数は、フィールドデータセグメントでの対応す
る符号化データに等しく設定される。次に、FAF操作
環境プログラムは、必要に応じて、符号化データオブジ
ェクトとイメージオブジェクトの内の少なくとも一方の
自動索引を行う。
【0030】次に、高度な収集プログラムはそれぞれの
フィールドデータセグメントのフィールド関連名を用い
て、第2レベルマッピングテーブルにおいてテーブルル
ックアップ操作を実行し、アプリケーションプログラム
において対応するプログラム変数を識別する。識別され
たプログラム変数は、フィールドデータセグメントにお
いて対応する符号化データに等しく設定される。次に、
アプリケーションプログラムは、索引サービス及びオブ
ジェクト処理サービスのためにFAF操作環境プログラ
ムに呼び出しを行い、文書フォーム上に書き込まれた情
報を用いて所望のビジネス動作を行う。
【0031】結果となる高度なデータ収集アーキテクチ
ャの本発明は、フォーム上のフィールドの順序、配置、
名前及び数が変更されたとしても、自動的に処理するこ
とが可能な新たな文書フォームを自由に生成するための
手段を提供する。
【0032】
【実施例】本発明は高度なデータ収集アーキテクチャで
あり、図1及び図2の全体のアーキテクチャ図に示され
ている。図1は全体のアーキテクチャ図の左側の部分で
あり、図2は全体のアーキテクチャ図の右側の部分であ
る。米国特許出願第07/787、129号及び米国特
許出願第07/787、507号は図1及び図2に示さ
れる基本データ処理アーキテクチャを示し、アーキテク
チャは文書フォームの走査されたイメージにおいて文字
認識エラーの連続修正を行う。
【0033】高度なデータ収集アーキテクチャの本発明
は、ユーザに、完成したフォーム上のデータを収集及び
使用するデータプロセッサがいかなる再プログラミング
をも必要としない文書フォームのフォーマットを自由に
定義及び再定義させることを可能にする。高度なデータ
収集アーキテクチャの本発明は、図2に示されるホスト
プロセッサ34の対話操作と図1のデータ処理システム
に示される1以上のワークステーション25を含む。本
発明はホストプロセッサ34と知能フォームプロセッサ
25との間の対話を含み、ホストコンピュータ34で実
行するアプリケーションプログラム554又は556に
意味のある共通のオペランド名のフィールド関連リスト
82を備える。ホストコンピュータ34のより詳細なア
ーキテクチャ図は、図29に示されている。
【0034】本発明は、また新たな文書フォームを生成
する知能フォームプロセッサ25の動作を含む。知能フ
ォームプロセッサ25はフォーム定義プロセッサ86を
含み、図22のフロー図で示されるフォーム定義処理8
6Aを実行する。フォーム定義プロセッサ86は図14
の文書フォーム10F等の新たな文書フォームを生成
し、図16に示されるマスター機械生成データ構造(M
GDS)50Mによって定義される。フォーム定義プロ
セッサ86は、ホストコンピュータ34から受信したフ
ィールド関連リスト82を用いてこの動作を完了する。
【0035】本発明は更に、書き込まれた文書フォーム
の文字認識を行う知能フォームプロセッサ25を含む。
米国特許出願第07/787、129号及び米国特許出
願第07/787、507号に示されるように、スキャ
ナー22は、文書10のイメージ10’をスキャンイン
し、スキャナープロセッサ23によって前処理され、文
書イメージ10’を生じる。次に、文書イメージ10’
は図1のプロセッサ24においてフォームの認識及びフ
ィールドの抽出がなされ、その後抽出されたフィールド
イメージ10”が図1の文字認識プロセッサ26によっ
て文字認識処理される。文字認識処理の実行に際して、
結果となる符号化データは、図1に示される人工知能エ
ラー修正プロセッサ28によって分析されるエラーを含
んでもよい。フォーム認識及びフィールド抽出の順序
で、図3に示されるようにMGDS50Aが生じる。次
に、MGDS50Aは、抽出されたフィールドイメージ
10”と共に、文字認識プロセッサ26に転送される。
文字認識プロセッサ26は図4に示されるように、バッ
ファBの認識符号化データ42を含むMGDS50Bを
出力する。図21に見られるように、フィールドイメー
ジ16’はフィールド抽出され、抽出されたフィールド
イメージ16”が生じる。抽出されたフィールドイメー
ジ16”は文字認識され、符号化されたデータ42が生
じる。符号化されたデータ42は、拒否された文字位置
31及び疑わしい文字位置21を含む。
【0036】次に、MGDS50Bにおける認識符号化
データ42は文字認識プロセッサ26から人工知能エラ
ープロセッサ28に転送される。米国特許出願第07/
787、129号及び米国特許出願第07/787、5
07号に示されるように、次に、プロセッサ28は認識
符号化データ42のエラー修正ステップを実行し、修正
された符号化データ46がプロセッサ28からの出力で
あるMGDS50CのバッファBに挿入される。
【0037】追加のエラー修正ステップが符号化データ
46で実行することができ、例えば、MGDS50Cは
図2に示されるデータベースエラー修正プロセッサ30
に転送可能である。プロセッサ30は符号化データ46
でデータベースエラー修正処理を実行し、追加の修正さ
れた符号化データ48がMGDS50DのバッファBに
挿入される。
【0038】米国特許出願第07/787、129号及
び米国特許出願第07/787、507号に更に示され
るように、追加のエラー修正ステップがMGDS50D
のバッファBの符号化データに適用できる。例えば、M
GDS50Dは手動検査及び修正プロセッサ32に転送
され、ここでバッファBの符号化データが文書イメージ
10’と共にオペレータに表示される。次に、オペレー
タは文書イメージ10’を目で検査することにより符号
化データを検査又は修正できる。結果となる修正された
データ49は、MGDS50EのバッファBに挿入され
る。
【0039】MGDS50A、50B、50C、50D
及び50Eの順序は、それぞれ、図3、図4、図5、図
6及び図7に示されている。これらの動作の詳細な説明
は、米国特許出願第07/787、129号及び米国特
許出願第07/787、507号に示されている。結果
となるMGDS50Eは、図12により詳細に示されて
いる。図18のフォーム10’で走査された1例で示さ
れるような6個のフィールドのフィールド抽出、文字認
識及び符号化データ修正の順序で、MGDS50Eの図
12に示される6個のフィールドデータセグメントが形
成される。
【0040】本発明は、各フィールドにおいてMGDS
50Eにフィールドデータセグメントをアセンブルする
知能フォームプロセッサ25を含み、例えば、符号化デ
ータ49の共通のオペランドフィールド関連(FIELD ASS
OCIATION) 名82B、及び例示フィールドデータセグメ
ント54の「名(FIRST NAME)」等の一般名68Bを含
む。フィールドデータセグメント54は、図18の文書
イメージのフィールド16’から抽出される符号化デー
タを表す。
【0041】本発明は更に図29に示されるホストプロ
セッサ34の動作を含み、知能フォームプロセッサ25
からMGDS50Eのアセンブルされたフィールドデー
タセグメントを受け取る。ホストプロセッサ34は、図
23に示される高度な収集処理85Aによって、符号化
データをアプリケーションプログラム554及び556
に提供する。次に、アプリケーションプログラム554
及び556が、フォーム10から読み出された情報を処
理する。
【0042】本発明は図29に示されるホストプロセッ
サ34を含むデータ処理システムに適用され、IBM社
のフォルダー適用業務プログラム(FAF)等の操作環
境アプリケーションプログラム554を実行する。操作
環境プログラム554は、多重タスキングモード又は多
重処理モードで同時に実行している他のアプリケーショ
ンプログラムにサービスを提供する。FAF操作プログ
ラム554によって実行されるサービスは、特定のフォ
ルダーグループに関連する共通の索引値をオブジェクト
に割り当てることによって、デジタル化された文書イメ
ージ及び関連する符号化データ(集合的にオブジェクト
と称される)へのフォルダーグループのシステムの管理
を含んでいる。FAFプログラム554の幾つかの例示
ルーチンを示す表1が参照される。ステップ800乃至
806から成る第1ルーチン(A)は、自動索引操作を
実行し、索引値をシステムによって受信される新たなオ
ブジェクトに割り当てる。ステップ800は第1索引値
を得て、ステップ802は第2索引値を得る。2つの値
は、知能フォーム25から受信されたMGDS50Eの
符号化データから得られる。次に、ステップ804にお
いて、プログラム554は文書に索引レコードを形成す
る。文書に形成される索引レコードは、同一のフォルダ
ーグループの他の文書に文書を関係させることができ
る。
【0043】FAF操作プログラム554によって実行
される他のサービスは、関連する文書にアクセスするこ
とである。これは、表1のステップ810及び812か
ら成るルーチン(B)によって実行される。ステップ8
10は、所定の文書索引値に対する関連する索引レコー
ドのリストにアクセスする。次に、ステップ812は主
プログラムに戻る。ルーチンは、同一のフォルダーグル
ープにおける所定の文書と関連する文書の識別を可能に
する。
【0044】オブジェクトルーチンサービスはまた、F
AF操作環境プログラム554によって提供され、オブ
ジェクトをデータ処理システムのさまざまな目的地に伝
送することを可能にする。これは、表1に示されるルー
チン(C)によって実行される。ルーチン(C)はステ
ップ820乃至824から成る。ステップ820は、M
GDS50Eにおける符号化データから提供される第1
ルーチン値を得る。次に、ステップ822が、第1ルー
チン値に従って、文書をワークステーションに送る。次
に、ステップ824が主プログラムに戻る。ルーチンC
は、データ処理システムにおけるいかなる目的地へも、
イメージオブジェクト又は符号化データオブジェクトを
伝送するのを可能にする。
【0045】フォルダー適用業務プログラムの動作の原
理は、上述の米国特許第5、058、185号及び第
5、093、911号、並びに米国特許出願第07/5
73、942号に示されている。
【0046】ユーザのビジネスは図1のフォーム10等
の文書フォームの受信を含み、図18の書き込まれたフ
ォームに示されるように書き込まれる。フォームは、ビ
ジネスを行うのに必要な情報で書き込まれる。ユーザ
は、FAF操作プログラム554と同時に、ホストコン
ピュータ34で実行するアプリケーションプログラム5
56を有する。アプリケーションプログラム556は、
保険請求処理アプリケーションプログラムとして表2に
示される。プログラムはステップ850乃至878から
成る。
【0047】アプリケーションプログラム556はMG
DS50Eによって提供されるようにフォームで情報を
受信し、その情報をビジネスの必要性に従って処理す
る。アプリケーションプログラム556はFAF操作プ
ログラム554と対話し、図18に示されるように文書
フォーム10’にさまざまなフィールドを表す符号化デ
ータとして情報を受信する。
【0048】表2の保険請求処理アプリケーションプロ
グラム556は2つのルーチンを有し、第1ルーチンは
ZED社の従業員からの保険請求フォームを処理するた
めのステップ850乃至868である。プログラム55
6の第2ルーチンはステップ870乃至878から成
り、保険外交員の顧客からの保険請求フォームを処理す
る。
【0049】表2のアプリケーションプログラム556
の第1ルーチンはステップ850で開始し、MGDS5
0Eから外交員/雇用者ID(識別名)を得る。次にス
テップ852において、外交員/雇用者IDの第1字
が”X”ならば、IDはZED社の従業員からの請求フ
ォームであると決定される。次に、ステップ854にお
いて、被保険者の姓(ラストネーム)と、ステップ85
6において、被保険者の名(ファーストネーム)を得
る。このデータはMGDS50Eから得る。ステップ8
58において、アプリケーションプログラム556はル
ーチン(B)においてFAF操作環境プログラム554
を呼び出し、従業員レコードにアクセスする。次に、ス
テップ860において、署名ビットマップを得て、MG
DS50Eによってまた提供されるビットマップを得
る。次に、ステップ862において、署名検査ルーチン
を呼び出し、MGDS50Eから得られたビットマップ
に署名検査動作を実行する。次に、ステップ864にお
いて、アプリケーションプログラム556は請求金額を
得るが、これはMGDS50Eによって提供されるデー
タである。次に、ステップ866において小切手が印刷
され、ステップ868において、プログラムは主プログ
ラムに戻る。
【0050】表2のアプリケーションプログラム556
の第2ルーチンにおいて、ステップ870はMGDS5
0Eからのデータである外交員/雇用者IDを得る。次
に、ステップ872において、外交員/雇用者IDデー
タの第1字が”W”ならば、IDは代理人の顧客から得
られる保険請求フォームであると決定される。次に、ス
テップ874において、アプリケーションプログラム5
56はFAF操作環境プログラム554のルーチン
(B)を呼び出して、外交員レコードにアクセスする。
次に、ステップ876において、アプリケーションプロ
グラム556はFAFルーチン(C)を呼び出し、デー
タ処理ネットワークのワークステーションにおいて、オ
ブジェクトとしての文書イメージとその符号化データを
外交員に送る。次に、ステップ878において、プログ
ラム556は主プログラムに戻る。
【0051】FAF操作環境プログラム554が、本発
明を実行するのに適切な唯一のタイプの操作環境プログ
ラムでないことが分かる。他のタイプの操作環境プログ
ラムは、例えば、IBMのOS/2オペレーティングシ
ステムにおけるプレゼンテーションマネージャー環境プ
ログラム、又はIBMのPS/2データプロセッサで実
行されるDOSオペレーティングシステムのウインドウ
環境プログラムである。
【0052】本発明に従って、FAF操作環境プログラ
ム554及びアプリケーションプログラム556は高度
なデータ収集プログラム85から必要な符号化データを
受信する。高度なデータ収集プログラム85は、図23
のフロー図に示される処理85Aを実行する。高度なデ
ータ収集プログラム85は、図29に示される第1レベ
ルマッピングテーブル550を利用し、符号化データを
FAF操作環境プログラム554に渡す。更に、高度な
データ収集プログラム85は、図29に示される第2レ
ベルマッピングテーブル552を利用し、符号化データ
をアプリケーションプログラム556に渡す。
【0053】図29の第1レベルマッピングテーブル5
50と第2レベルマッピングテーブル552はフィール
ド関連リスト82を組み込んで、FAF操作環境プログ
ラム554とアプリケーションプログラム556双方の
プログラム変数に共通のセットのオペランド名を提供す
る。図29に見られるように、本例では、フィールド関
連リスト82は、フィールド関連名data-1、data-2...
data-8、image-1 から成る。図29に示される対応する
プログラム変数リスト83は、それぞれ、対応するプロ
グラム変数"insured last name" 、"insured first nam
e"..."otherinsurance" 及び"signature bit map"
を有する。図29に示される第2レベルマッピングテー
ブル552の検査によって、フィールド関連リスト82
とプログラム変数リスト83の間の関係が示される。本
例では、全フィールド関連リスト82が第2レベルマッ
ピングテーブル552に含まれる。しかしながら、アプ
リケーションプログラム556及び操作環境プログラム
554の全てのプログラム変数が、必ずしも第2レベル
マッピングテーブル552に含まれるプログラム変数リ
スト83で表示される必要はない。プログラム変数の幾
つかは第1レベルマッピングテーブル550に含まれ、
第2レベルマッピングテーブル552には含まれていな
い。
【0054】図29に示されるように、第1レベルマッ
ピングテーブル550の検査によって、フィールド関連
リスト82からのフィールド関連名の内の3個は、マッ
ピングテーブル550の部分的フィールド関連リスト8
2’に含まれる。部分的なリスト82’はフィールド関
連名data-1、data-2及びdata-5を含み、それぞれ、FA
Fプログラム554のプログラム変数名"primary index
value" 、"secondaryindex value" 及び"primary rout
ing value" に対応する。
【0055】オペランド名は、フィールド関連リスト8
2においてフィールド関連名と称される。本発明に従っ
て、フィールド関連リスト82はデータ処理ネットワー
クにおける知能フォームプロセッサ25、特に、ユーザ
が文書フォームの生成を望むフォーム定義プロセッサ8
6に伝送される。
【0056】本発明に従って、知能フォームプロセッサ
25において、ユーザが、ホストプロセッサ34におい
てアプリケーションプログラムに情報を提供することを
目的とする文書フォームを生成するとき、ユーザはそれ
ぞれのフィールドデータセグメントにおけるフォーム上
の各フィールドの特徴を特定する。
【0057】図22を参照すると、フォーム定義プロセ
ッサ86で実行される処理86Aが示される。ステップ
600はフォーム定義プロセス86Aを開始する。ステ
ップ602は、同一のフォームクラスにあり、特定のフ
ィールドタイプの同一のグループから引き出されるフォ
ームの新たなフォルダーを定義する。
【0058】図22のステップ604は、新たなフォル
ダー名、例えば、「保険請求処理(Insurance Claim Pro
cess) 」を入力する。次に、ステップ606は、ホスト
アプリケーションプログラム556の名前、この例で
は"Insurance Claim Processing"を入力する。次にステ
ップ608は、ホストコンピュータ34からフィールド
関連リスト82にアクセスする。
【0059】ステップ610は、新たなフォームを定義
する。ステップ612は、新たなフォームの名前66を
入力することによって、新たなフォームの定義を続け
る。次に、ステップ614はバーコードフォーム認識モ
ードを選択し、もし選択されれば、ユーザはフォームI
D番号を入力する。または、ライン配置フォーム認識モ
ードを選択する。次に、ステップ616がフォームデー
タ、例えば、フォームの汎用コードページ方向等を入力
する。次に、ステップ618において、MGDS50M
のフォーム情報部分FIを、"Insurance Claim Proces
s" であるフォームクラス84及び"Claim" 及び他のデ
ータであるフォーム名66とアセンブルする。
【0060】次に、ステップ620がフィールドの定義
を開始する。フィールド変数は1に設定され、ステップ
622がステップ634に延びるループを開始する。
【0061】ステップ622は、フィールド関連名82
a、例えば、フィールド関連リスト82から"Data-1"を
選択する。次に、ステップ624はフィールド名68a
である"Last Name" を入力する。次に、ステップ626
はフィールド座標64を入力する。次に、ステップ62
8は、フィールドタイプ、マークセンス等の他のフィー
ルドデータを入力する。次に、ステップ630は、MG
DS50Mのフィールド情報部分67を、フィールド名
68a、フィールド関連名82a、フィールド座標64
及び他のデータとアセンブルする。次に、ステップ63
6がユーザに指示メッセージ「このフォームにまだフィ
ールドがあるか?」を表示する。ユーザが「はい」と答
えたならば、ステップ634はフィールド変数を1だけ
増分し、ステップ622に進んで次のフィールドを続け
る。また、ユーザが「いいえ」と答えたならば、処理は
ステップ636にフローして、主プログラムに戻る。
【0062】ユーザが生成する各フィールドにおいて、
ユーザは、フィールド関連リスト82に提供される、図
16のフィールド関連名82bの内の1つを選択しなけ
ればならず、フィールド関連名をフィールドデータセグ
メント、例えば、54M、に入力しなければならない。
次に、ユーザはフィールドデータセグメントに好都合な
フィールド名、例えば、68bを追加し、ワークステー
ションにおいて手動データ修正又はデータ入力を行う人
に意味がある。これは、例えば、手動検査及び修正プロ
セッサ32において重要であり、図27に示される。図
27において、手動検査及び修正プロセッサ32は、M
GDS50Dの符号化データ48のオペレータによって
検査及び修正を行う。フィールド名68bの表示、本例
では、「名(First Name)」に特に注意したい。
【0063】図16に見られるように、追加の特徴が生
成されるそれぞれのフィールドの各データセグメントに
追加される。次に、フォームに生成されたフィールドの
全てに対する全てのデータセグメントの集合体が、図1
6に示される、マスター機械生成データ構造(MGD
S)50Mとして、知能フォームプロセッサワークステ
ーション25に記憶される。
【0064】書き込まれたフォーム10がシステムのワ
ークステーション25で受信されると、スキャンインさ
れ、図18に示されるデジタル化されたイメージ10’
を形成する。図3に示されるように、フォームが認識さ
れると、マスターMGDS50Mに関連するフィールド
座標(FIELD COORD) 64は、図18の、例えば、14’
及び16’にそれぞれのフィールドを配置するために使
用される。次に、フィールドが文字認識され、結果とな
る符号化データがMGDSのそれぞれのフィールドデー
タセグメントに記憶される。図18の走査されたフォー
ムイメージ10’は抽出されたフィールドを有し、図2
0に抽出されたフィールドイメージ10”を形成するこ
とが分かる。結果となるMGDS50Aは図3に示され
ている。次に、文字認識プロセッサ26は抽出されたフ
ィールドイメージに文字認識を行って、図4及び図8に
示されるように、MGDS50Bを生じる。次に、人工
知能エラー修正プロセッサ28は符号化データにエラー
修正動作を行って、図5及び図9にMGDS50Cを生
じる。次に、データベースエラー修正プロセッサ30が
追加のエラー修正動作を実行して、図6及び図10にM
GDS50Dを生じる。次に、手動検査及び修正プロセ
ッサ32がオペレータによって追加の検査動作又は修正
動作を実行して、図7及び図11にMGDS50Eを生
じる。結果となるMGDS50Eは図12に示される。
ここで続く第1例において、第2フィールドへのフィー
ルドデータセグメント54はフィールド名(FIELD NAME)
68b"First Name"、フィールド関連名82b"Data-2"
及び符号化データ(CODED DATA)49"JOHN"を有する。
【0065】MGDS50Eは図12に示され、その符
号化データが目的とされるアプリケーションプログラム
556に対する参照番号84を含む。符号化データ、例
えば、符号化データ49"JOHN"を含むMGDS50E
が、ホストプロセッサによって受信されたとき、高度な
データ収集プログラム85が対応する第1レベルマッピ
ングテーブル550及び第2レベルマッピングテーブル
552を選択する。これは、図23に示される高度な収
集プロセス85Aの動作ステップの順序を示すフロー図
に見ることができる。
【0066】高度な収集プロセス85Aは図23のステ
ップ650で開始し、ステップ652にフローし、ここ
でMGDS50Eが受信される。次に、ステップ654
はMGDS50Eからクラス名84を得て、フィールド
関連リスト82及びホストプロセッサ34におけるアプ
リケーションプログラム556を識別する。次に、ステ
ップ656がMGDS50Eよりフィールドの数を得
る。
【0067】ステップ658はMGDSフィールドデー
タセグメントからデータを得る動作を開始する。フィー
ルド変数は1に設定され、ループはステップ660で開
始し、図23のステップ678まで続く。
【0068】ステップ660は、MGDS50Eのフィ
ールドデータセグメント、例えば、52からフィールド
関連名、例えば、"Data-1" 82a及び対応する符号化
データ"Doe" を得る。これは、図12のMGDS50E
の図解で見ることができる。
【0069】次に、ステップ662は、第1レベルマッ
ピングテーブル550がフィールド関連名、この場
合、"Data-1" 82aを含むかどうかを決定する。もし
含むならば、図23のフローがステップ664に進む。
また、もし含まないならば、プログラムはステップ67
0に進む。ステップ664において、第1レベルマッピ
ングテーブル550に対して、ステップ666は、フィ
ールド関連名、この場合、"Data-1" 82aに対応す
る、第1レベルマッピングテーブル550のプログラム
変数リスト83’のプログラム変数、この場合、"Prima
ry Index Value" を探索するルックアップ動作を行う。
【0070】次に、ステップ668はプログラム変数、
この場合、"Primary Index Value"を符号化データ、こ
の場合、"Doe" に等しく設定する。
【0071】次に、図23のプロセスはステップ670
にフローし、第2レベルマッピングテーブル552がフ
ィールド関連名、この場合、"Data-1"82aを含むかを
決定する。もし含むならば、プロセスはステップ672
にフローする。もし含まなければ、プロセスはステップ
678にフローする。
【0072】ステップ672において、第2レベルマッ
ピングテーブル552に対して、ステップ674は、フ
ィールド関連名、この場合、"Data-1" 82aに対応す
る、第2レベルマッピングテーブル552のプログラム
変数リスト83のプログラム変数、この場合、"Insured
Last Name" を探索するルックアップ動作を行う。
【0073】次に、ステップ676はプログラム変数、
この場合、"Insured Last Name" を符号化データ、この
場合、"Doe" に等しく設定する。
【0074】次に、図23のプロセスがステップ678
にフローし、MGDS50Eにさらにフィールドがある
かどうかを決定する。もしあるならば、フィールド変数
は1だけ増分され、プロセスはステップ660に進む。
もしMGDS50Eにもはやフィールドがなければ、プ
ロセスはステップ680に進む。
【0075】ステップ680において、フォルダー適用
業務プログラム554がプログラム変数83’を用いて
実行される。また、保険請求アプリケーションプログラ
ム556がプログラム変数83を用いて実行される。
【0076】高度な収集プログラム85は、それぞれの
フィールドデータセグメント54においてフィールド関
連データ名を用いて第1レベルマッピングテーブル55
0のテーブルルックアップ動作を実行し、FAF操作環
境プログラム554において対応するプログラム変数8
3’を識別する。識別されたプログラム変数は、データ
フィールドセグメントの対応する符号化データに等しく
設定される。次に、FAF操作環境プログラム554
は、表1のステップ800乃至806のルーチン”A”
を用いて、必要に応じて、図18の符号化オブジェクト
とイメージオブジェクト10’の内の少なくとも一方を
自動索引することによって、自動索引を実行する。
【0077】次に、高度な収集プログラム85は、それ
ぞれのデータセグメント54のフィールド関連名を用い
て、第2レベルマッピングテーブル552のテーブルル
ックアップ動作を行い、アプリケーションプログラム5
56において対応するプログラム変数83を識別する。
識別されたプログラム変数は、図12のデータフィール
ドセグメント54の対応する符号化データに等しく設定
される。次に、アプリケーションプログラム556は、
ステップ858及びステップ874におけるルーチン
(B)等の索引サービスと、ステップ876におけるル
ーチン(C)等のオブジェクト処理サービスのために、
FAF操作環境プログラム554を呼び出し、文書フォ
ームに書き込まれた情報を用いて所望のビジネス操作を
実行する。
【0078】結果となる高度なデータ収集アーキテクチ
ャの本発明は、フォーム上のフィールドの順序、配列、
名前及び数が変更しても、自動的に処理されることが可
能な新たな文書フォームを自由に生成する手段を提供す
る。
【0079】 高度なデータ収集アーキテクチャの本発明の多用性を示
すため、ここにフォームの2つの例が与えられる。第1
例は、外交員の請求フォームの例である。この第1例
は、フォーム10Fを示す図14、マスターMGDS5
0Mを示す図16、走査されたイメージ10’を示す図
18、抽出されたイメージ10”を示す図20、第1例
のフォームに一般の68b"First Name"を表示する、手
動検査及び修正プロセッサ32を示す図27、及び第1
例のフォームにMGDS50Eを示す図12を含む。
【0080】第2例のフォームは、フォーム10ZFを
図15において示している。この第2例は、ZED社の
請求フォームである。第2例を示す図面は、フォームを
示す図15、マスターMGDS50ZMを示す図17、
走査されたフォームのイメージ10Z’を示す図19、
第2例の"Given Name"である一般名68bの表示を示す
図28、第2例のフォームにMGDS50EZを示す図
13である。
【0081】第1例のフォーム及び第2例のフォームは
共に、保険請求処理アプリケーションプログラム556
に情報を提供するのを目的とする保険請求フォームであ
る。本発明の特徴は、2つの多様な文書フォームは、ア
プリケーションプログラム556を再プログラミングせ
ずに、同じアプリケーションプログラムによって使用す
るために設計される。
【0082】第1例 第1例のフォームは、図14に示される外交員の保険請
求フォームである。外交員のフォームが書き込まれる
と、図18に示されるように見えて、文字Wで常に始ま
る連続番号によって特徴付けられる。保険会社は、フォ
ーム定義プロセス86Aを用いて、図14の第1例のフ
ォームを設計する。結果となる定義データセットは、フ
ォーム定義プロセス86Aによって生成される図16に
示されるマスターMGDS50Mに実施される。記載さ
れるように、ホストコンピュータ34によって提供され
るフィールド関連リスト82は、図16のフィールド関
連名82a乃至82fを特定するのに使用される。保険
会社は、それぞれの関連名に対応するカスタマイズされ
たセットのフィールド名68a乃至68fを選択する。
フォーム定義プロセス86Aからの結果となるマスター
MGDS50Mは、知能フォームプロセッサ25のバッ
ファ40に記憶される。マスターMGDS50Mはま
た、知能フォームプロセッサ25から知能フォームプロ
セッサ25に接続されるデータ処理システムの他のワー
クステーションに伝送され、ここで図14のマスターフ
ォーム10Fのコピーが情報を提出するため一般から受
信される可能性が高い。
【0083】第1例において、図14のマスターフォー
ム10Fは保険会社の外交員の被保険者である顧客によ
って書き込まれる。被保険者の顧客はフォーム10Fを
書き込み、図18に示される走査されたフォームイメー
ジ10’と同じ外観を有するハードコピーフォームを生
成する。被保険者の顧客は、外交員に指示されたように
連続番号の前にWを入れて連続番号を記入する。外交員
は、連続番号フィールド12’にWを前に入れた連続番
号で事前印刷された、ハードコピーフォームを準備して
もよい。いずれの場合も、外交員の被保険者の顧客はフ
ォーム10Fのそれぞれのフィールドを記入し、図18
の走査されたフォームイメージ10’と同じ外観の記入
されたフォームを生成する。
【0084】外交員の被保険者の顧客が記入したフォー
ムを提出すると、スキャナー22によってシステムへと
走査され、図18に示される走査されたフォームイメー
ジ10’となる。次に、走査されたフォームイメージ1
0’はバッファ40に記憶されてもよい。また、走査さ
れたフォームイメージ10’は、イメージが記憶される
ネットワークにおいて他のワークステーションでスキャ
ンインされてもよい。次に、イメージはデータネットワ
ーク接続を介して知能フォームプロセッサ25に伝送可
能であり、文書イメージ10’がLAN20に存在す
る。文書イメージ10’の受信の更に他のモードは、一
般の電話回線網を介してファクシミリ伝送から受信され
る。ファクシミリイメージは知能フォームプロセッサ2
5で受信され、上述の米国特許出願第07/693、7
39号に記載される方法に類似する。
【0085】文書イメージ10’は幾つかの手段によっ
て受信され、LAN20に存在する。次に、走査された
フォームイメージ10’はプロセッサ24によってフォ
ーム認識及びフィールド抽出され、続いてプロセッサ2
6で文字認識されて、それぞれMGDS50A及びMG
DS50Bを生じる。追加のエラー修正プロセスがエラ
ー修正プロセッサ28、エラー修正プロセッサ30によ
って行われ、それぞれMGDS50C及びMGDS50
Dを生じる。
【0086】手動検査及び修正は、MGDS50Dの符
号化データ48で所望されてもよい。手動検査及び修正
プロセッサ32のオペレータに表示し、オペレータに提
示される符号化データに正確且つ意味のあるフィールド
名68Bを示すことは有益である。図27において、こ
の第1例のため、第2フィールドのフィールド名68b
が、符号化データ48と共に表示バッファ424に表示
されることが分かる。本発明の特徴は、フォームの特定
のフィールドに符号化データが見られるいかなるワーク
ステーションも、その段階でMGDSにあるカスタマイ
ズされたフィールド名68bによって識別される。
【0087】プロセッサ32によって実行される手動検
査及び修正プロセスの結果として、図12において、第
1例に示される最後のMGDS50Eが生成される。図
12において、それぞれのフィールドの符号化データが
各フィールドデータセグメントに表されることが分か
る。例えば、第1フィールドデータセグメント52は、
対応するフィールド関連名 "Data-1" 82aと、対応す
るフィールド名 "Last Name"68aをもった符号化デー
タ "Doe"を有する。6個のフィールドデータセグメント
の各々に対応する情報は、図12に示されるように、M
GDS50Eで入手可能である。
【0088】第1例のMGDS50Eが文字認識及びエ
ラー修正プロセスからホストコンピュータ34に伝送さ
れると、高度なデータ収集プログラム85はそれらのフ
ィールド関連名82a、82b及び82fを、フォルダ
ー適用業務プログラム554の対応するプログラム変数
83’を有すると識別する。これは、第1レベルマッピ
ングテーブル550によって行われる。
【0089】高度なデータ収集プログラム85はまた、
この第1例において、保険請求処理アプリケーションプ
ログラム556で使用されるプログラム変数83へのフ
ィールド関連名82a乃至82fを識別する。これは、
第2レベルマッピングテーブル552によって行われ
る。
【0090】保険請求処理アプリケーションプログラム
556は、図12のMGDS50Eによって提供される
プログラム変数83に作動して、アプリケーションプロ
グラム556の外交員のサブルーチンを実行する。フィ
ールド関連名82fの"serial number(連続番号)"
が”W”で始まる符号化データを有するため、アプリケ
ーションプログラム556のための表2のステップ87
2は、図14のフォーム10Fが "agent"フォームであ
ることを決定する。従って、アプリケーションプログラ
ム556がステップ874を実行して、FAF(B)を
呼び出して、外交員の記録にアクセスし、次に、ステッ
プ876において、FAF(C)を呼び出して、文書を
外交員に送信する。
【0091】従って、第1例は、図14の第1カスタマ
イズされたフォーム10Fを有し、保険請求処理アプリ
ケーションプログラム556において第1 "agent"サブ
ルーチンを呼び出す。
【0092】第2例 第2例のフォームは図15に示され、図14の第1例の
フォームと異なるフィールド名、異なるレイアウト及び
異なるデータタイプで設計されるフォームだが、同一の
保険請求処理アプリケーションプログラム556に情報
を提供することを目的としている。図15に示される第
2例のフォームは、顧客への保険会社であるZED社に
よって設計される保険フォームである。ZED社の従業
員は被保険者である。フォームを保険会社に提出するの
は従業員である。
【0093】図15の第2例のフォーム10ZFは、同
一のフィールド関連リスト82で作動するフォーム定義
プロセッサ86によって、知能フォームプロセッサ25
で設計される。保険会社は、図17のマスターMGDS
50ZMに示されるように、フィールド関連名82a乃
至82f、フィールド名68a乃至68f,及び他のデ
ータを特定することによってフォームを設計する。マス
ターMGDS50ZMに現れるフィールドデータセグメ
ントの順序は、図15に示されるマスターフォーム10
ZFにおけるフィールドの異なるレイアウトを反映する
ことに注意したい。また、フィールド名は異なることに
も注意したい。例えば、第2例の第2フィールドデータ
セグメント54ZMにおけるフィールド名は、"Given N
ame"である。
【0094】保険会社が第2フォーム10ZFを準備し
た後、フォームをZED社の従業員から受信すると、そ
の後の使用のため第2マスターMGDS50ZMを記憶
する。
【0095】フォームがZED社の従業員によって書き
込まれると、フォームは図19に示される操作されたフ
ォームイメージ10Z’の外観を有する。フォーム10
ZFとフォーム10Z’を区別するため、ZED社の従
業員によって提出される保険フォームの連続番号は、第
1字に”X”を有する。これは、保険請求処理アプリケ
ーションプログラム556に異なるサブルーチン、即
ち、表2のステップ850乃至868のサブルーチンを
呼び出すために設計される。
【0096】ZED社の従業員が保険請求フォームを提
出すると、フォームはスキャンインされ、図19に示さ
れるように走査されたフォームイメージ10Z’を有す
る。前述のように、フォーム認識及びフィールド抽出の
プロセスと、文字認識及びエラー修正の追加のプロセス
とを介して、MGDS50Dがエラー修正プロセッサ3
0によって生成され、オペレータが見るため手動検査及
び修正プロセッサ32に提示される。本発明に従って、
第2例の図28に示されるように、オペレータが符号化
データ48を見ると、実際のフィールド名 "Given Nam
e" 68bと共にオペレータに提示されている。
【0097】手動検査及び修正プロセッサ32は動作の
完了後、図28に示されるMGDS50EZを出力す
る。次に、MGDS50EZはホストコンピュータ34
に伝送され、保険請求処理アプリケーションプログラム
556の適切なサブルーチンを呼び出す。
【0098】高度なデータ収集プログラム85は、第1
レベルマッピングテーブル550を用いて、フォルダー
適用業務プログラム554に対してフィールド関連名8
2a、82b及び82fを識別する。
【0099】高度なデータ収集プログラム85は、第2
レベルマッピングテーブル552を用いて、保険請求処
理アプリケーションプログラム556に対してフィール
ド関連名82a乃至82fの全てを識別する。
【0100】保険請求処理アプリケーションプログラム
556は第2例の連続番号は”X”で始まることを決定
して、"ZED Corporation" 保険請求フォームに表2のス
テップ852で開始するサブルーチンを呼び出す。次に
ステップ852乃至868が実行される。
【0101】高度なデータ収集アーキテクチャの本発明
は、第1例及び第2例のフォームの双方のバージョンを
備えることによって、同一の保険請求処理アプリケーシ
ョンプログラム556及び同一のフォルダー適用業務プ
ログラム554により、これら2つのフォームを合併す
ることができる。
【0102】以下の議論は、前述の米国特許出願第07
/787、129号に記載される、文書フォームの走査
されたイメージの文字認識エラーを連続修正するための
システムを概説している。この追加の記述は、ここで開
示される高度なデータ収集アーキテクチャである本発明
の理解を容易にするために含まれる。
【0103】文字認識エラーの連続修正 文書フォームの特定のフィールドのための修復過程は、
機械生成データ構造(MGDS)メッセージに組み込ま
れる。MGDSは、連続修復プロセス及びシステムのプ
ロセッサの間のデータインタフェースとして使用され
る。MGDSはまた、監査証跡を維持するため、特定の
誤って認識された文字列に対する修復の過程におけるリ
ポジトリー(収納場所)としてはたらく。
【0104】図1及び図2は、データ処理システムの全
体のアーキテクチャ図を示す。図1はその左半分であ
り、図2はその右半分である。ハードコピー文書10は
スキャナー22によってシステムへと走査されて、図1
8に示される文書イメージ10’となる。図26のアー
キテクチャ図により詳細に示される知能フォームプロセ
ッサ25は、スキャナー22によってスキャナーインタ
フェースプロセスを提供する。図1において点線で示さ
れる知能フォームプロセッサ25はまた、フォーム定義
プロセッサ86、バッファ40、フォーム認識及びフィ
ールド抽出プロセッサ24、文字認識プロセッサ26、
及び人工知能エラー修正プロセッサ28を含む。本発明
の好ましい実施例において、これらのさまざまなプロセ
ッサは、実行されるとそれぞれのプロセスを実行するよ
うな対応するコンピュータプログラムを介して行われ
る。本発明の代替の実施例では、図1及び図2に示され
るように、フォーム定義プロセッサ86、スキャナープ
ロセッサ23、バッファ40、フォーム認識及びフィー
ルド抽出プロセッサ24、文字認識プロセッサ26、及
び人工知能エラー修正プロセッサ28は、構内通信情報
網(LAN)20によって各々が別個のプロセッサが一
緒に接続される。本発明の理解を容易にするため、図1
及び図2に示される別個のプロセッサの実施例を始めに
説明する。
【0105】構内通信情報網(LAN)20は、フォー
ム定義プロセッサ86、スキャナープロセッサ23、バ
ッファ40、フォーム認識及びフィールド抽出プロセッ
サ24、文字認識プロセッサ26、及び人工知能エラー
修正プロセッサ28をホストコンピュータ34と相互接
続する。LAN20にはまた、データベースエラー修正
プロセッサ30及び手動検査及び修正プロセッサ32が
接続される。更に、追加のイメージ収集機構バッファサ
ーバ40’がLAN20に接続されることができる。ホ
ストコンピュータ34は文書イメージ記憶装置36、符
号化データ記憶装置35、及び修復過程記憶装置38と
接続される。
【0106】文書10はスキャナー22によってシステ
ム内へと走査されて、図18により詳細に示される文書
イメージ10’を形成する。文書イメージ10’は、ハ
ードコピー文書10のイメージのビットマップ表示であ
る。スキャナー22は構内通信情報網20を介して、フ
ォーム認識及びフィールド抽出プロセッサ24に文書イ
メージ10’を出力する。文書イメージ10’のコピー
はまた、ホストコンピュータ34に転送され、一時的な
索引識別が文書イメージ10’に割り当てられて、文書
イメージ記憶装置36に一時的に保管(アーカイブ)さ
れる。
【0107】フォーム認識及びフィールド抽出プロセッ
サ24は、システムによって処理されるべきフォームの
マスターフォーム定義のライブラリを含む。フォームの
モデルは、フォームパターン及びフォーム上に含まれる
各フィールドの記述部から構成される。フォームパター
ンは、1つのフォームタイプを他のフォームタイプと区
別するのに使用される特性のセットである。フィールド
記述部は、デカルト座標系で表現されるフォーム上のフ
ィールドの位置、文字認識の受入れしきい値、識別及び
フィールド特定情報から構成される。データフィールド
の位置は、矩形の対向する角を説明する2点によるモデ
ルによって表現することができる。矩形領域はマスクと
称されてもよい。
【0108】文書イメージ10’がフォーム認識及びフ
ィールド抽出プロセッサ24に入力されると、イメージ
がフォームを識別するため分析されて、適切なマスター
フォーム定義データにアクセスすることができる。フォ
ーム認識には幾つかの方法が用いられる。第1方法は、
文書上に一般的にバーコードとして印刷されるフォーム
番号と整合する。第2方法は、フォームタイプを区別す
るフォームテキスト及びラインのレイアウト又は配置を
比較する。第3方法は、フォームの水平線及び垂直線に
依存する。フォームの文書イメージ10’が特徴付けら
れると、それぞれのフィールドの座標、フィールドの名
前、フォームにおけるそれぞれのフィールドのコードペ
ージを定義するような、対応するマスターフォーム定義
データがアクセスされる。フォーム認識及びフィールド
抽出プロセッサの動作の原理は、前述の米国特許出願第
07/305、828号に記載されている。バーコード
イメージの認識によるフォーム認識の動作の原理は、前
述の米国特許第4、992、650号に更に記載されて
いる。
【0109】スキャナー22が文書10で走査すると、
スキャナープロセッサ23は、ファイルアドレスに割り
当てられるイメージファイル内のイメージの基準化及び
圧縮等、幾つかのフロントエンド動作を実行することが
できる。文書イメージ10’のイメージファイルは、割
り当てられたアドレスの下でアクセス可能な、バッファ
40又はバッファサーバ40’に一時的にバッファされ
る。また、スキャナープロセッサ23はフォーム認識及
びフィールド抽出プロセッサ24に直接文書イメージ1
0’を出力することができる。
【0110】文書イメージファイルポインター60は、
バッファ40又はバッファーサーバ40’から文書イメ
ージ10’にアクセスするのを可能にする。図18の例
となる走査されたフォームイメージ10’は、6個のデ
ータフィールドと1個のフォーム番号フィールドを有す
る。フォーム番号フィールド11’は、保険請求フォー
ムであるフォームを識別するバーコード表示を含む。第
1データフィールド14’は、姓のフィールドである。
第2フィールド16’は、名のフィールドである。第3
フィールド12a’は、州のフィールドである。第4フ
ィールド12b’は、アドレス(住所)のフィールドで
ある。第5フィールド44’は署名のフィールドであ
り、第6フィールド12’は連続番号のフィールドであ
る。第1フィールドから第4フィールド及び第6フィー
ルドは英数字のイメージを含むのに対し、第5フィール
ドは署名のイメージを含むことに注意したい。
【0111】図18の例において、フォームタイプはフ
ィールド11’のバーコードフォーム番号から認識され
る。システム内に走査されたように、フォームのスキュ
ー及びオフセットが測定される。走査されたフォームイ
メージ10’上のフィールドの実際の位置を配置するた
め、フォーム上の各フィールドの予め定められた座標と
組み合わされなければならないという点で、スキュー及
びオフセット値62は重要である。
【0112】フィールド抽出プロセスは、フォーム1
0’上のフィールドのフィールド座標を含むマスターフ
ォームフォーマット10Fにアクセスすることによって
開始する。マスターフォームフォーマット10Fは図1
4に示される。フォーム上のそれぞれのフィールドの座
標を表すデータは、マスターフォーム10Fを示す図1
4に図示されている。フィールド11Fはフォーム番号
のフィールドである。フィールド14Fは姓のフィール
ドであり、境界線13によって境界を付けられる。フィ
ールド16Fは名のフィールドであり、境界線17によ
って境界を付けられる。フィールド12aFは州のフィ
ールドである。フィールド12bFはアドレス(住所)
のフィールドである。フィールド44Fは署名のフィー
ルドであり、フィールド12Fは連続番号のフィールド
である。図14に示されるこれらのフィールドは座標デ
ータを図示したものであり、本例の保険請求フォームに
対応するマスターフォーム定義データセットに提供され
る。
【0113】図16は、図14に示されるマスターフォ
ーム10Fのマスターフォーム定義に含まれる追加の情
報を示す。図16は、マスター機械生成データ構造(M
GDS)50Mを示す。マスターMGDS50Mには、
フォーム名(FORM NAME)"claim"、フィールドの数、図3
1に示されるフォーム情報FIに示されるような他の同
様の情報等の、固定されたフォームデータ65が含まれ
る。また、図16のマスターMGDS50Mの固定され
たフォームデータ65には、フォームの各ページのペー
ジ情報PIが含まれる。ここで示される例では単一のペ
ージフォームが用いられる。ページの固定されたフォー
ムデータは、例えば、ページ番号を含む。また、マスタ
ーMGDS50Mには、図14のマスターフォーム10
Fにおける6個のデータフィールドの各々に対する固定
されたフィールドデータ67が含まれる。フォーム上の
各フィールドは、図14の第1データフィールド14F
に対応する図16のフィールドデータセグメント52M
等の、フィールドデータセグメントによって表される。
フィールドデータセグメント52Mは、フィールド座標
64等の固定されたフィールドデータ67を含む。図1
6において、図14のマスターフォーム10Fの各々の
矩形フィールドの左上の角にあるX1とY1、右下の角
にあるX2とY2が示される。また、固定されたフィー
ルドデータ67には、フィールド名、例えば、図14の
姓のフィールド14Fに対応するフィールドデータセグ
メント52Mが含まれ、フィールド名68が "last nam
e"であることを特定する。また、図16の固定されたフ
ィールドデータ67にはフィールドタイプ70が含まれ
る。例えば、図16のフィールドデータセグメント52
Mは英数字に対応するフィールドタイプ "A/N"を有す
る。
【0114】含まれる他のフィールドデータ67が、図
33のフィールド情報に示される。図16に示されるマ
スターMGDS50Mは、マスターフォーム定義データ
が、いかにフォーム認識及びフィールド抽出プロセッサ
24に編成され、かつ記憶されるかの一例である。フォ
ーム認識及びフィールド抽出プロセッサ24は、フォー
ム情報FI及びページ情報PIに固定されたフォームデ
ータ65を編成し、マスターMGDS50M内にそれぞ
れのフィールドデータセグメント52M等の固定された
フィールドセグメント67を編成し、文字認識プロセッ
サ26に転送する。こうした転送の前に、追加データが
追加され、フォーム認識プロセスステップ100乃至1
03によって進められる。特に、追加される情報は、フ
ォームイメージ10’のスキュー及びオフセットデータ
62である。
【0115】追加の空間が、認識プロセスの後半の段階
で追加される情報のために図16のマスターMGDS5
0Mに割り当てられる。例えば、フォーム復帰FRフィ
ールド72が割り当てられた空間を有し、任意の文書イ
メージファイルポインター60及び任意の抽出されたイ
メージファイルポインター74に空間が割り当てられ
る。特に、符号化データ部分75が追加される。MGD
S50Mにおけるこれらの割り当てられたフィールドの
各々は、対応するデータがフォームの文字認識修正にお
いて生成されるシステムの処理段階に達するまで空であ
る。
【0116】フィールド抽出プロセスは、マスターMG
DS50Mに設けられるフィールド座標64とスキュー
及びオフセット値62からの各フィールドのフィールド
ロケーションを計算する。フィールド座標値64は、第
1フィールドデータセグメント52M、第2フィールド
データセグメント54M、第3フィールドデータセグメ
ント56M、第4フィールドデータセグメント12b
M、第5フィールドデータセグメント44M、及び第6
フィールドデータセグメント12Mの第1フィールドに
設けられる。
【0117】フィールド抽出プロセスは、フィールド抽
出プロセスを用いて文書イメージ10’からフィールド
イメージ10”を抽出する。図21は、例となるフィー
ルド抽出プロセスを示している。図21は、図18の文
書イメージに現れるような、名のフィールドのフィール
ドイメージ16’を示す。フィールドイメージ16’
は、包囲するボックス17、文字18及びスプリアス
(擬似の)線19及び19aと共に示される。フィール
ド抽出のプロセスにおいて、ボックス17のイメージが
取り除かれる。更に、無関係な線を取り除くプロセスに
おいて、線19aの一部がフィールド16’の所定の領
域外にあるため、無関係な線19aが取り除かれる。し
かしながら、この例では、無関係な線19はフィールド
16’において文字のイメージ18から取り除かれてい
ないことが、図21の結果となる抽出されたフィールド
16”で分かる。抽出されたフィールドイメージ16”
は、フォーム用の図20の抽出されたフィールドイメー
ジ10”に現れる。
【0118】抽出されたフィールドに残るスプリアス線
の追加の例が図18のフォームイメージ10’の州のフ
ィールド12a’に示され、その対応する抽出されたイ
メージ12a”には、未だ、フロリダ州の州の略語であ
る "FL" の文字L に重なるスプリアス線がある。
【0119】次に、フィールド抽出プロセスは、図16
に示されるマスターMGDS50Mに、例えば、フィー
ルド名(FIELD NAME)68、フィールドタイプ(FIELD TYP
E)70、フィールド座標(FIELD COORD) 64等の固定さ
れたフィールドデータ67と共に、例えば、フォーム名
(FORM NAME) 66等の固定されたフォームデータ65を
組み合わせる。次に、変数フォームデータがマスターM
GDS50Mに挿入される。例えば、現在「ゼロ」の値
をもつフォーム復帰(FR)コード72、文書イメージ1
0’のファイルへのポインターアドレスである文書イメ
ージポインター(DOC IMG PTR) 60、抽出されたイメー
ジ10”を含むファイルのポインターアドレスである抽
出されたイメージポインター(EXT IMG PTR) 74、スキ
ュー及びオフセット値(SKEW & OFFSET) 62、及びフォ
ーム認識及びフィールド抽出プロセッサ24において現
段階で入手可能な他のデータが挿入される。
【0120】次に、フィールド抽出プロセスは、図3に
示されるMGDSメッセージ50Aを文字認識プロセッ
サ26に出力する。フィールド抽出プロセスが図26の
知能フォームプロセッサ25においてこれらのプロセス
の多重タスクの実施例ならば、MGDSメッセージ50
Aの転送は、プロセッサ25のメモリにおいて一般的に
アクセス可能な部分である。また図1及び図2の多重プ
ロセッサLANの実施例において、MGDSメッセージ
50AはLAN20を介して文字認識プロセッサ26に
転送される。
【0121】次に、プロセスは抽出されたイメージファ
イル10”を出力する。抽出されたフィールドイメージ
ファイル10”はファイルに配置され、そのアドレスは
抽出されたイメージポインター74によって参照され
て、抽出されたイメージ10”はバッファ40又はバッ
ファサーバ40’に記憶される。また、抽出されたフィ
ールドイメージ10”は文字認識プロセッサ26に直接
転送される。
【0122】図3は、フォーム認識及びフィールド抽出
プロセッサ24からの出力として、MGDS50Aがよ
り詳細に図示されている。特に、図3に示されるMGD
S50Aは、図18に示されるフォームイメージ10’
の6個のフィールドの内の最初の2個に対応する、第1
フィールドデータセグメント52A及び第2フィールド
データセグメント54Aを示す。
【0123】フォーム認識及びフィールド抽出プロセッ
サ24は、図3により詳細に示される第1段階MGDS
データ構造メッセージ50Aを生成する。MGDS50
Aのフォーム情報の特定のフォーマットが図31に示さ
れる。フォーム復帰コードパラメータは、6の値をもっ
た長さ(Length)エンティティ、IDエンティティ及びデ
ータ(Data)エンティティを有する。データテンティティ
は2バイト長であり、IDエンティティは2バイト長で
あり、長さエンティティは2バイト長であるため、長さ
エンティティの値は6となって、パラメータのバイトの
全数を表す。MGDS群はパラメータを一緒に関連付
け、対応するパラメータの全群を容易に渡して分解する
のを可能にする。パラメータは、幾つかのサブパラメー
タを含むことを目的とするパラメータを特定することに
よって分類される。そうした含まれるパラメータ又はコ
ンテナオブジェクト、例えば、フィールド情報パラメー
タが図31に示されて、長さエンティティ、IDエンテ
ィティ及びデータエンティティを有する。データエンテ
ィティには、含むパラメータのデータが、その長さエン
ティティの含むパラメータに特定される長さに従うパラ
メータの群であることを示す矢が含まれる。長さ及びI
Dが16進数であることに注意したい。
【0124】MGDS50Aの開始部分Hに含まれるフ
ォーム情報FIは、図31に示されるパラメータを含
む。MGDSパラメータは、MGDS50A全体を含む
包囲パラメータである。MGDSバージョンパラメータ
は、使用されるMGDSのバージョンについて述べてい
る。フォーム復帰コード(Form Return Code)パラメータ
は、イメージを処理するときにエラーに遭遇したかどう
かを示す。もしエラーが第1レベルで存在したと復帰コ
ードが示すならば、拒否された文字の復帰コードと疑わ
しい文字の復帰コードは検査されて正確なエラーを決定
しなくてはならない。フォーム復帰コードは、拒否処理
が文書イメージに必要かどうかを決定するための主な表
示である。負の復帰コードはフォーム又はフィールドレ
ベルにおいて発生した処理エラーを示して、フォームが
実際に誤って識別されることもある。正の復帰コード
は、フィールド全てにフォームに見られた拒否された文
字の数及び疑わしい文字の数を示す。この復帰コード
は、エラー修正がうまく行われた後にゼロに再設定され
る。
【0125】変換時(When To Convert) パラメータは、
MGDSを生成するアプリケーション、即ち、フォーム
認識及びフィールド抽出プロセッサ24、がMGDSの
文字データを適切なホストコードページに変換したかど
うかを示している。パラメータ値ゼロは、MGDSを生
成するアプリケーションが生成された元のASCIIコ
ードページの文字データに残り、数値データが16進法
の数値の表示がバイトをフリップすることで読み出され
るワークステーションバイト順序に現れることを示して
いる。パラメータ値2は、MGDSを生成するアプリケ
ーションが文字データを適切なホストEBCDICコー
ドページに変換し、数値データのレプリカが16進法の
数値の表示がバイトをフリップせずに読み出されるホス
トバイト順序に現れることを示している。パラメータ値
1は、数値データのバイト順序と、文字データがコード
ページに変換されているかどうかを決定するためのフォ
ーム復帰コードの検査を必要とする。
【0126】フォームクラス名(Form Class Name) パラ
メータは、フォームに認識されるフォームクラスの名前
を示す。フォームクラス名は、フォーム認識動作を行う
フォーム認識及びフィールド抽出プロセッサ24によっ
て定義される。
【0127】フォーム名(Form Name) パラメータは、フ
ォーム認識動作を行うフォーム認識及びフィールド抽出
プロセッサ24によって定義されるようなフォームの名
前を与える。
【0128】汎用コードページ(General Code Page) パ
ラメータは、認識されていない文字フラグ、フォームク
ラス名、フィールド名、フィールド関連及びフィールド
修復パラメータのコードページである。これらの項目の
全てが1つのコードページに現れると仮定される。幾つ
かのコードページがこれら異なる項目に存在するなら
ば、認識されていない文字フラグのコードページが使用
される。
【0129】認識されていない文字フラグ(Unrecognize
d Character Flag) パラメータは、文字データバッファ
における認識されていない文字を示すために用いられ
る。フィールドパラメータの番号は、データがMGDS
に復帰されるフィールドの数を示す。
【0130】フォームコードページ(Form Code Page)パ
ラメータは、フォームの全てのデータに使用される。フ
ォームの全てのデータが同じコードページを使用するな
らば、フォームコードページパラメータはそのコードペ
ージを示す。異なるコードページがフォームに使用され
るならば、このフィールドは復帰されず、フィールドコ
ードページパラメータは各フィールドにあるページを示
す。データがコードページからコードページへ変換さ
れ、MGDSに戻って記憶されるため、フォームコード
ページパラメータはフォームデータの現在のコードペー
ジを反映すべきである。
【0131】ホストフォームコードページ(Host Form C
ode Page) パラメータは、ホストがイメージから検索さ
れた全ての文字情報を特定したコードページである。文
字は、情報が最後の処理のためにホストに提出される前
に、このコードページに変換されるべきである。フォー
ムコードページパラメータに対応する全ての文字情報
は、変換時パラメータ値に基づくホストコードページに
変換される。
【0132】ホストコードページ(Host Code Page)パラ
メータは、特定のフィールドコードページのフィールド
情報が変換されるべきホストコードページを示してい
る。ホストコードページパラメータは、フィールドコー
ドページパラメータが特定のフィールドのデータが変換
されるべきホストコードページを示すため存在すると
き、フィールドコードページパラメータと一対一でマッ
プする。
【0133】ページ情報(Page Information)パラメータ
は、文書の各ページについての情報を含む包囲パラメー
タである。ページ情報パラメータは、各ページのフィー
ルドについての情報を含んでいない。
【0134】フィールド情報(Field Information) パラ
メータは、フィールドデータセグメントの包囲パラメー
タであり、フォームのページ上のそれぞれのフィールド
に復帰される全ての情報を分類するのに使用される。パ
ラメータには、各フィールドのフィールドデータの全体
セットの長さ以外の情報がない。
【0135】ページ情報フォーマットが図32に示され
ている。ページ番号(Page Number)パラメータはページ
情報包囲パラメータに現れる情報にページ番号を提供す
る。ページ分解(Page Resolution) パラメータは、ペー
ジ情報パラメータに配置されるページ番号パラメータに
よって示される特定のページの分解を提供する。ページ
方向(Page Orientation)パラメータは、特定のフォーム
ページの方向を提供する。ページ方向パラメータの値
は、回転がないか、若しくは、90度、180 度又は270 度
の正の時計回り方向の回転を示している。
【0136】図33は、フィールド情報の詳細なフォー
マットを示す。拒否された文字復帰コード(Rejected Ch
aracter Return Code)パラメータは、文字認識プロセス
の間に拒否された文字に遭遇したことを示している。拒
否された文字復帰コードパラメータは、文字認識プロセ
ッサが文字認識動作を行うまでデータが書き込まれな
い。このフィールドにおける番号は、フィールドで遭遇
した拒否された文字の数を示す。数が負であるならば、
フィールドを処理する間にエラーに遭遇したことを示
す。
【0137】疑わしい文字復帰コード(Suspicious Char
acter Return Code)パラメータは、文字認識プロセッサ
26による文字認識プロセスの間に遭遇した疑わしい文
字を示す。このフィールドの番号は、フィールドで遭遇
した疑わしい文字の数を示す。フィールド関連(Field A
ssociation) パラメータが、フィールドをホストフィー
ルドと対応させるために使用される。フィールド関連パ
ラメータは、ユーザがその対応値を示すためフォーム定
義ユーティリティに入力するIDであり、フォーム認識
及びフィールド抽出プロセッサ24によって提供され
る。このフィールドは、フォームに現れるようなフィー
ルドによるよりも、アプリケーションの使用によるフィ
ールドによって記述するのに使用されるため、フィール
ド名パラメータと異なる。例えば、このフィールドはホ
ストアプリケーションに重要な索引情報を含む。
【0138】フィールド名(Field Name)パラメータは、
エラー修正及びデータ入力の間のフィールドを説明する
のに使用されるフィールド記述である。フィールドフォ
ームページ(Field Form Page) パラメータは、フィール
ドが現れるフォームページである。
【0139】フィールド座標(Field Coordinates) パラ
メータは、文字認識プロセッサ26によって、フィール
ドを強調表示し、更に続く修復ステージにおけるフィー
ルドを処理するために使用されるフィールドの座標で書
き込まれる。これらの座標は、フィールドを包囲する矩
形の左上及び右下の座標であり、イメージの左上角に配
置される00座標をもった座標系に基づく。4つの座標
値の各々は、4つのバイト、即ち、X左、Y下、X右、
Y上、を使用する。
【0140】図34に示される符号化データ(Coded Dat
a)パラメータは、各フィールドに同じコードページを有
する全ての文字情報を分類するのに使用される包囲パラ
メータである。複数のコードページが各フィールドで使
用されるため、符号化データパラメータはコードページ
及び文字情報を分類する。文字情報は、文字認識プロセ
ッサが文字認識動作を行うまで供給されない。符号化デ
ータパラメータには、コードページの長さ及び文字情報
以外の情報はない。符号化データパラメータの存在は、
フィールド存在パラメータの存在と互いに排他的であ
る。2つのパラメータは、同時に同じフィールドに存在
しなくてもよい。フィールド存在パラメータは、フィー
ルドがデータを含むか否かを示し、例えば、検査ボック
スフィールドに使用することができる。
【0141】図35に示される拒否文字情報(Reject Ch
aracter Information)パラメータは、文字認識プロセッ
サ26によって追加される包囲パラメータであり、拒否
された文字又は疑わしい文字に関する全情報を分類する
のに使用される。拒否文字情報パラメータには、拒否情
報の長さ以外の情報はない。
【0142】オプションとして、イメージデータパラメ
ータ(図示せず)がMGDSメッセージ50Aに含ま
れ、プロセッサ24によって提供される。プロセッサ2
4がそのフィールド抽出動作を実行した後、フィールド
の終結イメージは直列に配列されるビットマップを有
し、オプションとしてMGDS50Aに圧縮及び負荷さ
れる。
【0143】図30は、MGDSメッセージ構造におけ
るさまざまなMGDSパラメータ間の関係を示してい
る。フォーム情報がMGDS50Aの開始部分Hの一部
であることが分かる。図30に示されるように、これに
一緒にクラスタ化されるページ情報が続く。次に、これ
に幾つかのフィールド情報セグメントが続き、各フィー
ルド情報セグメントは主体フォームのフィールドの1つ
に対応する。フィールド情報セグメント内には、1個以
上の符号化データセグメントがあり、各符号化データセ
グメントは単一のコードページによって特徴付けられる
フィールドの一部に対応する。全フィールドが単一のコ
ードページによって特徴付けられるならば、フィールド
には単一の符号化データセグメントがある。またフィー
ルド情報には、文字認識プロセッサ26によって生成さ
れることもあるいかなる拒否文字情報をも含んでいる。
【0144】文字認識プロセッサ26によって実行され
る文字認識プロセスは、文字列42"Ja* n"を生成する
ため図21のイメージ16”に作動する。
【0145】文字認識プロセスは、図3に示されるよう
にMGDSメッセージ50Aを入力する。次に、プロセ
ッサ26は図20に示されるように、抽出されたフィー
ルドイメージファイル10”を入力する。
【0146】次に、ループはそれぞれのフィールドデー
タセグメントで開始する。図3に示されるように、ルー
プは、MGDSメッセージ50Aからそれぞれのフィー
ルドデータセグメントを得る。姓のフィールド14”の
第1フィールドデータセグメント52Aが始めに処理さ
れる。次に、ループは第2フィールド16”に対して、
MGDSメッセージ50Aからのフィールドデータセグ
メント54Aを得る。ここでの例は、名のフィールドで
ある第2フィールド及びそのフィールドデータセグメン
ト54Aに焦点を合わせる。
【0147】次に、プロセッサ26はフィールドデータ
セグメント54Aからフィールド座標64を得る。次
に、フィールドデータセグメント54Aからフィールド
タイプ情報70を得る。フィールドタイプ情報70は、
フィールドに期待されるタイプとして特定することが可
能な広範囲の文字スタイルを含むことができる。特定の
フォームが通常手で書き込まれるならば、ハンドプリン
ティングがフィールドタイオプ情報70に示される。機
械印刷数値又は漢字、ヘブライ文字又はキリル文字は、
期待されるフィールドタイプ70として特定することが
可能な、他の文字スタイルである。
【0148】文字認識手順のタイプが、イメージがフィ
ールド16”に現れる文字に期待されるフィールドタイ
プ又は他の特性に基づいて選択される。特定のフィール
ドに実行される文字認識手順のタイプは、情報がフィー
ルドに期待される文字のタイプに使用可能ならば、性能
又は正確さのために最適化することができる。例えば、
フィールドタイプ情報70が、機械印刷ローマ字がAS
CIIコードページ等のフィールドに存在すると示され
るならば、標準的なOMNIフォント認識手順が使用さ
れることができる。また、フィールドタイプ情報70が
フィールドが厳密に言えばアラビア文字を用いる数値フ
ィールドであるならば、認識での曖昧さがそのようなフ
ィールドにおける文字に対して数値に有利に解決される
ため、より良い性能をもつ数値認識手順が使用されるこ
とができる。また、フィールドタイプ情報70やコード
ページ71はフィールドが漢字を含むと期待されると示
されるならば、2バイト認識手順が使用されなければな
らない。また、フィールドタイプ情報70がイメージフ
ィールドであると示すならば、フィールドタイプ情報7
0又はフィールドコードページ71が示すならば、文字
認識は実行されず、代わりにイメージ自体が抽出されて
フィールドデータセグメントに渡される。また、イメー
ジが署名として特定されるならば、イタリック体認識プ
ロセスが適用される(図示せず)。また、署名検査プロ
セスも適用される(図示せず)。
【0149】次に、図20に示されるように、抽出され
たフィールドイメージビットマップ16”が得られる。
次に、文字認識手順がイメージ16”について実行され
る。
【0150】データ抽出プロセスによって生成されるイ
メージは、文字認識プロセッサ26で認識されるべきデ
ータのクリーンイメージを提供する。これはフィールド
毎に行われて、各フィールドの文字が単一のイメージブ
ロックとして抽出される。フィールドイメージが認識さ
れる前に、個々の文字イメージにセグメント化されなけ
ればならない。これらのイメージは、次に文字分類処理
によって認識される。セグメンテーションで、文字から
文字までのピッチ、即ち、距離を識別して、接触する文
字同士を分割し、こわれた文字を合成する。もしあれ
ば、タイピングのスキューと、フィールドにおける特定
の列イメージの他の特異体質とを識別する。文字認識分
類処理は入力として単一文字パターンを受け入れ、識別
記号及びASCIIコード又はEBCDICコードを戻
す。フォームのタイプされたデータの場合に通常あるよ
うに、多くの異なるソースから文書が達すると、ツリー
ロジックのライブラリが必要とされ、遭遇する各フォン
トに1個のライブラリが必要とされる。印刷のフォント
と一致するサイズ特性を有するフォントは認識のために
試されて、各分類処理がそれ自体の認識の正確さの推定
値を提供する。これらの推定値は、イメージの残りの部
分を読み取るのに最良の分類処理を選択するために評価
される。更に、入力の表示のいかなる2つの原型も互い
に一致せず、全ての入力パターンがいづれかの原型と一
致する特性を有するような原型パターンのリストが出力
される。各原型はクラスタとして定義される。クラスタ
は、一致する全てのパターンから構成される。クラスタ
情報は、続く修復ステージによって使用される文字認識
プロセッサによって出力可能である。
【0151】図4は、文字認識プロセッサ26によって
MGDSメッセージ50Bに追加される幾つかの情報を
示している。文字データバッファBは、完全に認識され
た文字 "J"及び "n"、疑わしい文字 "a"、及びアステリ
スク "*"によって示される拒否文字又は疑わしい文字の
位置を含む認識された文字列が負荷される。更に、第1
拒否文字情報Sは、文字位置、文字座標、第2推測文字
及び文字確実性を識別する拒否文字情報セグメントに配
置される。第1文字の文字位置は"0" と表示され、第2
文字の文字位置は"1" と表示される等となる。従って、
疑わしい文字"a" の文字位置は"1" と表示される。文字
座標は、疑わしい文字 "a"のフィールドイメージの位置
に設けられる。更に、文字認識プロセッサ26はより確
信度の小さい幾つかの候補となる他の文字を公式化す
る。次に最も高い確信度は文字"o"に対応し、確信度は
拒否情報セグメントSの第2推測文字パラメータに設け
られる第2推測文字である。更に、50%の文字確信度は
また、例えば、拒否文字情報セグメントSにも負荷され
る。第2拒否文字情報セグメントRは、拒否文字位置"
*" に設けられる。文字位置はその第3の文字位置2と
示され、文字位置の座標はフィールドイメージに設けら
れる。第2拒否文字情報は、図4のMGDSメッセージ
50Bに負荷される。
【0152】文字認識プロセスに戻ると、図21に示さ
れるような選択された認識手順を用いて符号化データ4
2を生成する。次に、認識されていない文字31が図2
1に示されるようにフラグを立て、図4に示されるよう
に、文字復帰コードRCが1だけ増分され、フォーム認
識コードFRもまた1だけ増分される。
【0153】次に、図21に示されるように、文字認識
プロセスは、設定されたしきい値より下にある確信度レ
ベルで認識される"suspicious"( 疑わしい) いかなる文
字位置21として識別する。図4に示されるように、疑
わしい復帰コードSCが1だけ増分され、フォーム復帰
コードFRもまた1だけ増分される。
【0154】次に、認識された文字"J" 及び"n" 、疑わ
しい文字"a" 、及び拒否フラグ"*"から構成される符号
化データ42は、図4に示されるフィールドデータセグ
メント54Bの文字データバッファBに負荷される。
【0155】次に、フィールドデータセグメント54B
は疑わしい文字エラーデータのサブセグメントSによっ
て増加され、サブセグメントSは、図4に示されるよう
に、疑わしい文字の位置座標21が負荷される。
【0156】次に、疑わしい文字の第2推測文字29
は、図4に示されるように、サブセグメントSに負荷さ
れる。本例では、第2推測文字29は"o" である。次
に、疑わしい文字の確信度61は図4のサブセグメント
Sに負荷される。本例では、第1推測文字27が"a" で
ある確信度は50%で、この値50%は文字確信度の値61
である。
【0157】次に、フィールドデータセグメント54B
が、図4に示されるように、拒否文字位置の位置座標3
1が負荷される、拒否文字エラー情報のサブセグメント
Rによって増加される。次に、他のフィールドデータセ
グメントが処理されるかどうかを決定する。
【0158】次に、図20の抽出されたフィールドイメ
ージ10”に、追加のフィールドで処理されるべき追加
のフィールドデータセグメントがあるかどうかを決定す
る。追加のフィールドデータセグメントがあるならば、
ループは戻る。また、処理されるべきフィールドデータ
セグメントがもはやなければ、プロセスは図8に示され
るように、MGDSメッセージ50Bを出力する。
【0159】図8は、図20のフォームの6個のフィー
ルドの各フィールドセグメントの符号化データへの文字
バッファBを示す。第1フィールドセグメント52は、
そのバッファBに文字列"Doe" を有する。第2フィール
ドセグメント54は、そのバッファBに文字列 "Ja* n"
を有する。第3フィールドセグメント56は、そのバッ
ファBに文字列"FA"を有する。第4フィールドセグメン
ト12bは、図18のフォームイメージ10’のフィー
ルド12b’に対応するイメージ情報がなかったため、
そのバッファBは空である。第5フィールドセグメント
44は、そのフィールドイメージ部分に署名イメージ4
5を有する。第6フィールドセグメント12は、そのバ
ッファBに列W1248 を含む。それぞれのフィールドデー
タセグメントの文字バッファBの各々の内容は、図20
の抽出されたフィールドイメージのそれぞれのフィール
ドに含まれるイメージに対応する正しい英数字列を補正
する最も良い現在の推定値である。
【0160】図34に示される符号化データ情報フォー
マットは、フィールドの各特定の文字列に使用されるコ
ードページである、フィールドコードページパラメータ
を示す。コードページがフィールドで変化するときは常
に、フィールドコードページパラメータがパラメータを
使用する文字列に先行する。フォームの全てのコードペ
ージが同じならば、フィールドコードパラメータは使用
される必要がなく、フォームコードページパラメータは
フォームの全ての文字データに使用されるべきコードペ
ージを示す。
【0161】文字バッファパラメータBはまた図34に
示され、パラメータは1つのコードページを用いる文字
列を記憶するための位置である。フィールドが文字を含
まないが、フィールドがプロセッサ24によって必須フ
ィールドと示されたならば、拒否された文字復帰コード
はいかなる値もエラーではないことを示す。文字バッフ
ァは、フィールドを表す文字列の現在の補正された値へ
のリポジトリーである。フィールド修復の各連続する段
階において、フィールドを表す最も高い確率の文字列が
文字バッファBに負荷される。
【0162】拒否情報フォーマットは、図35に詳細に
示される。拒否文字情報包囲パラメータは、全フィール
ドの文字の列に文字の位置を識別する文字位置パラメー
タを含む。これは、文字値及びイメージ文字の間の対応
がそれぞれの修復ステーションで起こることが可能なこ
とを必要とする。この位置は、フィールドの文字位置を
示すのであって、文字に先行するバイトの数を示すので
はない。
【0163】MGDSメッセージ50Bは、フィールド
セグメントがエラーを有するフィールドの第1修復を行
うため、LAN20を介して人工知能エラー修正プロセ
ッサ28に転送される。修正プロセッサ28は、幾つか
の実施例において文字認識プロセッサ26の一部であっ
てもよい。人工知能エラー修正プロセスの一例は、文字
認識プロセッサ26によって生成される文字列の字句の
テストである。一般的にフォームの特定のフィールドに
含まれるデータは、全ての文字列が許容されるのではな
いという意味で制約される。量フィールドは一般的に数
値データで充填され、名フィールドは一般的に英字デー
タで充填される。そのような制約は、文字認識補正にお
いて有益である。例えば、特定のフィールドが数値だけ
ならば、数値文字をもったフィールドにおける疑わしい
文字の比較は適切になる。この例は郵便番号(zip code)
フィールドであり、郵便番号フィールドのイメージにお
ける1以上の数値文字が疑わしいか、若しくは、読み出
されない場合である。フォームの州のフィールド、特
に、認識されない文字がない州及び市のフィールドが読
み出されるならば、字句分析は郵便番号録と同等のデー
タベースを用いて行われ、郵便番号フィールドの拒否さ
れた文字又は疑わしい文字に最も確率の高い数値を書き
込む。特定のフィールドのタイプにおいて、数字だけで
なく、文字及び句読点もまた誤って読みだされた文字の
位置又はコンテクストから判断される。例えば、特定の
フィールドが州のフィールドであり、フィールドにおい
て誤って読み出された文字があるならば、50州のリス
トは字句分析で使用され、正確に認識される文字への最
も高い確率の一致を見つけ出すことによって、拒否され
た文字又は疑わしい文字の値の判断を可能にする。
【0164】もう1つのアプリケーション及び本例で使
用されるアプリケーションは、共通の英語の名である。
MGDS50Bは人工知能エラー修正プロセッサ28に
入力され、名のフィールド16’は文字イメージ18で
ある文字"John"を含む。文字認識プロセッサ26からの
出力文字列42 "Ja* n"は、字句分析を用いてエラー修
正プロセッサ28で処理される。文字列42の第二文字
に対応する第2推測文字"o" もまた、 "Jo* n"をテスト
するため文字分析を用いてテストされる。字句分析例
は、最初の文字が"J" で最後の文字が"n" の4つの文字
をもつ名に関する。字句分析は、"Joel"、 "Jack" 、 "
John" 、 "Jake" 、 "Jane" 、 "Jean" 、"Jill" 、 "J
oan" 、 "Judy" 及び"June"等の候補名のリストを参考
にする。人工知能エラー修正プロセッサ28によって行
われる字句分析の例は、第1修復を行うことができるよ
うに、入力MGDSメッセージ50Bがフィールドに関
連するある情報を供給するのを必要とする。供給される
情報は、文字列42 "Ja* n"の文字データバッファBか
らの文字列であり、第2文字位置の第2推測文字、即
ち、"o" である。人工知能エラー修正プロセッサ28
は、字句分析から文字列 "Joan" が50%の確信度を有
し、文字列"John"もまた50%の確信度を有することを決
定する。
【0165】人工知能修正プロセスはMGDSメッセー
ジ50Bを入力する。次に、次のフィールドデータセグ
メントが疑わしい文字復帰コードSC及び拒否文字復帰
コードRCを有するループが開始し、そのフィールドに
疑わしい文字又は拒否文字があるかどうかを決定する。
図4の第1フィールドデータセグメント52Bで分かる
ように、文字認識プロセッサ26はフィールドの疑わし
い文字又は拒否文字がないことを決定した。従って、次
のフィールドデータセグメント54Bに進み、そのフィ
ールドに疑わしい文字又は拒否文字があるかどうかを決
定する。図4で分かるように、フィールドデータセグメ
ント54Bは、1に等しい疑わしい文字復帰コードSC
があり、拒否文字復帰コードRCが1であることを示し
ている。
【0166】第1修復セグメントR1は図4に示される
MGDSメッセージ50Bに追加されて、図5に示され
るMGDSメッセージ50Cを形成する。第1修復セグ
メントR1は、人工知能補正プロセス28Aによって図
4のフィールドデータセグメント54Bの文字データバ
ッファBの内容に実行される、修復の過程の編集のため
の空間を提供する。第1修復セグメントR1は、人工知
能エラー修正プロセッサ28の修復アドレス、修正のタ
イプの識別名、修復タイムスタンプ、実行される動作等
のデータと、フィールド名、修復される文字位置及び以
下に説明されるその他の情報等のフィールド修復自体の
情報を含む。
【0167】次に、プロセスは図4のフィールドデータ
セグメントのデータバッファBから符号化データ42 "
Ja* n"を得る。
【0168】次に、本例では、どのタイプの人工知能エ
ラー修正プロセスが用いられるべきかを決定する。これ
は、勿論、それぞれのフィールドに含まれるタイプの情
報に依存する。例えば、名のフィールド16”は名を含
み、符号化データ42 "Ja*n"と従来の名の類似性につ
いての字句分析を行うのに適切である。また、フィール
ド12a”のようにフィールドが州名の略語であるなら
ば、第3フィールドデータセグメントの"FA"である文字
列42’の類似性の字句分析を、従来の州名及びその略
語の字句分析に適用するのがより適切である。
【0169】従って、フィールドデータセグメント54
Bのフィールド名68が"first name(名)"であるかどう
かを決定し、もし"first name"であるならば、"first n
ame"字句プロセスが実行される。これは、符号化データ
を共通名のリストと比較することによって起こる。次
に、字句検査が実行される。
【0170】また、フィールド名68が"first name"で
なく、代わりに、フィールド名68が"state (州)"であ
るならば、"state abbreviation(州略語)"字句手順を実
行する。これは、符号化データを州の略語のリストと比
較することによって行われる。次に、字句検査が行われ
る。
【0171】符号化データ42 "Ja* n"の字句検査は疑
わしい文字27である"a" を含み、選択された字句手順
を用いて第1確信度を計算する。この場合、選択された
文字手順は上述の"first name"字句手順である。
【0172】次に、フィールドデータセグメント54B
から図4に示される文字、この場合、"o" である第2推
測文字29を得て、第2推測符号化データ46、この場
合、"Joan"を形成する。
【0173】次に、第2推測符号化データ46の字句検
査を行い、選択された字句手順、この場合、"first nam
e"字句手順、を用いて第2確信度を計算する。
【0174】次に、第2推測符号化データ46の第2確
信度が第1推測符号化データ42の第1確信度より大き
いならば、符号化データ42 "Ja* n"は図5のMGDS
50CのデータバッファBから転送され、第1修復セグ
メントR1の入力データ修復部分37に配置される。こ
れに続き、第2推測符号化データ46"Joan"を図5に示
されるフィールドデータセグメント54Cのデータバッ
ファBに負荷する。このようにして、フィールド16”
を表す文字列の最良の推定が、フィールドデータセグメ
ントの符号化データ部分75の文字データバッファBに
含まれる。
【0175】次に、フィールド16”のイメージを表す
符号化データ46の確信度39は、図5に示される第1
修復セグメントR1に負荷される。この場合、文字列"J
oan"がフィールド16”を表す確信度は50%である。
【0176】次に、クラスタデータ又は符号化データの
代替の選択48を、第1修復セグメントR1に負荷す
る。人工知能エラー修正プロセッサ28は、フィールド
16”の符号化データを表す代替の選択が文字列"John"
48であり、文字列"John"48が図5に示されるように
第1修復セグメントR1に配置されることを決定する。
【0177】次に、修復プロセッサアドレス"28"及びプ
ロセッサ28における修復のタイムスタンプが第1修復
セグメントR1に負荷される。
【0178】次に、プロセスは他のフィールドデータセ
グメントがあるかどうかを決定する。この場合、MGD
S50Bの次のフィールドデータセグメントは州のフィ
ールド12a”に対応するフィールドデータセグメント
56Bである。人工知能修正プロセス28Aは、フィー
ルド名68が"state" であり、従って、"state abbrevi
ation"字句プロセスを実行し、"FL"である文字列46’
がフィールド12a”を表す可能性がより高いことを決
定する。従って、"FA"である符号化データ42’は図9
の修復セグメントR1’の位置37に負荷され、"FL"で
ある第2推測データ46’はフィールドデータセグメン
ト56Cの符号化データ部分75”の文字データバッフ
ァBに負荷される。このようにして、州フィールド12
a”のイメージを表す可能性の最も高い文字列が、フィ
ールドデータセグメントの符号化データ部分75”の文
字データバッファBに存在する。
【0179】分析するフィールドデータセグメントがも
はやなければ、プロセスは図9に示されるMGDSメッ
セージ50Cを出力する。図9に示されるMGDSメッ
セージ50Cは、6個のフィールドデータセグメントを
含む。6個のフィールドデータセグメントに加えて、名
が第2フィールドに属するR1と州が第3フィールドに
属する修復セグメントR1’の2つの修復セグメントが
ある。第1フィールドデータセグメント52は、MGD
S50と同じバッファBを有する。MGDS50Cのフ
ィールドデータセグメント54は、新たな文字列"Joan"
に変わったバッファBを有する。MGDS50Cの第3
の州のフィールドセグメント56は、文字列"FL"に変わ
ったバッファBを有する。第4フィールドセグメント1
2b、第5フィールドセグメント44、及び第6フィー
ルドセグメント12は、MGDS50Bのフィールドセ
グメントを介して、MGDS50Cにおいて変わらない
ままである。第1名フィールドを修復した追加の修復セ
グメントR1は、文字列 "Ja* n"を含むバッファ37を
有する。州のフィールドを修復した第2修復セグメント
R1’は、文字列"FA"を含むバッファ37を有する。修
復過程が、修復セグメントR1及びR1’があるフォー
ムのMGDS50Cに堆積することが分かる。更に、図
20の抽出されたフィールドイメージ10”のそれぞれ
のフィールドを表す文字列の最良の推定値が、MGDS
50Cの各フィールドデータセグメントのそれぞれの文
字バッファBにあることがわかる。
【0180】図5において、MGDSメッセージ50C
が、文字認識プロセッサ26から受信したMGDS50
Bからの情報を用いて、エラー修正プロセッサ28によ
り形成される。図9のMGDS50Cは、MGDS50
Bを増加する修復セグメントR1に入力されるプロセッ
サ28の修復アドレスを有する。セグメントR1はま
た、修復のID(識別名)、つまり、人工知能、即
ち、"AI"を有する。また、修復タイムスタンプが含まれ
るが、この場合は、その日の5時3分58秒である。実
行された動作は"LEX" と入力され、字句分析がこの第1
修復で実行されていることを示している。次に、図5の
MGDS50Cの第1修復包囲パラメータは、フィール
ド名"FIRST" と第2文字の文字位置、即ち、ここでは"
1" を含む。修正プロセッサ28で実行される第1段階
の修復は、文字認識プロセッサ26からのMGDS入力
メッセージ50Bに含まれる第1選択情報及び第2選択
情報を利用する。
【0181】この時点で、本発明の好ましい実施例が、
いかに単一の知能フォームプロセッサ25を使用して多
重タスクフォームで実行するかについて論じるのは適切
である。それぞれのプロセスは、フォーム認識及びフィ
ールド抽出プロセッサ24、文字認識プロセッサ26、
及び人工知能エラー修正プロセッサ28で実行される。
【0182】図26は、知能フォームプロセッサ25の
詳細なアーキテクチャ図を示す。プロセッサ25は、バ
ス322によってCPU310、バルク記憶装置デバイ
ス312、ディスプレイ及びキーボード314、及びL
ANアダプタ316に接続されるメモリ302を含む。
スキャナーアダプタ318は、スキャナー22をバス3
22と接続する。LANアダプタ316は、LAN20
をバス322と接続する。更に、オプションとしてのF
AX及び通信ネットワークアダプタ320は、ファック
ス電話線をバス322と接続して、データ通信ネットワ
ークをバス322と接続することができる。CPU31
0は、例えば、インテル386又は486データ処理装
置であってもよい。バルク記憶装置デバイス312は、
200 メガバイトハードディスク記憶装置等のハードディ
スク記憶装置であってもよいし、ハードディスク磁気記
憶装置及び光学読み出し書き込み記憶装置の組み合わせ
であってもよい。
【0183】メモリ302は幾つかのコンピュータプロ
グラムを含み、プログラムの各々はプロセスを実行する
ための実行可能な命令のシーケンスである。メモリ30
2は、上記のスキャナープロセッサ23によって実行さ
れるプロセスを行うスキャナーインタフェースプログラ
ム23A’を含む。また、メモリ302には、バッファ
40の区画が含まれる。更に、メモリ302において、
区画は図14及び図16に示されるマスターフォームフ
ォーマット10Fのために設けられる。
【0184】メモリ302は、図22のフォーム定義プ
ロセス86Aを実行するフォーム定義プログラム86
A’の区画を設ける。フォーム定義プログラム86A’
はフィールド関連リスト82を受け取り、図22に特定
される動作を実行し、図16に示されるマスターMGD
S50Mを生成する。
【0185】メモリ302は、フォーム認識プログラム
24A’の区画を設ける。区画はまたフィールド抽出プ
ログラム24B’を含み、フィールド抽出プロセスを実
行する。フォーム認識プログラム24A’及びフィール
ド抽出プログラム24B’の実行の結果、上述のよう
に、抽出されたフィールドイメージ10”とMGDS5
0Aが生成される。
【0186】メモリ302において、文字認識プロセス
を実行する文字認識プログラム26A’のためのもう1
つの区画が設けられる。文字認識プログラム26A’の
実行の結果として、MGDS50Bが生成される。文字
認識プログラム26A’は、フォーム認識プログラム2
4A’及びフィールド抽出プログラム24B’によって
生成されるMGDS50Aに作動して、MGDS50B
を生成する。
【0187】また、メモリ302において、人工知能プ
ロセスを実行する人工知能エラー修正プログラム28
A’のための区画が設けられる。人工知能エラー修正プ
ログラム28A’は、文字認識プログラム26A’によ
って生成されるMGDS50Bに作動し、MGDS50
Cを生成する。
【0188】IBMのオペレーティングシステム/2
(拡張版)等の多重タスキングオペレーティングシステ
ム304は、多重タスキングモードに使用されて、メモ
リ302においてプログラムの多重タスクの実行を制御
する。また、オペレーティングシステム304は、アプ
リケーションプログラムの多重タスク実行を監督する必
要はなく、代わりに、アプリケーションプログラムはM
GDSの特定のデータフィールドセグメントを処理する
ため順に実行される。
【0189】電話ファクシミリ線をプロセッサ25と接
続するファクシミリ及びネットワークアダプタ320の
設置によって、スキャナーアダプタ318を介して提供
されるイメージの代わりに、ファクシミリイメージの受
信が可能になる。同様に、アダプタ320をデータ通信
ネットワークへ接続すると、スキャナー22によって文
書イメージファイルを生成する代わりに、ネットワーク
から現存する文書イメージファイルを受信するのを可能
にする。
【0190】MGDSメッセージ50Cは、構内情報通
信網20を介してAIエラー修正プロセッサ28からデ
ータベースエラー修正プロセッサ30である第2修復ス
テーションに出力される。データベースエラー修正プロ
セッサ30は、ホストコンピュータ34で実行する特定
のアプリケーションに使用される顧客名のデータベース
を含む。本例では、ホストコンピュータ34は、保険会
社のための保険フォームの文書イメージアーカイビング
システムを管理する。保険会社は多くの被保険者の顧客
を有し、被保険者の顧客のリストはデータベースエラー
修正プロセッサ30に含まれる。データベースエラー修
正プロセッサ30に入力されるMGDS50Cに示唆さ
れた文字列を比較することによって、特定のホストコン
ピュータアプリケーションにおいて被保険者の顧客の内
の1人の実際の名前と同じ文字列が選択される。本例に
おいて、MGDS50CはAIエラー修正プロセッサか
らデータベースエラー修正プロセッサ30へ入力され、
第2修復セグメントR2が追加される。第2修復セグメ
ントR2は、プロセッサ30によって実行される第2修
復を特徴付ける。本発明の他の実施例において、データ
ベースエラー修正プロセッサ30は、多重タスクアプリ
ケーションにおける同一のプロセッサ25において、人
工知能エラー修正プロセッサ28と文字認識プロセッサ
26とを組み合わせることができる。
【0191】データベースエラー修正プロセッサ30
は、文字データバッファBから好ましい選択の文字列"J
oan"46を取り、被保険者の顧客名の全てを含むデータ
ベースと比較する。"Joan Doe"と一致しないことが分か
る。次に、データベースエラー修正プロセッサ30は、
MGDS50Cから受信した代替の選択48"John"を取
り、データベースの被保険者の顧客名の比較に"John"を
適用する。"John Doe"を見つけるための比較が成功す
る。この第2修復動作の結果、文字列46"Joan"をもっ
た文字データバッファBの内容は、第2修復セグメント
R2における入力データ修復部分37に転送される。次
に、文字データバッファBの内容に、文字列48"John"
の修復された値が負荷される。
【0192】図10に示されるMGDS50Dは、6個
のフィールドデータセグメントと3個の修復セグメント
を有する。6個のフィールドデータセグメントは、図2
0の抽出されたフィールドイメージ10”において存在
する6個のフィールドに対応する。MGDS50Dのそ
れぞれのフィールドデータセグメントのバッファBは、
抽出されたフィールドイメージ10”の対応するフィー
ルドにおける文字のイメージの内で最良の現在の推定値
である文字列を含む。更に、文字認識修復過程は、3個
の修復セグメントR1、R1’及びR2のフォームに構
成されている。これら3個の修復セグメントの存在は、
それぞれのフィールドデータセグメントの後続の追加の
分析を助ける。これら3個の修復セグメントの存在はま
た、全体の文字認識プロセスを改良するための監査証跡
を提供する。
【0193】エラー修正プロセッサ30は、修復アドレ
ス"30"をセグメントR2に負荷し、この場合、第2セグ
メントR2へのデータベース"DB"である修復IDを負荷
し、セグメントR2の修復タイムスタンプパラメータに
5時4分1秒の修復タイムスタンプを負荷する。実行さ
れる動作はセグメントR2への"DATA BASE" として負荷
され、セグメントR2のフィールド修復包囲パラメータ
が負荷される"FIRST"のフィールド名を有し、"2" の文
字位置が負荷され、変更される文字が文字列の第3番目
の文字であることを示す。データベース照会もまた入力
され、セグメントR2において"customer name" として
特徴付けられる。また、100 %の確信度のレベルがセグ
メントR2に入力されることができる。データベースエ
ラー修正プロセッサ30からの完了したMGDSメッセ
ージ50Dの出力は図6に示される。
【0194】次に、MGDS50Dは構内情報通信網2
0を介して手動検査及び修正プロセッサ32に転送され
る。
【0195】手動検査及び修正プロセッサ32はMGD
S50Dを受信し、第3修復セグメントR3に追加す
る。アプリケーションに応じて、必要な手動検査は、特
定のフィールドにフラグを立てられた文字列を連続修正
することによって実行可能になる。
【0196】データベースエラー修正プロセッサ30か
ら出力され、手動検査及び修正プロセッサ32によって
受信されるMGDSメッセージ50Dは、プロセッサ3
0においてオペレータによって検査されるべき文字デー
タ48"John"を含む。修正プロセッサ32は、第3修復
段階に第3修復セグメントR3を追加し、実際に修復さ
れるか、或いは、単に検査が行われる。修復アドレス"3
2"及びオペレータの識別名"Jones" がセグメントR3に
入力される。また、5時5分15秒の修復タイムスタン
プがセグメントR3に入力される。実行される動作は、
セグメントR3で検査するため"valid" と示される。ア
プリケーションが必要としてよい文字又は全文字列の座
標は、文字認識プロセッサ26によってもともと生成さ
れる拒否文字情報Sから抽出される。これらはフィール
ドのイメージビットマップにおける位置の座標と、文字
認識プロセッサ26によって識別される拒否文字又は疑
わしい文字である。修正プロセッサ32は、これらの座
標値を用いて、オペレータに表示されるように、フィー
ルドを強調表示と拡大の内の少なくとも一方を行う。文
書イメージ10’のコピーは、オペレータが見るため
に、LAN20を介して修正プロセッサ32に渡され
る。拒否された文字又は疑わしい文字の座標によって特
定された位置は、表示される文書イメージの部分を強調
表示と拡大の内の少なくとも一方を行うために用いられ
る。次に、オペレータは、文書イメージの強調表示され
た部分を、プロセッサ32の表示画面上の英数字で表示
される文字列48"John"とすばやく比較する。オペレー
タが文字列48"John"の表示を受入れるならば、検査受
入れがセグメントR3に記録される。検査表示は、セグ
メントR3、例えば、コメント部分の下、に入力される
ことも可能である。
【0197】また、オペレータが、文字列48を文字列
49"JOHN"に変えるため、全ての文字を大文字にする等
の変更を望むならば、本発明に従って、文字列48は文
字データバッファBからセグメントR3の入力データ修
復部分55に転送される。次に、プロセッサ32が修正
された値の文字列49"JOHN"を文字データバッファBに
負荷する。他の適切なフィールドがフィールド名、文字
位置及びコメント等の、セグメントR3に記入される。
【0198】特に、図24の手動検査及び修正プロセス
32Aにおいて、ステップ193でフィールド名68b
がフィールドデータセグメント54Dより得られ、次に
ステップ194でフィールド名68bが修復オペレータ
に表示される。これは本発明に従って、フィールドの実
際の名前をワークステーションのオペレータに提供し、
ここでは対応するフィールドデータセグメントの符号化
データが調べられなければならない。これは、オペレー
タが表示デバイスに表示されるフィールド名を、同じく
表示されているフィールドのイメージと相関させること
ができるため、符号化データをより重要に表示するのを
可能にする。
【0199】手動検査及び修正プロセッサ32は、図1
1に示されるMGDSメッセージ50Eに出力する。図
11に示されるMGDSメッセージ50Eは、6個のフ
ィールドデータセグメントと5個の修復セグメントを有
する。
【0200】図11は、ホストコンピュータ34に出力
されるMGDS50Eのフォームを示す。ホストコンピ
ュータ34は、図18のフォーム10’の6個のフィー
ルドの各々の各フィールドデータセグメントのバッファ
Bの内容を取って、各バッファBの内容を、フォームに
おける対応するフィールドのイメージを表す文字列の最
良の推定値として記憶する。MGDS50Eのフィール
ドセグメント52からの符号化データは、"Doe" として
バッファBに含まれる。この符号化データは、図18の
走査されたフォームイメージ10’の姓のフィールド1
6’を表すので、ホストコンピュータ34により符号化
データ記憶装置35に記憶される。同様に、文字列"JOH
N"を含むフィールドデータセグメント54のバッファB
は、ホストコンピュータ34によって、走査されたフォ
ームイメージ10’の名のフィールド16’を表す文字
列の最良の推定値として、符号化データ記憶装置35に
記憶される。同様に、文字列"Fla" であるフィールドデ
ータセグメント56のバッファBの内容は、図18の操
作されたフォームイメージ10’の州のフィールド12
a’の最良の推定値として、ホストコンピュータ34に
よって符号化データ記憶装置35に記憶される。
【0201】その後、ホストコンピュータ34が、MG
DS50Eの特定のフィールドデータセグメントのバッ
ファBにおける文字列がいかに修復されたかを監査する
よう指示されるならば、そのフィールドの文字認識の修
復の過程は、修復過程記憶装置38からMGDS50E
にアクセスすることによって確認される。監査されるべ
きフィールドに対応するそれぞれの修復セグメントは、
修復がいかに行われたかを調べる。例えば、名のフィー
ルド16’を表す第2フィールドセグメント54では、
文字認識修復の監査によって、フィールドデータセグメ
ント54、修復セグメントR3、修復セグメントR2、
及び修復セグメントR1をその順序で調べる。これは、
MGDS50Eのフィールドデータセグメント54に含
まれるフィールドの最後の最良の推定値から、そのフィ
ールドで実行された修復の順序を後向きに作動すること
を可能にする。そのような監査が全体の修復プロセスを
改良するために行われるならば、修復の各段階がいかに
行われたかという明確な表示は、MGDS50Eの修復
セグメントによって表される集合的な修復過程から明ら
かになる。
【0202】結果となるMGDSメッセージ50Eは、
名のフィールド16の内容について実行される一連の修
復の過程を含んでいる。次に、MGDSメッセージ50
Eは、一時的な記憶のため、LAN20を介してバッフ
ァ記憶装置40’に転送されることができる。また、長
期間の記憶のため修復過程記憶装置38に転送されるこ
とができる。また、ホストコンピュータ34に転送され
て、フィールドセグメント54の符号化データバッファ
Bの内容である文字列49が符号化データ記憶装置35
に負荷されることが可能である。その内容は、例えば、
索引値として使用され、ここでアプリケーションが、被
保険者の顧客名を文書イメージ10’を記憶するための
索引値として使用する。
【0203】手動検査及び修正プロセッサ32は、図2
7のより詳細なアーキテクチャ図に示されている。プロ
セッサ32は、バス422によって、CPU410,バ
ルク記憶装置デバイス412、ディスプレイ及びキーボ
ード414、LANアダプタ416、ファクシミリ及び
ネットワークアダプタ420と接続されたメモリ402
から構成される。LANアダプタ416は、LAN20
をバス422に接続する。FAX及びネットワークアダ
プタ420はファクシミリ電話線をバス422に接続
し、データ通信ネットワークラインをバス422に接続
する。
【0204】プロセッサ32のメモリ402は、上述の
プロセスを行うための実行可能な命令の順序であるコン
ピュータプログラムを含む幾つかの区画を含有する。特
に、手動検査及び修正プログラム32A’はメモリ40
2に記憶され、その命令がCPU410によって実行さ
れると、手動検査及び修正プロセスを実行する。
【0205】メモリ402はまた、図6により詳細に示
されるMGDS50Dを受信し、記憶するための区画も
含む。メモリ402また、フォーム文書イメージ10’
を受信し、記憶するための区画も含む。
【0206】メモリ402はまた表示バッファ区画42
4を有し、ここでフォーム文書イメージ10’は、疑わ
しい文字位置21と拒否された文字位置31において、
フィールドイージ16’に重畳される強調表示された領
域58とアセンブルされる。次に、この合成イメージが
プロセッサ32においてオペレータに表示される。更
に、表示バッファは符号化データ48"John"をアセンブ
ルし、上述のようにオペレータにも表示される。符号化
データ48は、MGDS50Dの符号化データ部分75
の文字データバッファBより得られる。メモリ402の
表示バッファ424は、表示デバイス414に表示され
る内容を有する。オペレータは、代替の文字列49"JOH
N"をキーボードで入力する。
【0207】ホストコンピュータ34は、図29により
詳細に示される。ホストコンピュータ34は、バス52
2によってメモリ502に接続されるCPU510を含
む。文書イメージ記憶装置36がバス522に接続され
る。符号化データ記憶装置35がバス522に接続され
る。ディスプレイ及びキーボード514がバス522に
接続される。構内通信情報網516は、LAN20をバ
ス522に接続する。ネットワークアダプタ520は、
データネットワークをバス522に接続する。メモリ5
02に記憶されたプログラムは、CPU510によって
実行される命令を有する。
【0208】メモリ502は、MGDS50Eを記憶す
るための区画を含む。また、メモリ502には、第1レ
ベルマッピングテーブル550を記憶するための区画
と、第2レベルマッピングテーブル552を記憶するた
めの区画が含まれる。更に、フォルダー適用業務プログ
ラム554を記憶するための区画が設けられ、保険請求
処理アプリケーションプログラム556を記憶するため
の区画が設けられる。
【0209】メモリ502はまた、オブジェクト配布管
理プログラム、DB2データベース管理プログラム、高
度なデータ収集プログラム85、オブジェクトアクセス
方法プログラム、及び通信管理プログラムを含む。オブ
ジェクト配布管理プログラム及びオブジェクトアクセス
方法の動作の原理は、上述の米国特許第5、058、1
85号に記載されている。MVS/ESAオペレーティ
ングシステム504もまた、メモリ502に記憶され
る。
【0210】好ましい実施例において、ホストコンピュ
ータ34はIBMシステム/390又は、大規模データ
処理操作を行うことが可能な他のメインフレームデータ
プロセッサである。しかしながら、ホストコンピュータ
34を、Intel 80386 CPUを用いるIB
M PS/2型80プロセッサ等のより小さなプロセッ
サとして提供することは本発明の範囲内である。知能フ
ォームプロセッサ25は、好ましい実施例において、ホ
ストコンピュータ34と分離したプロセッサであるが、
しかしながら、本発明の範囲において、図1及び図2に
示される全ての処理要素は単一、かつ高機能のプロセッ
サに含まれることが可能である。他の実施例において、
フォーム定義プロセッサ86は、知能フォームプロセッ
サ25と分離したプロセッサであってもよい。これは、
フォーム定義がシステム1ワークステーションで行わ
れ、書き込まれたフォームのフォーム受信及び処理が図
1及び図2に示されるシステムの他のワークステーショ
ンで実行された場合である。
【0211】
【表1】
【0212】
【表2】
【0213】
【発明の効果】結果となる高度なデータ収集アーキテク
チャの本発明は、フォーム上のフィールドの順序、配
置、名前及び数が変更されても、自動的に処理され、そ
れによって、新たな文書フォームを自由に生成すること
を可能にするための手段を提供する。
【図面の簡単な説明】
【図1】本発明の全体のアーキテクチャ図である。
【図2】本発明の全体のアーキテクチャ図である。
【図3】フォーム認識及びフィールド抽出プロセッサ2
4からの機械生成データ構造(MGDS)50Aを示
す。
【図4】文字認識プロセッサ26からのMGDS50B
出力を示す。
【図5】人工知能エラー修正プロセッサ28からの第1
修理セグメントR1出力を含むMGDS50Cを示す。
【図6】データベースエラー修正プロセッサ30からの
第2修理セグメントR2出力を含むMGDS50Dを示
す。
【図7】手動検査及び修正プロセッサ32からの第2修
理セグメントR3出力を含むMGDS50Eを示す。
【図8】文字認識プロセッサ26がフォームの6つの全
てのフィールドにその動作を完了した後のMGDS50
Bを示す。
【図9】人口知能エラー修正プロセッサ28がフォーム
の6つの全てのフィールドにその動作を完了した後のM
GDS50Cを示す。
【図10】データベースエラー修正プロセッサ30がフ
ォームの6つの全てのフィールドにその動作を完了した
後のMGDS50Dを示す。
【図11】手動検査及び修正プロセッサ32がフォーム
の6つの全てのフィールドにその動作を完了した後のM
GDS50Eを示す。
【図12】図14の第1例のフォームにおけるMGDS
50Eを示す。
【図13】図15の第2例のフォームにおけるMGDS
50Eを示す。
【図14】第1例のマスターフォーム10Fを示す。
【図15】第2例のマスターフォーム10ZFを示す。
【図16】第1例において、図14のマスターフォーム
10Fに対応するマスターMGDS50Mを示す。
【図17】第2例において、図15のマスターフォーム
10ZFに対応するマスターMGDS50Mを示す。
【図18】第1例において、文書フォームの走査された
フォームイメージ10’を示す。
【図19】第2例フォームの走査されたフォームイメー
ジ10Z’を示す。
【図20】図18の走査されたフォームイメージから抽
出されたフィールドイメージ10”を示す。
【図21】図18に示される文書フォームイメージ1
0’におけるフィールド16’の処理ステップの順序を
示す。
【図22】フォーム定義プロセス86Aの作動ステップ
の順序のフロー図を示す。
【図23】高度な収集プロセス85Aの作動ステップの
順序のフロー図を示す。
【図24】手動検査及び修正プロセス32Aの作動ステ
ップの順序を示す。
【図25】手動検査及び修正プロセス32Aの作動ステ
ップの順序を示す。
【図26】知能フォームプロセッサ25の詳細なアーキ
テクチャ図を示す。
【図27】図14の第1例において、手動検査及び修正
プロセッサ32の詳細なアーキテクチャ図を示す。
【図28】図15の第2例において、手動検査及び修正
プロセッサ32の詳細なアーキテクチャ図を示す。
【図29】ホストコンピュータ34の詳細なアーキテク
チャ図を示す。
【図30】機械生成データ構造(MGDS)パラメータ
の間の関係を示す。
【図31】MGDSのフォーム情報部分FIを示す。
【図32】MGDSのページ情報部分PIを示す。
【図33】MGDSのフィールド情報形式54Aを示
す。
【図34】MGDSの符号化データ情報部分75を示
す。
【図35】MGDSの拒絶情報部分S又はRを示す。
【符号の説明】
10 文書 22 スキャナー 23 スキャナープロセッサ 24 フォーム認識及びフィールド抽出プロセッサ 25 知能フォームプロセッサ 26 文字認識プロセッサ 28 人工知能エラー修正プロセッサ 30 データベースエラー修正プロセッサ 32 手動検査及び修正プロセッサ 34 ホストコンピュータ 35 符号化データ記憶装置 36 文書イメージ記憶装置 38 修復過程記憶装置 40 バッファ 86 フォーム定義プロセッサ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェイムズ エイチ. バンフォード アメリカ合衆国20879、メリーランド州 ゲイザーズバーグ、ブルー ヴァイオレ ット レイン 18741 (72)発明者 ティモスィー エス. ベッツ アメリカ合衆国20874、メリーランド州 ジャーマンタウン、スキップ ジャック ドライヴ 12113 (72)発明者 ヴァレリー エム. カッラス アメリカ合衆国20895、メリーランド州 ケンシントン、ユニヴァースィティー ブーレヴァード 3333、ナンバー 310 (72)発明者 マイケル シー. コンカー アメリカ合衆国20872、メリーランド州 ダマスカス、ベルヘイヴン ブーレヴァ ード 10824 (72)発明者 マイケル イー. ダレイ アメリカ合衆国20855、メリーランド州 ロックヴィル、ポララ プレイス 7809 (72)発明者 ジェイムズ エム. ホーキンス アメリカ合衆国10552、ニューヨーク州 フリートウッド、ウエスト グランド ストリート 61、アパートメント 1エ イ (72)発明者 ピーター エム. ジャカブ カナダ国、オンタリオ州ミシソーガ、ソ ーミル ヴァレイ ドライヴ 4470 (72)発明者 ルイス ビー. ネクト アメリカ合衆国20832、メリーランド州 オルネイ、ジョン カーロール ドライ ヴ 3801 (72)発明者 フレドリック ダブリュー. クラトク ヴィル アメリカ合衆国21754、メリーランド州 イジャムスヴィル、カナリー ドライヴ 11384ビー (72)発明者 シン−ヤ リウ アメリカ合衆国20850、メリーランド州 ロックヴィル、ポメル ドライヴ 14619 (72)発明者 トーマス エル. ポールソン アメリカ合衆国20854、メリーランド州 ポトマック、スリーピー ホロウ レイ ン 8749 (72)発明者 ドレイスウェミー ラジャゴパル アメリカ合衆国20879、メリーランド州 ゲイザーズバーグ、ケイネブレイク コ ート 20000 (72)発明者 マノジ ケイ. ティワリ アメリカ合衆国20874、メリーランド州 ジャーマンタウン、ニーアウインダー プレイス 13336 (56)参考文献 特開 昭57−176482(JP,A) 特開 昭61−59568(JP,A) 特開 昭63−155386(JP,A) 特表 平3−504423(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06K 9/20 G06K 9/00

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 データ処理システムにおいて、文書フォ
    ームのデジタルイメージのフィールドから符号化データ
    列を収集するための高度なデータ収集方法であって、 前記データ処理システムの第1アプリケーションプログ
    ラムのための第1複数のプログラム変数を定義するステ
    ップと、 フィールド関連リストを複数のフィールド関連名からな
    るものとして定義するステップと、前記データ処理システム中に第1マッピングテーブルを
    形成するステップであって、該テーブルによって、第1
    複数のフィールド関連名が前記第1複数のプログラム変
    数と関連付けられるものと、 前記データ処理システム中の前記フィールド関連リスト
    から第1フィールド関連名を選択し、第1フィールド名
    を入力し、前記文書フォームの第1フィールドのための
    第1フィールドデータセグメント中において、前記第1
    フィールド関連名と前記第1フィールド名を関連付ける
    ことによって、文書フォームの文書フォーム情報をアセ
    ンブルするステップと、 前記文書フォームのデジタルイメージを入力し、前記第
    1フィールドに文字認識動作を実行し、前記第1フィー
    ルドから第1認識符号化データを導出し、第1認識符号
    化データを前記第1データセグメントに転送するステッ
    プと、 前記第1フィールドデータセグメントを含むデータ構造
    を形成するステップと、 前記データ処理システムにおける前記データ構造の前記
    第1データセグメントから前記第1フィールド関連名を
    抽出し、前記第1マッピングテーブルで対応する第1プ
    ログラム変数を調べるため前記第1フィールド関連名を
    使用するステップと、 前記第1プログラム変数を、前記データ処理システムに
    おける前記第1フィールドデータセグメントの前記第
    1認識符号化データ等しくなるように設定するステッ
    プと、 前記第1認識符号化データを用いて、前記第1アプリケ
    ーションプログラムを実行するステップと、 から成る高度なデータ収集方法。
  2. 【請求項2】 データ処理システムにおいて、文書フォ
    ームのデジタルイメージのフィールドから符号化データ
    列を収集するための高度なデータ収集方法であって、 前記データ処理システムの第1アプリケーションプログ
    ラムのための第1複数のプログラム変数を定義するステ
    ップであって、前記第1アプリケーションプログラムが
    他のアプリケーションプログラムに操作環境を提供する
    ものと、 前記データ処理システムの第2アプリケーションプログ
    ラムのための第2複数のプログラム変数を定義するステ
    ップであって、前記第2アプリケーションプログラムが
    前記第1アプリケーションプログラムによって提供され
    る前記操作環境を用いるものと、 フィールド関連リストを複数のフィールド関連名からな
    るものとして定義するステップと、前記データ処理システム中に第1マッピングテーブルを
    形成するステップであって、該テーブルによって、第1
    複数のフィールド関連名が前記第1複数のプログラム変
    数と関連付けられるものと、 前記データ処理システム中に第2マッピングテーブルを
    形成するステップであって、該テーブルによって、第2
    複数のフィールド関連名が前記第2複数のプログラム変
    数と関連付けられるものと、 前記データ処理システム中の前記フィールド関連リスト
    から第1フィールド関連名を選択し、第1フィールド名
    を入力し、前記文書フォームの第1フィールドのための
    第1フィールドデータセグメント中において、前記第1
    フィールド関連名と前記第1フィールド名を関連付ける
    ことによって、文書フォームの文書フォーム情報をアセ
    ンブルするステップと、 前記データ処理システム中の前記フィールド関連リスト
    から第2フィールド関連名を選択し、第2フィールド名
    を入力し、前記文書フォームの第2フィールドのための
    第2フィールドデータセグメント中において、前記第2
    フィールド関連名と前記第2フィールド名を関連付ける
    ことによって、前記文書フォーム情報を更にアセンブル
    するステップと、 前記文書フォームのデジタルイメージを入力し、前記第
    1フィールドに文字認識動作を実行し、前記第1フィー
    ルドから第1認識符号化データを導出し、第1認識符号
    化データを前記第1データセグメントに転送するステッ
    プと、 前記第2フィールドに文字認識動作を実行し、前記第2
    フィールドから第2認識符号化データを導出し、第2認
    識符号化データを前記第2データセグメントに転送する
    ステップと、 前記第1フィールドデータセグメント及び前記第2フィ
    ールドデータセグメントを含むデータ構造を形成するス
    テップと、 前記データ処理システムの前記データ構造の前記第1デ
    ータセグメントから前記第1フィールド関連名を抽出
    し、前記第1マッピングテーブルで対応する第1プログ
    ラム変数を調べるため前記第1フィールド関連名を使用
    するステップと、 前記第1プログラム変数を、前記データ処理システムに
    おける前記第1フィールドデータセグメントの前記第
    1認識符号化データ等しくなるように設定し、前記第
    1認識符号化データを用いて、前記第1アプリケーショ
    ンプログラムを実行するステップと、 前記データ処理システムの前記データ構造の前記第2デ
    ータセグメントから前記第2フィールド関連名を抽出
    し、前記第2マッピングテーブルで対応する第2プログ
    ラム変数を調べるため前記第2フィールド関連名を使用
    するステップと、 前記第2プログラム変数を、前記データ処理システムに
    おける前記第2フィールドデータセグメントの前記第
    2認識符号化データ等しくなるように設定し、前記第
    2認識符号化データを用いて、前記第2アプリケーショ
    ンプログラムを実行するステップと、 から成る高度なデータ収集方法。
  3. 【請求項3】 データ処理システムにおいて、文書フォ
    ームのデジタルイメージのフィールドから符号化データ
    列を収集するための高度なデータ収集方法であって、 第1データプロセッサの第1アプリケーションプログラ
    のための第1複数のプログラム変数を定義するステッ
    プと、 フィールド関連リストを複数のフィールド関連名からな
    るものとして定義するステップと、前記データ処理システム中に第1マッピングテーブルを
    形成するステップであって、該テーブルによって、第1
    複数のフィールド関連名が前記第1複数のプログラム変
    数と関連付けられるものと、 前記フィールド関連リストにアクセスし、前記第1デー
    タプロセッサに結合される第2データプロセッサにおい
    て前記フィールド関連リストを記憶するステップと、 前記第2データプロセッサ中の前記フィールド関連リス
    トから第1フィールド関連名を選択し、第1フィールド
    名を入力し、前記文書フォームの第1フィールドのため
    の第1フィールドデータセグメント中において、前記第
    1フィールド関連名と前記第1フィールド名を関連付け
    ることによって、文書フォームの文書フォーム情報をア
    センブルするステップと、 前記文書フォームのデジタルイメージを入力し、前記第
    1フィールドに文字認識動作を実行し、前記第1フィー
    ルドから第1認識符号化データを導出し、第1認識符号
    化データを前記第1データセグメントに転送するステッ
    プと、 前記第1フィールドデータセグメントを含むデータ構造
    を形成し、前記データ構造を前記第1データプロセッサ
    に伝送するステップと、 前記第1データプロセッサにおける前記データ構造の前
    記第1データセグメントから前記第1フィールド関連名
    を抽出し、前記第1マッピングテーブルで対応する第1
    プログラム変数を調べるため前記第1フィールド関連名
    を使用するステップと、 前記第1プログラム変数を、前記第1データプロセッサ
    における前記第1フィールドデータセグメントの前記
    第1認識符号化データ等しくなるように設定するステ
    ップと、 前記第1認識符号化データを用いて、前記第1アプリケ
    ーションプログラムを実行するステップと、 から成る高度なデータ収集方法。
  4. 【請求項4】 データ処理システムにおいて、文書フォ
    ームのデジタルイメージのフィールドから符号化データ
    列を収集するための高度なデータ収集方法であって、 第1データプロセッサの第1アプリケーションプログラ
    のための第1複数のプログラム変数を定義するステッ
    プであって、前記第1アプリケーションプログラムが他
    のアプリケーションプログラムに操作環境を提供する
    と、 前記第1データプロセッサの第2アプリケーションプロ
    グラムのための第2複数のプログラム変数を定義するス
    テップであって、前記第2アプリケーションプログラム
    が前記第1アプリケーションプログラムによって提供さ
    れる操作環境を用いるものと、 フィールド関連リストを複数のフィールド関連名からな
    るものとして定義するステップと、前記第1データプロセッサ中に第1マッピングテーブル
    を形成するステップであって、該テーブルによって、第
    1複数のフィールド関連名が前記第1複数のプログラム
    変数と関連付けられるものと、 前記第1データプロセッサ中に第2マッピングテーブル
    を形成するステップであって、該テーブルによって、第
    2複数のフィールド関連名が前記第2複数のプログラム
    変数と関連付けられるものと、 前記フィールド関連リストにアクセスし、前記第1デー
    タプロセッサに結合される第2データプロセッサに前記
    フィールド関連リストを記憶するステップと、 前記第2データプロセッサ中の前記フィールド関連リス
    トから第1フィールド関連名を選択し、第1フィールド
    名を入力し、前記文書フォームの第1フィールドのため
    の第1フィールドデータセグメント中において、前記第
    1フィールド関連名と前記第1フィールド名を関連付け
    ることによって、文書フォームの文書フォーム情報をア
    センブルするステップと、 前記第2データプロセッサ中の前記フィールド関連リス
    トから第2フィールド関連名を選択し、第2フィールド
    名を入力し、前記文書フォームの第2フィールドのため
    の第2フィールドデータセグメント中において、前記第
    2フィールド関 連名と前記第2フィールド名を関連付け
    ることによって、前記文書フォーム情報を更にアセンブ
    ルするステップと、 前記文書フォームのデジタルイメージを入力し、前記第
    1フィールドに文字認識動作を実行し、前記第1フィー
    ルドから第1認識符号化データを導出し、第1認識符号
    化データを前記第1データセグメントに転送するステッ
    プと、 前記第2フィールドに文字認識動作を実行し、前記第2
    フィールドから第2認識符号化データを導出し、第2認
    識符号化データを前記第2データセグメントに転送する
    ステップと、 前記第1フィールドデータセグメント及び前記第2フィ
    ールドデータセグメントを含むデータ構造を形成し、前
    記データ構造を前記第1データプロセッサに伝送するス
    テップと、 前記第1データプロセッサにおける前記データ構造の前
    記第1データセグメントから前記第1フィールド関連名
    を抽出し、前記第1マッピングテーブルで対応する第1
    プログラム変数を調べるため前記第1フィールド関連名
    を使用するステップと、 前記第1プログラム変数を、前記第1プロセッサにおけ
    る前記第1フィールドデータセグメントの前記第1認
    識符号化データ等しくなるように設定し、前記第1認
    識符号化データを用いて、前記第1アプリケーションプ
    ログラムを実行するステップと、 前記第1データプロセッサにおける前記データ構造の前
    記第2データセグメントから前記第2フィールド関連名
    を抽出し、前記第2マッピングテーブルで対応する第2
    プログラム変数を調べるため前記第2フィールド関連名
    を使用するステップと、 前記第2プログラム変数を、前記第1プロセッサにおけ
    る前記第2フィールドデータセグメントの前記第2認
    識符号化データ等しくなるように設定し、前記第2認
    識符号化データを用いて、前記第2アプリケーションプ
    ログラムを実行するステップと、 から成る高度なデータ収集方法。
  5. 【請求項5】 データ処理システムにおいて、文書フォ
    ームのデジタルイメージのフィールドから符号化データ
    列を収集するための高度なデータ収集方法であって、 第1データプロセッサの第1アプリケーションプログラ
    のための第1複数のプログラム変数を定義するステッ
    プと、 フィールド関連リストを複数のフィールド関連名からな
    るものとして定義するステップと、前記第1データプロセッサ中に第1マッピングテーブル
    を形成するステップであって、該テーブルによって、第
    1複数のフィールド関連名が前記第1複数のプログラム
    変数と関連付けられるものと、 前記フィールド関連リストにアクセスし、前記第1デー
    タプロセッサに結合される第2データプロセッサに前記
    フィールド関連リストを記憶するステップと、 前記第2データプロセッサ中の前記フィールド関連リス
    トから第1フィールド関連名を選択し、第1フィールド
    名を入力し、前記文書フォームの第1フィールドのため
    の第1フィールドデータセグメント中において、前記第
    1フィールド関連名と前記第1フィールド名を関連付け
    ることによって、文書フォームの文書フォーム情報をア
    センブルするステップと、 前記第2データプロセッサ中の前記フィールド関連リス
    トから第2フィールド関連名を選択し、第2フィールド
    名を入力し、前記文書フォームの第2フィールドのため
    の第2フィールドデータセグメント中において、前記第
    2フィールド関連名と前記第2フィールド名を関連付け
    ることによって、前記文書フォーム情報を更にアセンブ
    ルするステップと、 前記文書フォームのデジタルイメージを入力し、前記第
    1フィールドに文字認識動作を実行し、前記第1フィー
    ルドから第1認識符号化データを導出し、第1認識符号
    化データを前記第1データセグメントに転送するステッ
    プと、 前記第2フィールドに文字認識動作を実行し、前記第2
    フィールドから第2認識符号化データを導出し、第2認
    識符号化データを前記第2データセグメントに転送する
    ステップと、 前記第1フィールドデータセグメント及び前記第2フィ
    ールドデータセグメントを含むデータ構造を形成し、前
    記データ構造を前記第1データプロセッサに伝送するス
    テップと、 前記第1データプロセッサにおける前記データ構造の前
    記第1データセグメントから前記第1フィールド関連名
    を抽出し、前記第1マッピングテーブルで対応する第1
    プログラム変数を調べるため前記第1フィールド関連名
    を使用するステップと、 前記第1プログラム変数を、前記第1プロセッサにおけ
    る前記第1フィールドデータセグメントの前記第1認
    識符号化データ等しくなるように設定するステップ
    と、 前記第1データプロセッサにおける前記データ構造の前
    記第2データセグメントから前記第2フィールド関連名
    を抽出し、前記第1マッピングテーブルで対応する第2
    プログラム変数を調べるため前記第2フィールド関連名
    を使用するステップと、 前記第2プログラム変数を、前記第1プロセッサにおけ
    る前記第2フィールドデータセグメントの前記第2認
    識符号化データ等しくなるように設定するステップ
    と、 前記第1認識符号化データと前記第2認識符号化データ
    を用いて、前記第1アプリケーションプログラムを実行
    するステップと、 から成る高度なデータ収集方法。
  6. 【請求項6】 データ処理システムであって、文書フォ
    ームのデジタルイメージのフィールドから符号化データ
    列を収集するための高度なデータ収集方法を実行し、 前記データ処理システムにおいて第1アプリケーション
    プログラムのための第1複数のプログラム変数を定義す
    る手段と、 フィールド関連リストを複数のフィールド関連名からな
    るものとして定義する手段と、前記データ処理システム中に第1マッピングテーブルを
    形成する手段であって、該テーブルによって、第1複数
    のフィールド関連名が前記第1複数のプログラム変数と
    関連付けられるものと、 前記データ処理システム中の前記フィールド関連リスト
    から第1フィールド関連名を選択し、第1フィールド名
    を入力し、前記文書フォームの第1フィールドのための
    第1フィールドデータセグメント中において、前記第1
    フィールド関連名と前記第1フィールド名を関連付ける
    ことによって、文書フォームの文書フォーム情報をアセ
    ンブルする手段と、 前記文書フォームのデジタルイメージを入力し、前記第
    1フィールドに文字認識動作を実行し、前記第1フィー
    ルドから第1認識符号化データを導出し、第1認識符号
    化データを前記第1データセグメントに転送する手段
    と、 前記第1フィールドデータセグメントを含むデータ構造
    を形成する手段と、 前記データ処理システムにおける前記データ構造の前記
    第1データセグメントから前記第1フィールド関連名を
    抽出し、前記第1マッピングテーブルで対応する第1プ
    ログラム変数を調べるため前記第1フィールド関連名を
    使用する手段と、 前記第1プログラム変数を、前記データ処理システムに
    おける前記第1フィールドデータセグメントの前記第
    1認識符号化データ等しくなるように設定する手段
    と、 前記第1認識符号化データを用いて、前記第1アプリケ
    ーションプログラムを実行する手段と、 から成るデータ処理システム。
  7. 【請求項7】 文書フォームのデジタルイメージにおい
    てフィールドから符号化データ列を収集するためのデー
    タ処理システムであって、 第1アプリケーションプログラムのための第1複数のプ
    ログラム変数を定義するための、前記データ処理システ
    ムにおける第1データプロセッサ、 を備え、 前記第1データプロセッサがフィールド関連リストを複
    数のフィールド関連名からなるものとして定義し、 前記第1データプロセッサが、第1複数のフィールド関
    連名が前記第1複数のプログラム変数と関連付けられる
    ように、第1マッピングテーブルを形成し、 前記第1データプロセッサに結合され、前記フィールド
    関連リストにアクセスするための、前記データ処理シス
    テムにおける第2データプロセッサ、 を更に備え、 前記第2データプロセッサが、前記フィールド関連リス
    トから第1フィールド関連名を選択し、第1フィールド
    名を入力し、前記文書フォームの第1フィールドのため
    の第1フィールドデータセグメント中において、前記第
    1フィールド関連名と前記第1フィールド名を関連付け
    ることによって、文書フォームの文書フォーム情報をア
    センブルし、 前記第2データプロセッサが、前記文書フォームのデジ
    タルイメージを入力し、前記第1フィールドに文字認識
    動作を実行し、前記第1フィールドから第1認識符号化
    データを導出し、第1認識符号化データを前記第1デー
    タセグメントに転送し、 前記第2データプロセッサが、前記第1フィールドデー
    タセグメントを含むデータ構造を形成し、前記データ構
    造を前記第1データプロセッサに伝送し、 前記第1データプロセッサが、前記データ構造の前記第
    1データセグメントから前記第1フィールド関連名を抽
    出し、前記第1マッピングテーブルで対応する第1プロ
    グラム変数を調べるため前記第1フィールド関連名を使
    用し、 前記第1データプロセッサが、前記第1プログラム変数
    を、前記第1フィールドデータセグメントの前記第1
    認識符号化データ等しくなるように設定し、 前記第1データプロセッサが、前記第1認識符号化デー
    タを用いて前記第1アプリケーションプログラムを実行
    する、 ことより成るデータ処理システム。
  8. 【請求項8】 文書フォームのデジタルイメージにおい
    てフィールドから符号化データ列を収集するためのデー
    タ処理システムであって、 第1アプリケーションプログラムのための第1複数のプ
    ログラム変数を定義するための、前記データ処理システ
    ムにおける第1データプロセッサ、 を備え、 前記第1データプロセッサがフィールド関連リストを複
    数のフィールド関連名からなるものとして定義し、 前記第1データプロセッサが、第1複数のフィールド関
    連名が前記第1複数のプログラム変数と関連付けられる
    ように、第1マッピングテーブルを形成し、 前記第1データプロセッサに結合され、前記フィールド
    関連リストにアクセスするための、前記データ処理シス
    テムにおける第2データプロセッサ、 を更に備え、 前記第2データプロセッサが、前記フィールド関連リス
    トから第1フィールド関連名を選択し、第1フィールド
    名を入力し、前記文書フォームの第1フィールドのため
    の第1フィールドデータセグメント中において、前記第
    1フィールド関連名と前記第1フィールド名を関連付け
    ることによって、文書フォームの文書フォーム情報をア
    センブルし、 前記第2データプロセッサが、前記文書フォームのデジ
    タルイメージを入力し、前記第1フィールドに文字認識
    動作を実行し、前記第1フィールドから第1認識符号化
    データを導出し、第1認識符号化データを前記第1デー
    タセグメントに転送し、 前記第2データプロセッサが、前記第1フィールドデー
    タセグメントを含むデータ構造を形成し、 前記第2データプロセッサに結合され、検査及びエラー
    修正のため前記第1認識符号化データを表示するため
    の、前記データ処理システムにおける第3データプロセ
    ッサ、 を更に備え、 前記第3データプロセッサが、前記第2データプロセッ
    サから前記データ構造を受信し、前記データ構造の前記
    第1データセグメントから前記第1フィールド名を抽出
    し、かつ前記第1フィールド名と前記第1認識符号化デ
    ータを表示し、 前記第3データプロセッサが、前記第1認識符号化デー
    タにエラー修正を行い、第1修復された符号化データを
    生成し、前記第1修復されたデータを前記データ構造の
    前記第1フィールドデータセグメントに転送し、修復さ
    れたデータ構造を形成し、 前記データ処理システムにおける第1データプロセッサ
    が、前記第3データプロセッサに結合され、前記修復さ
    れたデータ構造を受信し、 前記第1データプロセッサが、前記修復されたデータ構
    造の前記第1データセグメントから前記第1フィールド
    関連名を抽出し、前記第1マッピングテーブルで対応す
    る第1プログラム変数を調べるため前記第1フィールド
    関連名を使用し、 前記第1データプロセッサが、前記第1プログラム変数
    を、前記第1フィールドデータセグメントの前記第1
    修復された符号化データ等しくなるように設定し、 前記第1データプロセッサが、前記第1修復された符号
    化データを用いて前記第1アプリケーションプログラム
    を実行する、 ことより成るデータ処理システム。
JP5060368A 1992-04-30 1993-03-19 高度なデータ収集方法及びデータ処理システム Expired - Fee Related JP2968145B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/876,279 US5235654A (en) 1992-04-30 1992-04-30 Advanced data capture architecture data processing system and method for scanned images of document forms
US876279 1997-06-16

Publications (2)

Publication Number Publication Date
JPH0696276A JPH0696276A (ja) 1994-04-08
JP2968145B2 true JP2968145B2 (ja) 1999-10-25

Family

ID=25367345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5060368A Expired - Fee Related JP2968145B2 (ja) 1992-04-30 1993-03-19 高度なデータ収集方法及びデータ処理システム

Country Status (3)

Country Link
US (1) US5235654A (ja)
EP (1) EP0567834A3 (ja)
JP (1) JP2968145B2 (ja)

Families Citing this family (169)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5178063A (en) 1986-12-16 1993-01-12 L & C Family Partnership Method and apparatus for automatic numbering of forms on a rotary printing press
DE69328702T2 (de) * 1992-03-30 2000-10-26 Canon Kk Gerät und Verfahren zur Bildverarbeitung
JP3134505B2 (ja) * 1992-05-29 2001-02-13 カシオ計算機株式会社 伝票処理装置
JP3792733B2 (ja) * 1993-01-18 2006-07-05 キヤノン株式会社 サーバー装置および制御方法
US6411972B1 (en) * 1993-04-08 2002-06-25 International Business Machines Corporation Method and apparatus for filling in forms by segments using a scanner and a printer
WO1995003569A2 (en) * 1993-07-16 1995-02-02 Lawlor Patrick M Method for determining primary and secondary sources of health insurance coverage
US5428694A (en) * 1993-10-14 1995-06-27 International Business Machines Corporation Data processing system and method for forms definition, recognition and verification of scanned images of document forms
US5555325A (en) * 1993-10-22 1996-09-10 Lockheed Martin Federal Systems, Inc. Data capture variable priority method and system for managing varying processing capacities
CA2134255C (en) * 1993-12-09 1999-07-13 Hans Peter Graf Dropped-form document image compression
AU1435795A (en) * 1993-12-15 1995-07-03 Supercomm, Inc. Database versioning with output only of data changed from the previous version
EP0667594A3 (en) * 1994-02-14 1995-08-23 International Business Machines Corporation Image quality analysis method and apparatus
US5634054A (en) * 1994-03-22 1997-05-27 General Electric Company Document-based data definition generator
IES61092B2 (en) * 1994-03-25 1994-09-21 Gist Limited Automated forms processing
US5530961A (en) * 1994-04-21 1996-06-25 Janay; Gad Terminal emulator enhancer with local configurability
JPH0877155A (ja) * 1994-07-07 1996-03-22 Sanyo Electric Co Ltd 情報処理装置及び情報処理方法
US5619708A (en) * 1994-10-25 1997-04-08 Korteam International, Inc. System and method for generating database input forms
JPH08207380A (ja) * 1994-11-25 1996-08-13 Xerox Corp オリジナルフォームに自動的に記入する方法及び装置
US5758341A (en) * 1995-01-17 1998-05-26 Anthem Healthcare Solutions, Inc. Automated transaction processing system and process with emulation of human error resolution
US5729665A (en) 1995-01-18 1998-03-17 Varis Corporation Method of utilizing variable data fields with a page description language
US6243172B1 (en) 1995-01-18 2001-06-05 Varis Corporation Method and system for merging variable text and images into bitmaps defined by a page description language
US5729741A (en) * 1995-04-10 1998-03-17 Golden Enterprises, Inc. System for storage and retrieval of diverse types of information obtained from different media sources which includes video, audio, and text transcriptions
US5784562A (en) * 1995-10-10 1998-07-21 U S West Advanced Technologies, Inc. System for using a dialog session context to process electronic forms data on the world wide web
US5911141A (en) * 1995-11-07 1999-06-08 International Business Machines Corporation On-line hierarchical form records identification
US5923792A (en) * 1996-02-07 1999-07-13 Industrial Technology Research Institute Screen display methods for computer-aided data entry
US6003007A (en) * 1996-03-28 1999-12-14 Dirienzo; Andrew L. Attachment integrated claims system and operating method therefor
US9619841B2 (en) 1996-03-28 2017-04-11 Integrated Claims Systems, Llc Systems to assist in the creation, transmission, and processing of health insurance claims
US5784487A (en) * 1996-05-23 1998-07-21 Xerox Corporation System for document layout analysis
US5973665A (en) * 1996-11-07 1999-10-26 International Business Machines Corporation Temporally invasive display guide
US5784635A (en) * 1996-12-31 1998-07-21 Integration Concepts, Inc. System and method for the rationalization of physician data
US7302438B1 (en) 1997-07-18 2007-11-27 Tesseron Ltd. Method and system for flowing data to an arbitrary path defined by a page description language
US6028970A (en) * 1997-10-14 2000-02-22 At&T Corp Method and apparatus for enhancing optical character recognition
US6891972B2 (en) * 1997-12-19 2005-05-10 Canon Kabushiki Kaisha Communication system and control method thereof, and computer-readable memory
US6377704B1 (en) 1998-04-30 2002-04-23 Xerox Corporation Method for inset detection in document layout analysis
US6044375A (en) * 1998-04-30 2000-03-28 Hewlett-Packard Company Automatic extraction of metadata using a neural network
US7228282B1 (en) 1998-09-11 2007-06-05 Lv Partners, L.P. Method and apparatus for directing an existing product code to a remote location
US7379901B1 (en) 1998-09-11 2008-05-27 Lv Partners, L.P. Accessing a vendor web site using personal account information retrieved from a credit card company web site
US7191247B1 (en) 1998-09-11 2007-03-13 Lv Partners, Lp Method for connecting a wireless device to a remote location on a network
US6758398B1 (en) 1998-09-11 2004-07-06 L.V. Partners, L.P. Optical reader with ultraviolet wavelength capability
US6688522B1 (en) 1998-09-11 2004-02-10 L. V. Partners, L.P. Unique bar code
US6701354B1 (en) 1998-09-11 2004-03-02 L. V. Partners, L.P. Method for interconnecting two locations over a network in response to using a tool
US6836799B1 (en) 1998-09-11 2004-12-28 L.V. Partners, L.P. Method and apparatus for tracking user profile and habits on a global network
US7392312B1 (en) 1998-09-11 2008-06-24 Lv Partners, L.P. Method for utilizing visual cue in conjunction with web access
US8712835B1 (en) 1998-09-11 2014-04-29 Rpx Corporation Method and apparatus for linking a web browser link to a promotional offer
US7818423B1 (en) 1998-09-11 2010-10-19 RPX-LV Acquisition, LLC Retrieving personal account information from a web site by reading a credit card
US6636896B1 (en) * 1998-09-11 2003-10-21 Lv Partners, L.P. Method and apparatus for utilizing an audibly coded signal to conduct commerce over the internet
US6704864B1 (en) 1999-08-19 2004-03-09 L.V. Partners, L.P. Automatic configuration of equipment software
US6643692B1 (en) 1998-09-11 2003-11-04 Lv Partners, L.P. Method for controlling a computer using an embedded unique code in the content of video tape media
US7159037B1 (en) 1998-09-11 2007-01-02 Lv Partners, Lp Method and apparatus for utilizing an existing product code to issue a match to a predetermined location on a global network
US7392945B1 (en) 1998-09-11 2008-07-01 Lv Partners, L.P. Portable scanner for enabling automatic commerce transactions
US6928413B1 (en) 1998-09-11 2005-08-09 L.V. Partners, L.P. Method of product promotion
US7117240B1 (en) 1998-09-11 2006-10-03 Lv Partners, Lp Method and apparatus for launching a web site with non-standard control input device
US6829650B1 (en) 1998-09-11 2004-12-07 L. V. Partners, L.P. Method and apparatus for opening and launching a web browser in response to an audible signal
US6961555B1 (en) 1998-09-11 2005-11-01 L.V. Partners, L.P. System and apparatus for connecting a wireless device to a remote location on a network
US6697949B1 (en) 1998-09-11 2004-02-24 L.V. Partner, L.P. Method and apparatus for controlling a user's pc through an audio-visual broadcast to archive information in the users pc
US7493283B1 (en) 1998-09-11 2009-02-17 Rpx-Lv Acquisition Llc Performing an e-commerce transaction from credit card account information retrieved from a credit card company web site
US6745234B1 (en) 1998-09-11 2004-06-01 Digital:Convergence Corporation Method and apparatus for accessing a remote location by scanning an optical code
US6708208B1 (en) 1998-09-11 2004-03-16 L.V. Partners, L.P. Unique bar code for indicating a link between a product and a remote location on a web network
US7930213B1 (en) 1998-09-11 2011-04-19 Rpx-Lv Acquisition Llc Method and apparatus for completing, securing and conducting an E-commerce transaction
US7321941B1 (en) 1998-09-11 2008-01-22 Lv Partners, L.P. Network routing utilizing a product code
US6384744B1 (en) 1998-09-11 2002-05-07 Digital:Convergence Corp. Method and system for data transmission from an optical reader
US6970914B1 (en) 1998-09-11 2005-11-29 L. V. Partners, L.P. Method and apparatus for embedding routing information to a remote web site in an audio/video track
US6631404B1 (en) 1998-09-11 2003-10-07 Lv Partners, L.P. Method and system for conducting a contest using a network
US6594705B1 (en) * 1998-09-11 2003-07-15 Lv Partners, L.P. Method and apparatus for utilizing an audibly coded signal to conduct commerce over the internet
US7370114B1 (en) 1998-09-11 2008-05-06 Lv Partners, L.P. Software downloading using a television broadcast channel
US6629133B1 (en) 1998-09-11 2003-09-30 Lv Partners, L.P. Interactive doll
US8028036B1 (en) 1998-09-11 2011-09-27 Rpx-Lv Acquisition Llc Launching a web site using a passive transponder
US6725260B1 (en) * 1998-09-11 2004-04-20 L.V. Partners, L.P. Method and apparatus for configuring configurable equipment with configuration information received from a remote location
US6843417B1 (en) 1998-09-11 2005-01-18 L. V. Partners, L.P. Aiming indicia for a bar code and method of use
US7792696B1 (en) 1998-09-11 2010-09-07 RPX-LV Acquisition, LLC Method and apparatus for allowing a broadcast to remotely control a computer
US6526449B1 (en) 1998-09-11 2003-02-25 Digital Convergence Corporation Method and apparatus for controlling a computer from a remote location
US6845388B1 (en) 1998-09-11 2005-01-18 L. V. Partners, L.P. Web site access manual of a character string into a software interface
US6860424B1 (en) 1998-09-11 2005-03-01 L.V. Partners, L.P. Optical reader and use
US7900224B1 (en) 1998-09-11 2011-03-01 Rpx-Lv Acquisition Llc Method and apparatus for utilizing an audible signal to induce a user to select an E-commerce function
US7424521B1 (en) 1998-09-11 2008-09-09 Lv Partners, L.P. Method using database for facilitating computer based access to a location on a network after scanning a barcode disposed on a product
US6970916B1 (en) 1998-09-11 2005-11-29 L. V. Partners, L.P. Method for conducting a contest using a network
US6636892B1 (en) * 1998-09-11 2003-10-21 Lv Partners, L.P. Method for conducting a contest using a network
US6868433B1 (en) 1998-09-11 2005-03-15 L.V. Partners, L.P. Input device having positional and scanning capabilities
US7386600B1 (en) * 1998-09-11 2008-06-10 Lv Partners, L.P. Launching a web site using a personal device
US6757715B1 (en) * 1998-09-11 2004-06-29 L.V. Partners, L.P. Bar code scanner and software interface interlock for performing encrypted handshaking and for disabling the scanner in case of handshaking operation failure
US6829646B1 (en) * 1999-10-13 2004-12-07 L. V. Partners, L.P. Presentation of web page content based upon computer video resolutions
US6622165B1 (en) 1998-09-11 2003-09-16 Lv Partners, L.P. Method and apparatus for allowing a remote site to interact with an intermediate database to facilitate access to the remote site
US6615268B1 (en) 1998-09-11 2003-09-02 Lv Partners, L.P. Method for controlling a computer using an embedded unique code in the content of dat media
US7043536B1 (en) 1998-09-11 2006-05-09 Lv Partners, L.P. Method for controlling a computer using an embedded unique code in the content of CD media
US7284066B1 (en) 1998-09-11 2007-10-16 Lv Partners, Lp Method and apparatus for matching a user's use profile in commerce with a broadcast
US7010577B1 (en) 1998-09-11 2006-03-07 L. V. Partners, L.P. Method of controlling a computer using an embedded unique code in the content of DVD media
US7440993B1 (en) 1998-09-11 2008-10-21 Lv Partners, L.P. Method and apparatus for launching a web browser in response to scanning of product information
US6791588B1 (en) 1998-09-11 2004-09-14 L.V. Partners, L.P. Method for conducting a contest using a network
US7493384B1 (en) 1998-09-11 2009-02-17 Rpx-Lv Acquisition Llc Controlling a PC using a tone from a cellular telephone
US6754698B1 (en) 1998-09-11 2004-06-22 L. V. Partners, L.P. Method and apparatus for accessing a remote location with an optical reader having a dedicated memory system
US7536478B2 (en) 1998-09-11 2009-05-19 Rpx-Lv Acquisition Llc Method and apparatus for opening and launching a web browser in response to an audible signal
US6973438B1 (en) 1998-09-11 2005-12-06 L.V. Partners, L.P. Method and apparatus for delivering information from a remote site on a network based on statistical information
US6701369B1 (en) 1998-09-11 2004-03-02 L.V. Partners, L.P. Method and apparatus for accessing a remote location by sensing a machine-resolvable code
US6823388B1 (en) * 1998-09-11 2004-11-23 L.V. Parners, L.P. Method and apparatus for accessing a remote location with an optical reader having a programmable memory system
US6826592B1 (en) * 1998-09-11 2004-11-30 L.V. Partners, L.P. Digital ID for selecting web browser and use preferences of a user during use of a web application
US6792452B1 (en) 1998-09-11 2004-09-14 L.V. Partners, L.P. Method for configuring a piece of equipment with the use of an associated machine resolvable code
US7315979B1 (en) 1998-11-09 2008-01-01 Tesseron Ltd. Method and system for dynamic flowing data to an arbitrary path defined by a page description language
US7038797B1 (en) 1999-05-25 2006-05-02 Silverbrook Research Pty Ltd Method and system for delivery of mail
CA2384446C (en) * 1999-09-17 2010-08-24 Silverbrook Research Pty. Ltd. Method and system for instruction of a computer
SE517445C2 (sv) 1999-10-01 2002-06-04 Anoto Ab Positionsbestämning på en yta försedd med ett positionskodningsmönster
FR2801997A1 (fr) * 1999-12-02 2001-06-08 Itesoft Technologie adaptative d'analyse automatique de document
US20020050982A1 (en) * 2000-04-05 2002-05-02 Petter Ericson Data form having a position-coding pattern detectable by an optical sensor
US20060082557A1 (en) * 2000-04-05 2006-04-20 Anoto Ip Lic Hb Combined detection of position-coding pattern and bar codes
DE10040899A1 (de) * 2000-08-18 2002-02-28 Gavitec Gmbh Verfahren und Vorrichtung zum Decodieren von optischen Codes
US7330876B1 (en) * 2000-10-13 2008-02-12 Aol Llc, A Delaware Limited Liability Company Method and system of automating internet interactions
ATE289101T1 (de) * 2000-10-26 2005-02-15 Mathias Wettstein Verfahren zur erfassung des vollständigen datensatzes mit schriftzeichen versehener formulare
US8095597B2 (en) 2001-05-01 2012-01-10 Aol Inc. Method and system of automating data capture from electronic correspondence
US7451404B1 (en) * 2001-08-06 2008-11-11 At&T Intellectual Property I, L.P. Methods and systems for obtaining data from legacy computer systems
FR2831752A1 (fr) * 2001-10-30 2003-05-02 Laurent Michel Procede et installation de saisie de fiches a l'aide d'un poste de saisie
EP1308877A1 (en) * 2001-10-31 2003-05-07 Accenture Global Services GmbH Till receipt reader
US7426486B2 (en) * 2001-10-31 2008-09-16 Call-Tell Llc Multi-party reporting system and method
US7212301B2 (en) * 2001-10-31 2007-05-01 Call-Tell Llc System and method for centralized, automatic extraction of data from remotely transmitted forms
US7895062B2 (en) * 2001-12-31 2011-02-22 Genworth Financial, Inc. System for optimization of insurance underwriting suitable for use by an automated system
US8793146B2 (en) 2001-12-31 2014-07-29 Genworth Holdings, Inc. System for rule-based insurance underwriting suitable for use by an automated system
US7844476B2 (en) 2001-12-31 2010-11-30 Genworth Financial, Inc. Process for case-based insurance underwriting suitable for use by an automated system
US8005693B2 (en) 2001-12-31 2011-08-23 Genworth Financial, Inc. Process for determining a confidence factor for insurance underwriting suitable for use by an automated system
US7899688B2 (en) * 2001-12-31 2011-03-01 Genworth Financial, Inc. Process for optimization of insurance underwriting suitable for use by an automated system
US7818186B2 (en) 2001-12-31 2010-10-19 Genworth Financial, Inc. System for determining a confidence factor for insurance underwriting suitable for use by an automated system
US7844477B2 (en) 2001-12-31 2010-11-30 Genworth Financial, Inc. Process for rule-based insurance underwriting suitable for use by an automated system
CA2375355A1 (en) 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
US7103835B1 (en) * 2002-03-12 2006-09-05 Movaris, Inc. Process builder for a routable electronic document system and method for using the same
US7171615B2 (en) 2002-03-26 2007-01-30 Aatrix Software, Inc. Method and apparatus for creating and filing forms
AU2002952106A0 (en) * 2002-10-15 2002-10-31 Silverbrook Research Pty Ltd Methods and systems (npw008)
US7116840B2 (en) 2002-10-31 2006-10-03 Microsoft Corporation Decoding and error correction in 2-D arrays
US7133563B2 (en) 2002-10-31 2006-11-07 Microsoft Corporation Passive embedded interaction code
US20110188759A1 (en) * 2003-06-26 2011-08-04 Irina Filimonova Method and System of Pre-Analysis and Automated Classification of Documents
RU2003108433A (ru) * 2003-03-28 2004-09-27 Аби Софтвер Лтд. (Cy) Способ предварительной обработки изображения машиночитаемой формы
RU2003108434A (ru) * 2003-03-28 2004-09-27 "Аби Софтвер Лтд." (CY) Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата
US9224040B2 (en) 2003-03-28 2015-12-29 Abbyy Development Llc Method for object recognition and describing structure of graphical objects
US9015573B2 (en) 2003-03-28 2015-04-21 Abbyy Development Llc Object recognition and describing structure of graphical objects
US7305612B2 (en) * 2003-03-31 2007-12-04 Siemens Corporate Research, Inc. Systems and methods for automatic form segmentation for raster-based passive electronic documents
US7801748B2 (en) 2003-04-30 2010-09-21 Genworth Financial, Inc. System and process for detecting outliers for insurance underwriting suitable for use by an automated system
US7567914B2 (en) 2003-04-30 2009-07-28 Genworth Financial, Inc. System and process for dominance classification for insurance underwriting suitable for use by an automated system
US7383239B2 (en) * 2003-04-30 2008-06-03 Genworth Financial, Inc. System and process for a fusion classification for insurance underwriting suitable for use by an automated system
US7813945B2 (en) 2003-04-30 2010-10-12 Genworth Financial, Inc. System and process for multivariate adaptive regression splines classification for insurance underwriting suitable for use by an automated system
RU2635259C1 (ru) 2016-06-22 2017-11-09 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и устройство для определения типа цифрового документа
US20050120296A1 (en) * 2003-12-01 2005-06-02 Zeuli Bruce W. Method and apparatus for processing image data
US7583842B2 (en) 2004-01-06 2009-09-01 Microsoft Corporation Enhanced approach of m-array decoding and error correction
US7263224B2 (en) 2004-01-16 2007-08-28 Microsoft Corporation Strokes localization by m-array decoding and fast image matching
US7698159B2 (en) 2004-02-13 2010-04-13 Genworth Financial Inc. Systems and methods for performing data collection
US20050182666A1 (en) * 2004-02-13 2005-08-18 Perry Timothy P.J. Method and system for electronically routing and processing information
US8566125B1 (en) 2004-09-20 2013-10-22 Genworth Holdings, Inc. Systems and methods for performing workflow
GB2421827B (en) * 2004-12-31 2010-04-14 Ibm Methods apparatus and computer programs for dynamic generation of forms
US7607076B2 (en) * 2005-02-18 2009-10-20 Microsoft Corporation Embedded interaction code document
US7826074B1 (en) 2005-02-25 2010-11-02 Microsoft Corporation Fast embedded interaction code printing with custom postscript commands
US7599560B2 (en) 2005-04-22 2009-10-06 Microsoft Corporation Embedded interaction code recognition
US7421439B2 (en) 2005-04-22 2008-09-02 Microsoft Corporation Global metadata embedding and decoding
WO2006123575A1 (ja) * 2005-05-19 2006-11-23 Kenji Yoshida 音声情報記録装置
US7400777B2 (en) 2005-05-25 2008-07-15 Microsoft Corporation Preprocessing for information pattern analysis
US7729539B2 (en) 2005-05-31 2010-06-01 Microsoft Corporation Fast error-correcting of embedded interaction codes
US7580576B2 (en) 2005-06-02 2009-08-25 Microsoft Corporation Stroke localization and binding to electronic document
US7619607B2 (en) 2005-06-30 2009-11-17 Microsoft Corporation Embedding a pattern design onto a liquid crystal display
US20070033137A1 (en) * 2005-07-19 2007-02-08 P5, Inc. Converting patient payments into standardized electronic payment documents
US7622182B2 (en) * 2005-08-17 2009-11-24 Microsoft Corporation Embedded interaction code enabled display
US7817816B2 (en) 2005-08-17 2010-10-19 Microsoft Corporation Embedded interaction code enabled surface type identification
US9158749B2 (en) * 2005-09-23 2015-10-13 International Business Machines Corporation Smart form completion of form values
JP4719543B2 (ja) * 2005-09-26 2011-07-06 株式会社リコー ワークフローシステム、サーバ装置、ワークフローシステムの処理方法及びワークフロープログラム
US20070143660A1 (en) * 2005-12-19 2007-06-21 Huey John M System and method for indexing image-based information
US8667382B2 (en) * 2006-06-28 2014-03-04 International Business Machines Corporation Configurable field definition document
US8233714B2 (en) 2006-08-01 2012-07-31 Abbyy Software Ltd. Method and system for creating flexible structure descriptions
US9740692B2 (en) 2006-08-01 2017-08-22 Abbyy Development Llc Creating flexible structure descriptions of documents with repetitive non-regular structures
US20080082909A1 (en) * 2006-10-03 2008-04-03 Adobe Systems Incorporated Form magnifier
WO2008090606A1 (ja) * 2007-01-24 2008-07-31 Fujitsu Limited 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法
CN101963965B (zh) 2009-07-23 2013-03-20 阿里巴巴集团控股有限公司 基于搜索引擎的文档索引方法、数据查询方法及服务器
US10726200B2 (en) * 2011-02-04 2020-07-28 Benjamin Chou Systems and methods for user interfaces that provide enhanced verification of extracted data
US9298685B2 (en) * 2013-02-28 2016-03-29 Ricoh Company, Ltd. Automatic creation of multiple rows in a table
JP2015215853A (ja) * 2014-05-13 2015-12-03 株式会社リコー システム、画像処理装置、画像処理方法およびプログラム
CN104021495A (zh) * 2014-06-16 2014-09-03 王美金 基于文字识别的银行业务申请书生成装置
US20160335238A1 (en) * 2015-05-13 2016-11-17 International Business Machines Corporation Analytic driven markup for rapid handling of forms
US11861302B2 (en) 2019-02-04 2024-01-02 Aatrix Software, Inc. AUF XML specification compiler

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3113555A1 (de) * 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
JPS5887652A (ja) * 1981-11-19 1983-05-25 Ricoh Co Ltd 画像処理装置
US4553261A (en) * 1983-05-31 1985-11-12 Horst Froessl Document and data handling and retrieval system
US4741045A (en) * 1983-09-23 1988-04-26 Dest Corporation Optical character isolation system, apparatus and method
JPH07107694B2 (ja) * 1984-08-31 1995-11-15 株式会社日立製作所 文書処理装置
JPH0750483B2 (ja) * 1985-05-22 1995-05-31 株式会社日立製作所 文書画像追加情報の蓄積方法
US4616854A (en) * 1985-07-16 1986-10-14 Landrum Van O Insurance form indicia system
US4813077A (en) * 1986-07-30 1989-03-14 Scan-Optics, Inc. Sales transaction record processing system and method
JPS63155386A (ja) * 1986-12-19 1988-06-28 Ricoh Co Ltd 帳票デ−タ読取装置
US4949392A (en) * 1988-05-20 1990-08-14 Eastman Kodak Company Document recognition and automatic indexing for optical character recognition
JP2695844B2 (ja) * 1988-06-16 1998-01-14 株式会社東芝 文書整形装置
US5010580A (en) * 1989-08-25 1991-04-23 Hewlett-Packard Company Method and apparatus for extracting information from forms

Also Published As

Publication number Publication date
EP0567834A2 (en) 1993-11-03
EP0567834A3 (en) 1994-10-05
US5235654A (en) 1993-08-10
JPH0696276A (ja) 1994-04-08

Similar Documents

Publication Publication Date Title
JP2968145B2 (ja) 高度なデータ収集方法及びデータ処理システム
US5251273A (en) Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
US5305396A (en) Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
US8520889B2 (en) Automated generation of form definitions from hard-copy forms
US20190197306A1 (en) Multi-page document recognition in document capture
JP3425408B2 (ja) 文書読取装置
US7313514B2 (en) Validating content of localization data files
JP2003242171A (ja) 文書の検索方法
WO2006002009A2 (en) Document management system with enhanced intelligent document recognition capabilities
US7539326B2 (en) Method for verifying an intended address by OCR percentage address matching
JPH11282955A (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US7716639B2 (en) Specification wizard
US11386263B2 (en) Automatic generation of form application
JP2000040085A (ja) 日本語形態素解析処理の後処理方法および装置
JP4160206B2 (ja) 文字認識装置を利用したデータベース登録方法
JP2022075467A (ja) データ処理装置、データ処理方法及びプログラム
JPH10105654A (ja) 帳票用文字認識装置
JPH1063813A (ja) イメージ文書管理方法及びその装置
JP3210842B2 (ja) 情報処理装置
JP2922365B2 (ja) Ocr処理システムにおける漢字住所データ処理方法
JPH09185696A (ja) 地図情報システム
CN114529930A (zh) 基于非标准映射字体的pdf修复方法、存储介质及设备
JP3743252B2 (ja) アルファベット表記法人名検索システムと方法およびその処理プログラムを記録した記録媒体
CN117009998A (zh) 一种数据检验方法及系统
JP2001256438A (ja) 手書き文字管理装置、手書き文字管理方法、手書き文字照会システムおよび手書き文字照会方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070820

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees