JPH0668298A - 文書書式の文字認識及びデータ修復処理のためのデータ処理システム及び方法 - Google Patents
文書書式の文字認識及びデータ修復処理のためのデータ処理システム及び方法Info
- Publication number
- JPH0668298A JPH0668298A JP5080398A JP8039893A JPH0668298A JP H0668298 A JPH0668298 A JP H0668298A JP 5080398 A JP5080398 A JP 5080398A JP 8039893 A JP8039893 A JP 8039893A JP H0668298 A JPH0668298 A JP H0668298A
- Authority
- JP
- Japan
- Prior art keywords
- field
- processing
- data
- coded data
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/987—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
(57)【要約】
【目的】 文書書式のデジタル・イメージの文字認識誤
りを修復する、データ処理方法、及びシステムを提供す
る。 【構成】 選択され個別化された文字認識処理、及び選
択され個別化されたコード化データ誤り訂正処理に対応
する識別、及び好適なシーケンスを指定する文書書式処
理テンプレートが提供される。これらの処理は、そのフ
ィールドが特定の、予想される、一様な特徴を有する文
書書式の選択群を自動的に処理するために必要とされ
る。
りを修復する、データ処理方法、及びシステムを提供す
る。 【構成】 選択され個別化された文字認識処理、及び選
択され個別化されたコード化データ誤り訂正処理に対応
する識別、及び好適なシーケンスを指定する文書書式処
理テンプレートが提供される。これらの処理は、そのフ
ィールドが特定の、予想される、一様な特徴を有する文
書書式の選択群を自動的に処理するために必要とされ
る。
Description
【0001】
【産業上の利用分野】本発明はデータ処理システム及び
方法に関し、特に走査文書イメージから導出された文字
認識情報の修復技術に関する。
方法に関し、特に走査文書イメージから導出された文字
認識情報の修復技術に関する。
【0002】
【従来の技術】文書書式は様々な方法により記入され
る。書込み方法の例として、ブロック文字の手印字、文
字の続け書き、インパクト式タイプ、及びドット・マト
リクス・プリンタによる印字などがある。文書書式を記
入する様々な文字スタイル及びアルファベットが存在す
る。西欧諸国における文書書式としては、典型的にラテ
ン式アルファベットが使用される。東アジア諸国では、
典型的に漢字及びマンダリン・アルファベットが使用さ
れる。いくつかの中東諸国においては、ヘブライ式或い
はアラビック式アルファベットが使用される。またいく
つかの東欧諸国では、ギリシャ式或いはシリル式アルフ
ァベットが使用される。
る。書込み方法の例として、ブロック文字の手印字、文
字の続け書き、インパクト式タイプ、及びドット・マト
リクス・プリンタによる印字などがある。文書書式を記
入する様々な文字スタイル及びアルファベットが存在す
る。西欧諸国における文書書式としては、典型的にラテ
ン式アルファベットが使用される。東アジア諸国では、
典型的に漢字及びマンダリン・アルファベットが使用さ
れる。いくつかの中東諸国においては、ヘブライ式或い
はアラビック式アルファベットが使用される。またいく
つかの東欧諸国では、ギリシャ式或いはシリル式アルフ
ァベットが使用される。
【0003】各々の記入方法及びアルファベットは、文
書書式内のフィールドのイメージをコード化データの英
数字ストリングに変換するために、異なる個別の文字認
識処理を必要とする。
書書式内のフィールドのイメージをコード化データの英
数字ストリングに変換するために、異なる個別の文字認
識処理を必要とする。
【0004】文字認識処理により出力されるコード化デ
ータ内に発生する誤りは、書き手の元の意味が誤りデー
タの文脈から推論可能な場合は修復可能である。文書書
式におけるフィールドは"名前"、"住所"、"市"、"州"、
"ジップ・コード(Zip Code)"、"国" などの内容によ
り分類されるため、数多くの誤り訂正推論を形成する文
脈が既に提供されている。例えば"州"フィールドにおけ
る誤ったコード化データの元の意味は、同一文書書式
の"ジップ・コード"フィールド内の正確なコード化デー
タから推論可能である。
ータ内に発生する誤りは、書き手の元の意味が誤りデー
タの文脈から推論可能な場合は修復可能である。文書書
式におけるフィールドは"名前"、"住所"、"市"、"州"、
"ジップ・コード(Zip Code)"、"国" などの内容によ
り分類されるため、数多くの誤り訂正推論を形成する文
脈が既に提供されている。例えば"州"フィールドにおけ
る誤ったコード化データの元の意味は、同一文書書式
の"ジップ・コード"フィールド内の正確なコード化デー
タから推論可能である。
【0005】人工知能(AI)知識ベース技術が、文書
書式内のほとんどのフィールドの狭い内容分類における
誤り訂正推論を自動的に実行するために適用可能であ
る。例えば、共通の任意の名前の参照リストが"ファー
スト・ネーム"フィールドとして使用できる。市、州、
或いは国名の参照リストはそれぞれ"市"、"州"、及び"
国"フィールドとして使用できる。参照リストが短いほ
ど任意のフィールドにおける曖昧なコード化データ・ス
トリングの解析の確率は増加する。
書式内のほとんどのフィールドの狭い内容分類における
誤り訂正推論を自動的に実行するために適用可能であ
る。例えば、共通の任意の名前の参照リストが"ファー
スト・ネーム"フィールドとして使用できる。市、州、
或いは国名の参照リストはそれぞれ"市"、"州"、及び"
国"フィールドとして使用できる。参照リストが短いほ
ど任意のフィールドにおける曖昧なコード化データ・ス
トリングの解析の確率は増加する。
【0006】任意の文書書式における異なるAI参照リ
ストの数は、少なくともその書式におけるフィールドの
数に匹敵する。そして各フィールドに関し、適切なAI
参照リストの選択が記入方法或いはその文書書式が記入
される国により管理される場合には、各それぞれのフィ
ールドに対し可能なAI参照リストの数は、そうした変
化の数だけ増加する。
ストの数は、少なくともその書式におけるフィールドの
数に匹敵する。そして各フィールドに関し、適切なAI
参照リストの選択が記入方法或いはその文書書式が記入
される国により管理される場合には、各それぞれのフィ
ールドに対し可能なAI参照リストの数は、そうした変
化の数だけ増加する。
【0007】社会から情報を受取るために文書書式を使
用する多くのアプリケーションにおいて、そうした書式
は特定の一貫性により特徴づけられる群として受取られ
る。例えば、一般の積荷の国際的輸入業者は各到着する
船、或いは航空機に関し、積荷証券を一群として受取
る。第1日目に到着した積荷が例えば東アジアから船輸
送された場合、ある積荷証券の文書書式ではラテン式ア
ルファベット文字同様、マンダリン或いは漢字文字が記
入されているフィールドを有することが予想される。第
2日目において、積荷は東欧から船輸送された場合、あ
る積荷証券の文書書式ではラテン式アルファベット文字
同様、ギリシャ及びシリル文字が記入されているフィー
ルドを有することが予想される。
用する多くのアプリケーションにおいて、そうした書式
は特定の一貫性により特徴づけられる群として受取られ
る。例えば、一般の積荷の国際的輸入業者は各到着する
船、或いは航空機に関し、積荷証券を一群として受取
る。第1日目に到着した積荷が例えば東アジアから船輸
送された場合、ある積荷証券の文書書式ではラテン式ア
ルファベット文字同様、マンダリン或いは漢字文字が記
入されているフィールドを有することが予想される。第
2日目において、積荷は東欧から船輸送された場合、あ
る積荷証券の文書書式ではラテン式アルファベット文字
同様、ギリシャ及びシリル文字が記入されているフィー
ルドを有することが予想される。
【0008】第1日目に受取られた積荷の積荷証券文書
書式を、自動的に読込むために必要な文字認識処理及び
AI誤り訂正処理は、第2日目に受取られた積荷の文書
書式を読むためのものとは異なる。
書式を、自動的に読込むために必要な文字認識処理及び
AI誤り訂正処理は、第2日目に受取られた積荷の文書
書式を読むためのものとは異なる。
【0009】更に文書書式におけるいくつかの内容フィ
ールドに適用される、その他の第2及び第3のコード化
データ修復処理が存在する。その例として、"名前"フィ
ールドから導出された修正済みコード化データと、特定
のアプリケーションにおける顧客名のデータ・ベースと
の比較が挙げられる。適切なデータ・ベースの選択が文
書書式が記入された国により管理される場合、こうした
フィールドに対するデータ・ベース誤り訂正処理の数
は、そうした変化の数だけ増加する。
ールドに適用される、その他の第2及び第3のコード化
データ修復処理が存在する。その例として、"名前"フィ
ールドから導出された修正済みコード化データと、特定
のアプリケーションにおける顧客名のデータ・ベースと
の比較が挙げられる。適切なデータ・ベースの選択が文
書書式が記入された国により管理される場合、こうした
フィールドに対するデータ・ベース誤り訂正処理の数
は、そうした変化の数だけ増加する。
【0010】従って、そのフィールドが特定であり、予
想される一様の特徴を有する文書書式の群を自動的に処
理するために、必要な個別化された文字認識処理、及び
個別化されたコード化データ誤り訂正処理を選択する手
段が求められることになる。
想される一様の特徴を有する文書書式の群を自動的に処
理するために、必要な個別化された文字認識処理、及び
個別化されたコード化データ誤り訂正処理を選択する手
段が求められることになる。
【0011】
【発明が解決しようとする課題】従って、本発明の目的
は文書書式からの文字認識コード化データを自動的に誤
り訂正する改善された方法を提供する。
は文書書式からの文字認識コード化データを自動的に誤
り訂正する改善された方法を提供する。
【0012】本発明の目的はそのフィールドが種々の記
入方法、文字スタイル及びアルファベットにより記入さ
れた文書書式からの文字認識コード化データを、自動的
に誤り訂正する方法を提供する。
入方法、文字スタイル及びアルファベットにより記入さ
れた文書書式からの文字認識コード化データを、自動的
に誤り訂正する方法を提供する。
【0013】本発明の目的はそのフィールドが特定であ
り、予想される一様の特徴を有する文書書式群を自動的
に処理するために、必要な個別化された文字認識処理及
び個別化されたコード化データ誤り訂正処理を選択する
手段を提供する。
り、予想される一様の特徴を有する文書書式群を自動的
に処理するために、必要な個別化された文字認識処理及
び個別化されたコード化データ誤り訂正処理を選択する
手段を提供する。
【0014】
【課題を解決するための手段】本発明は文書書式のデジ
タル・イメージにおける文字認識誤り修復のためのデー
タ処理方法、システム及びコンピュータ・プログラムを
含む。
タル・イメージにおける文字認識誤り修復のためのデー
タ処理方法、システム及びコンピュータ・プログラムを
含む。
【0015】本発明はそのフィールドが特定であり、予
想される一様の特徴を有する文書書式群を自動的に処理
するために、必要な選択され、個別化された文字認識処
理及び選択され、個別化されたコード化データ誤り訂正
処理に対する識別、及び好適なシーケンスを指定する文
書書式処理テンプレートを提供する。
想される一様の特徴を有する文書書式群を自動的に処理
するために、必要な選択され、個別化された文字認識処
理及び選択され、個別化されたコード化データ誤り訂正
処理に対する識別、及び好適なシーケンスを指定する文
書書式処理テンプレートを提供する。
【0016】選択された文書書式群が処理される時、本
発明はユーザにより選択される文書書式処理テンプレー
トを入力することから開始される。テンプレートは第1
の複数の文字認識処理に対応する第1のシーケンス仕様
を含む。これらは第1発生及び第2発生文字認識処理を
含む。テンプレートはまた第2の複数のコード化データ
修復処理に対応する第2のシーケンス仕様を含む。これ
らは第1発生及び第2発生コード化データ修復処理を含
む。
発明はユーザにより選択される文書書式処理テンプレー
トを入力することから開始される。テンプレートは第1
の複数の文字認識処理に対応する第1のシーケンス仕様
を含む。これらは第1発生及び第2発生文字認識処理を
含む。テンプレートはまた第2の複数のコード化データ
修復処理に対応する第2のシーケンス仕様を含む。これ
らは第1発生及び第2発生コード化データ修復処理を含
む。
【0017】次に書式群からの文書書式はシステムに走
査入力され、文書書式のデジタル文書イメージが入力さ
れ、文書イメージからフィールド・イメージが抽出さ
れ、対応する抽出フィールド・イメージが生成される。
査入力され、文書書式のデジタル文書イメージが入力さ
れ、文書イメージからフィールド・イメージが抽出さ
れ、対応する抽出フィールド・イメージが生成される。
【0018】本発明によれば、この方法はテンプレート
内における第1の複数の処理の中から第1発生文字認識
処理を選択し、これは抽出されたフィールド・イメージ
から第1の認識コード化データを生成し、第1の認識誤
りデータを生成する。
内における第1の複数の処理の中から第1発生文字認識
処理を選択し、これは抽出されたフィールド・イメージ
から第1の認識コード化データを生成し、第1の認識誤
りデータを生成する。
【0019】テンプレートは所定の最大認識誤り値を含
み、これは第1の認識誤りデータが所定値よりも大きい
かどうかを判断するために使用される。
み、これは第1の認識誤りデータが所定値よりも大きい
かどうかを判断するために使用される。
【0020】誤りが余りにも大きい場合、これに応答
し、本発明の方法はテンプレート内における第1の複数
の処理の中から第2の発生文字認識処理を選択し、これ
は抽出されたフィールド・イメージから第2の認識コー
ド化データを生成し、第2の認識誤りデータを生成す
る。
し、本発明の方法はテンプレート内における第1の複数
の処理の中から第2の発生文字認識処理を選択し、これ
は抽出されたフィールド・イメージから第2の認識コー
ド化データを生成し、第2の認識誤りデータを生成す
る。
【0021】本発明によれば、本方法はテンプレート内
における第2の複数の処理の中から第1発生コード化デ
ータ修復処理を選択し、これは第2の認識コード化デー
タ及び第2の認識誤りデータに対して作用し、第1の修
復コード化データを生成する。
における第2の複数の処理の中から第1発生コード化デ
ータ修復処理を選択し、これは第2の認識コード化デー
タ及び第2の認識誤りデータに対して作用し、第1の修
復コード化データを生成する。
【0022】テンプレートはまた所定の最小確率値を含
み、これは第1の修復コード化データが所定値よりも小
さな値を有するかどうかを判断するために使用される。
そうである場合、それに応答し、本方法はテンプレート
内における第2の複数の処理の中から第2発生コード化
データ修復処理を選択し、これは第2の認識コード化デ
ータ及び第2の認識誤りデータに対して作用し、第2の
修復コード化データを生成する。
み、これは第1の修復コード化データが所定値よりも小
さな値を有するかどうかを判断するために使用される。
そうである場合、それに応答し、本方法はテンプレート
内における第2の複数の処理の中から第2発生コード化
データ修復処理を選択し、これは第2の認識コード化デ
ータ及び第2の認識誤りデータに対して作用し、第2の
修復コード化データを生成する。
【0023】このようにして、本発明はそのフィールド
が特定であり、予想される一様の特徴を有する文書書式
の選択群を自動的に処理するために、必要な選択され、
個別化された文字認識処理及び選択され、個別化された
コード化データ誤り訂正処理に対する識別及び好適なシ
ーケンスを指定する文書書式処理テンプレートを提供す
る。
が特定であり、予想される一様の特徴を有する文書書式
の選択群を自動的に処理するために、必要な選択され、
個別化された文字認識処理及び選択され、個別化された
コード化データ誤り訂正処理に対する識別及び好適なシ
ーケンスを指定する文書書式処理テンプレートを提供す
る。
【0024】本発明の別の側面によれば、ユーザが文書
書式の特定の群に対して文字認識処理シーケンス、及び
コード化データ誤り訂正処理シーケンスを個別化するこ
とが可能な、個別化された文書書式処理テンプレートを
構成する方法を提供する。
書式の特定の群に対して文字認識処理シーケンス、及び
コード化データ誤り訂正処理シーケンスを個別化するこ
とが可能な、個別化された文書書式処理テンプレートを
構成する方法を提供する。
【0025】本発明の別の側面は、文書書式処理テンプ
レートにより指定される特殊な誤り訂正技術を提供す
る。例えば、文書書式処理テンプレートは書式フィール
ドがより優先順位の高いフィールドを有する場合に、そ
の高位のフィールドがコード化データに対し高い確率を
有せば、冗長フィールドの処理をスキップするオプショ
ンを提供するように指定できる。別の特殊な機能とし
て、リンク化知識ベース・リストの探索があり、これは
文書書式処理テンプレートから選択される機能である。
本発明の別の機能は、文書書式処理テンプレートにより
指定可能な関連するフィールドのクロス・チェックであ
る。本発明の更に別の機能は、特定フィールドに関する
処理シーケンスの選択的再ルート化、及び次に処理され
るフィールドの順序の選択的変更あり、これらについて
も文書書式処理テンプレートにより指定される。このよ
うに本発明は、文書書式の特定の群に関する文字認識及
びコード化データ訂正において、個別化された処理を指
定する非常に柔軟な方法を提供する。
レートにより指定される特殊な誤り訂正技術を提供す
る。例えば、文書書式処理テンプレートは書式フィール
ドがより優先順位の高いフィールドを有する場合に、そ
の高位のフィールドがコード化データに対し高い確率を
有せば、冗長フィールドの処理をスキップするオプショ
ンを提供するように指定できる。別の特殊な機能とし
て、リンク化知識ベース・リストの探索があり、これは
文書書式処理テンプレートから選択される機能である。
本発明の別の機能は、文書書式処理テンプレートにより
指定可能な関連するフィールドのクロス・チェックであ
る。本発明の更に別の機能は、特定フィールドに関する
処理シーケンスの選択的再ルート化、及び次に処理され
るフィールドの順序の選択的変更あり、これらについて
も文書書式処理テンプレートにより指定される。このよ
うに本発明は、文書書式の特定の群に関する文字認識及
びコード化データ訂正において、個別化された処理を指
定する非常に柔軟な方法を提供する。
【0026】
【実施例】文書書式の特定のフィールドに対する修復の
履歴は、機械生成データ構造(MGDS)メッセージに
組込まれる。MGDSは順序的修復処理とシステム内の
プロセッサ間のデータ・インタフェースとして使用され
る。MGDSはまた監査証跡を維持する目的で、特定の
誤認識文字ストリングに対する修復履歴のための貯蔵場
所として機能する。
履歴は、機械生成データ構造(MGDS)メッセージに
組込まれる。MGDSは順序的修復処理とシステム内の
プロセッサ間のデータ・インタフェースとして使用され
る。MGDSはまた監査証跡を維持する目的で、特定の
誤認識文字ストリングに対する修復履歴のための貯蔵場
所として機能する。
【0027】図1乃至図2は図53に示すように結合さ
れ、文書書式のデジタル・イメージの文字認識誤りを修
復するためのデータ処理システムの全体的体系を表す図
である。ハード・コピー文書10はスキャナ22を用い
てシステム内に走査入力され、その結果得られる文書イ
メージ10^ が図18に示される。本発明の実施例で
は、知能的書式プロセッサ25(図33で詳細な体系図
が示される)が処理テンプレート33を生成する書式処
理テンプレート定義プロセッサ57を提供する。文書書
式処理テンプレート33は選択され個別化された文字認
識処理、及び選択され個別化されたコード化データ誤り
訂正処理に対する識別及び好適なシーケンスを指定す
る。こうした処理はユーザにとって、そのフィールドが
特定であり予想される一様の特徴を有する文書に関する
選択群を自動的に処理するために必要と思われる。文書
書式処理テンプレート33の構造例を図52に示す。
れ、文書書式のデジタル・イメージの文字認識誤りを修
復するためのデータ処理システムの全体的体系を表す図
である。ハード・コピー文書10はスキャナ22を用い
てシステム内に走査入力され、その結果得られる文書イ
メージ10^ が図18に示される。本発明の実施例で
は、知能的書式プロセッサ25(図33で詳細な体系図
が示される)が処理テンプレート33を生成する書式処
理テンプレート定義プロセッサ57を提供する。文書書
式処理テンプレート33は選択され個別化された文字認
識処理、及び選択され個別化されたコード化データ誤り
訂正処理に対する識別及び好適なシーケンスを指定す
る。こうした処理はユーザにとって、そのフィールドが
特定であり予想される一様の特徴を有する文書に関する
選択群を自動的に処理するために必要と思われる。文書
書式処理テンプレート33の構造例を図52に示す。
【0028】本発明の実施例では、図33の知能的書式
プロセッサ25はまた、スキャナ22によるスキャナ・
インタフェース処理を提供する。図1乃至図2に示され
る知能的書式プロセッサ25はまた、バッファ40、書
式認識及びフィールド抽出プロセッサ24、文字認識プ
ロセッサ26及び人工知能誤り訂正プロセッサ28を含
む。本発明の実施例では、これらの種々のプロセッサは
対応するコンピュータ・プログラムを通じて実施され、
これらのプログラムは実行されるとそれぞれの処理を実
行する。本発明の別の実施例では、図1乃至図2に示さ
れるように書式処理テンプレート定義プロセッサ57、
スキャナ・プロセッサ23、バッファ40、書式認識及
びフィールド抽出プロセッサ24、文字認識プロセッサ
26、及び人工知能誤り訂正プロセッサ28はそれぞれ
別のプロセッサであり、互いにローカル・エリア・ネッ
トワーク(LAN)20により接続される。本発明の理
解を深めるために図1乃至図2に示される別々のプロセ
ッサの実施例について最初に説明する。
プロセッサ25はまた、スキャナ22によるスキャナ・
インタフェース処理を提供する。図1乃至図2に示され
る知能的書式プロセッサ25はまた、バッファ40、書
式認識及びフィールド抽出プロセッサ24、文字認識プ
ロセッサ26及び人工知能誤り訂正プロセッサ28を含
む。本発明の実施例では、これらの種々のプロセッサは
対応するコンピュータ・プログラムを通じて実施され、
これらのプログラムは実行されるとそれぞれの処理を実
行する。本発明の別の実施例では、図1乃至図2に示さ
れるように書式処理テンプレート定義プロセッサ57、
スキャナ・プロセッサ23、バッファ40、書式認識及
びフィールド抽出プロセッサ24、文字認識プロセッサ
26、及び人工知能誤り訂正プロセッサ28はそれぞれ
別のプロセッサであり、互いにローカル・エリア・ネッ
トワーク(LAN)20により接続される。本発明の理
解を深めるために図1乃至図2に示される別々のプロセ
ッサの実施例について最初に説明する。
【0029】ローカル・エリア・ネットワーク(LA
N)20はテンプレート・プロセッサ57、スキャナ・
プロセッサ23、バッファ40、書式認識及びフィール
ド抽出プロセッサ24、文字認識プロセッサ26、及び
人工知能誤り訂正プロセッサ28をホスト・コンピュー
タ34を相互接続する。またLAN20にはデータ・ベ
ース誤り訂正プロセッサ30、及び手動検査及び訂正プ
ロセッサ32が接続される。更に追加のイメージ獲得機
能バッファ・サーバ40^ がLAN20に接続される。
ホスト・コンピュータ34には文書イメージ記憶装置3
6、コード化データ記憶装置35、及び修復履歴記憶装
置38が接続される。
N)20はテンプレート・プロセッサ57、スキャナ・
プロセッサ23、バッファ40、書式認識及びフィール
ド抽出プロセッサ24、文字認識プロセッサ26、及び
人工知能誤り訂正プロセッサ28をホスト・コンピュー
タ34を相互接続する。またLAN20にはデータ・ベ
ース誤り訂正プロセッサ30、及び手動検査及び訂正プ
ロセッサ32が接続される。更に追加のイメージ獲得機
能バッファ・サーバ40^ がLAN20に接続される。
ホスト・コンピュータ34には文書イメージ記憶装置3
6、コード化データ記憶装置35、及び修復履歴記憶装
置38が接続される。
【0030】文書書式の選択群がシステムにより処理さ
れる時、本発明の方法はユーザにより選択される文書書
式処理テンプレート33を入力することから開始され
る。テンプレートは第1の複数の文字認識処理に対応す
る第1のシーケンス仕様を含み、これは文字認識プロセ
ッサ26により実行される。これらは第1発生及び第2
発生文字認識処理を含む。処理テンプレート33はまた
第2の複数のコード化データ修復処理に対応する第2の
シーケンス仕様を含み、これらは人工知能誤り訂正プロ
セッサ28、或いはデータ・ベース誤り訂正プロセッサ
30、或いは手動検査及び訂正プロセッサ32において
実行される。これらのプロセッサは第1発生及び第2発
生コード化データ修復処理を含む。
れる時、本発明の方法はユーザにより選択される文書書
式処理テンプレート33を入力することから開始され
る。テンプレートは第1の複数の文字認識処理に対応す
る第1のシーケンス仕様を含み、これは文字認識プロセ
ッサ26により実行される。これらは第1発生及び第2
発生文字認識処理を含む。処理テンプレート33はまた
第2の複数のコード化データ修復処理に対応する第2の
シーケンス仕様を含み、これらは人工知能誤り訂正プロ
セッサ28、或いはデータ・ベース誤り訂正プロセッサ
30、或いは手動検査及び訂正プロセッサ32において
実行される。これらのプロセッサは第1発生及び第2発
生コード化データ修復処理を含む。
【0031】群からの文書10はスキャナ22によりシ
ステムに走査入力され、図18に詳細に示される文書イ
メージ10^を形成する。文書イメージ10^はハード・
コピー文書10のイメージのビット・マップ表現であ
る。スキャナ22はローカル・エリア・ネットワーク2
0を介し、書式認識及びフィールド抽出プロセッサ24
に文書イメージ10^を出力する。文書イメージ10^の
コピーはホスト・プロセッサ34にも転送可能であり、
一時的な指標化識別が文書イメージ10^ に割当てら
れ、文書イメージ記憶装置36に一時的に保管される。
ステムに走査入力され、図18に詳細に示される文書イ
メージ10^を形成する。文書イメージ10^はハード・
コピー文書10のイメージのビット・マップ表現であ
る。スキャナ22はローカル・エリア・ネットワーク2
0を介し、書式認識及びフィールド抽出プロセッサ24
に文書イメージ10^を出力する。文書イメージ10^の
コピーはホスト・プロセッサ34にも転送可能であり、
一時的な指標化識別が文書イメージ10^ に割当てら
れ、文書イメージ記憶装置36に一時的に保管される。
【0032】書式認識及びフィールド抽出プロセッサ2
4は、システムにより処理される書式のマスタ書式定義
のライブラリを含む。書式のモデルは書式パターン及び
書式上に含まれる各フィールドの記述を含む。書式パタ
ーンは書式タイプを区別するために使用される一連の特
徴である。フィールド記述はデカルト座標により表現さ
れる書式上のフィールドのロケーション、文字認識の容
認閾値、識別及びフィールド指定情報を含む。データ・
フィールドのロケーションは長方形の対角を示す2点の
モデルにより表現できる。
4は、システムにより処理される書式のマスタ書式定義
のライブラリを含む。書式のモデルは書式パターン及び
書式上に含まれる各フィールドの記述を含む。書式パタ
ーンは書式タイプを区別するために使用される一連の特
徴である。フィールド記述はデカルト座標により表現さ
れる書式上のフィールドのロケーション、文字認識の容
認閾値、識別及びフィールド指定情報を含む。データ・
フィールドのロケーションは長方形の対角を示す2点の
モデルにより表現できる。
【0033】文書イメージ10^ が書式認識及びフィー
ルド抽出プロセッサ24に入力される時、書式を識別す
るためにイメージが解析され、その結果、適切なマスタ
書式定義データがアクセスされる。書式認識のためにい
くつかの方法が使用可能である。1つの方法は典型的に
文書上に印字される書式番号を一致させる。第2の方法
は書式タイプを区別する書式テキスト及び線のレイアウ
ト、或いは配置を比較する。第3の方法は書式の水平及
び垂直線に頼る。書式の文書イメージ10^ が特徴化さ
れると、対応するマスタ書式定義データがアクセス可能
となる。このデータはそれぞれのフィールドの座標、フ
ィールドの名称及び書式内の各それぞれのフィールドの
コード・ページを定義する。
ルド抽出プロセッサ24に入力される時、書式を識別す
るためにイメージが解析され、その結果、適切なマスタ
書式定義データがアクセスされる。書式認識のためにい
くつかの方法が使用可能である。1つの方法は典型的に
文書上に印字される書式番号を一致させる。第2の方法
は書式タイプを区別する書式テキスト及び線のレイアウ
ト、或いは配置を比較する。第3の方法は書式の水平及
び垂直線に頼る。書式の文書イメージ10^ が特徴化さ
れると、対応するマスタ書式定義データがアクセス可能
となる。このデータはそれぞれのフィールドの座標、フ
ィールドの名称及び書式内の各それぞれのフィールドの
コード・ページを定義する。
【0034】図21は書式認識処理24A及びフィール
ド抽出処理24Bにおいて実行されるオペレーション・
ステップのシーケンスの流れ図である。
ド抽出処理24Bにおいて実行されるオペレーション・
ステップのシーケンスの流れ図である。
【0035】スキャナ22が文書10を走査する時、ス
キャナ・プロセッサ23は再スケール化などのいくつか
の前置オペレーション、及びイメージのイメージ・ファ
イルへの圧縮を実行する。イメージ・ファイルへはファ
イル・アドレスが割当てられる。文書イメージ10^ の
イメージ・ファイルは一時的にバッファ40或いはバッ
ファ・サーバ40^ 内にバッファされ、割当アドレスの
下でアクセスされる。或いはスキャナ・プロセッサ23
は文書イメージ10^ を直接的に、書式認識及びフィー
ルド抽出プロセッサ24に出力することができる。
キャナ・プロセッサ23は再スケール化などのいくつか
の前置オペレーション、及びイメージのイメージ・ファ
イルへの圧縮を実行する。イメージ・ファイルへはファ
イル・アドレスが割当てられる。文書イメージ10^ の
イメージ・ファイルは一時的にバッファ40或いはバッ
ファ・サーバ40^ 内にバッファされ、割当アドレスの
下でアクセスされる。或いはスキャナ・プロセッサ23
は文書イメージ10^ を直接的に、書式認識及びフィー
ルド抽出プロセッサ24に出力することができる。
【0036】図21に関し、書式認識処理24Aはステ
ップ100で開始され、文書イメージ・ファイル・ポイ
ンタ60を入力し、これはバッファ60或いはバッファ
・サーバ40^からの文書イメージ10^のアクセスを可
能とする。図21のステップ101では図18で示され
る文書イメージ10^ を獲得する。走査書式イメージ1
0^ の例は6個のデータ・フィールド、及び1個の書式
番号フィールドを有する。書式番号フィールド11^ は
書式の識別のバー・コード表現を含み、これは保険申請
書である。第1のデータ・フィールド14^ はラスト・
ネーム・フィールドである。第2のフィールド16^ は
ファースト・ネーム・フィールドである。第3のフィー
ルド12a^は州フィールドである。第4のフィールド
12b^は住所フィールドである。第5のフィールド4
4^ は署名フィールドであり、第6のフィールド12^
は通し番号フィールドである。ここで第1から第4のフ
ィールド及び第6のフィールドは英数字のイメージを含
み、第5のフィールド44^は署名のイメージを含む。
ップ100で開始され、文書イメージ・ファイル・ポイ
ンタ60を入力し、これはバッファ60或いはバッファ
・サーバ40^からの文書イメージ10^のアクセスを可
能とする。図21のステップ101では図18で示され
る文書イメージ10^ を獲得する。走査書式イメージ1
0^ の例は6個のデータ・フィールド、及び1個の書式
番号フィールドを有する。書式番号フィールド11^ は
書式の識別のバー・コード表現を含み、これは保険申請
書である。第1のデータ・フィールド14^ はラスト・
ネーム・フィールドである。第2のフィールド16^ は
ファースト・ネーム・フィールドである。第3のフィー
ルド12a^は州フィールドである。第4のフィールド
12b^は住所フィールドである。第5のフィールド4
4^ は署名フィールドであり、第6のフィールド12^
は通し番号フィールドである。ここで第1から第4のフ
ィールド及び第6のフィールドは英数字のイメージを含
み、第5のフィールド44^は署名のイメージを含む。
【0037】図21のステップ102Aは書式タイプを
認識する。図18の例では書式タイプはフィールド11
^ 内のバー・コード化書式番号から認識される。次に図
21のステップ102Bにおいて、システムに走査入力
された書式のスキュー及びオフセットが測定される。ス
キュー及びオフセット値62は、走査書式イメージ10
^ 上のフィールドの実際の位置を突きとめるために、書
式上の各フィールドの予め指定された座標と結合されね
ばならないという点で重要である。
認識する。図18の例では書式タイプはフィールド11
^ 内のバー・コード化書式番号から認識される。次に図
21のステップ102Bにおいて、システムに走査入力
された書式のスキュー及びオフセットが測定される。ス
キュー及びオフセット値62は、走査書式イメージ10
^ 上のフィールドの実際の位置を突きとめるために、書
式上の各フィールドの予め指定された座標と結合されね
ばならないという点で重要である。
【0038】図21の流れ図は次にフィールド抽出処理
24Bを開始するように遷移し、これはステップ103
で開始され、書式10^ 上のフィールドのフィールド座
標を含むマスタ書式形式10Fをアクセスする。マスタ
書式形式10Fは図16及び図17に示される。書式上
の各それぞれのフィールドの座標を表すデータは、マス
タ書式10Fを表す図16に画像により示されている。
フィールド11Fは書式番号フィールドであり、フィー
ルド14Fはラスト・ネーム・フィールドであり、後者
は境界13を有する。フィールド16Fはファースト・
ネーム・フィールドであり、境界17を有する。フィー
ルド12aFは州フィールドである。フィールド12b
Fは住所フィールドである。フィールド44Fは署名フ
ィールドであり、フィールド12Fは通し番号フィール
ドである。図16に示されるこれらのフィールドは、こ
の例における保険請求書に対応するマスタ書式定義デー
タ・セットにおいて提供される座標データの画像表現で
ある。
24Bを開始するように遷移し、これはステップ103
で開始され、書式10^ 上のフィールドのフィールド座
標を含むマスタ書式形式10Fをアクセスする。マスタ
書式形式10Fは図16及び図17に示される。書式上
の各それぞれのフィールドの座標を表すデータは、マス
タ書式10Fを表す図16に画像により示されている。
フィールド11Fは書式番号フィールドであり、フィー
ルド14Fはラスト・ネーム・フィールドであり、後者
は境界13を有する。フィールド16Fはファースト・
ネーム・フィールドであり、境界17を有する。フィー
ルド12aFは州フィールドである。フィールド12b
Fは住所フィールドである。フィールド44Fは署名フ
ィールドであり、フィールド12Fは通し番号フィール
ドである。図16に示されるこれらのフィールドは、こ
の例における保険請求書に対応するマスタ書式定義デー
タ・セットにおいて提供される座標データの画像表現で
ある。
【0039】図17は図16に示されるマスタ書式10
Fに対応するマスタ書式定義に含まれる追加の情報を示
す。図17はマスタ機械生成データ構造(MGDS)5
0Mを表す。書式名 "申請(CLAIM)"、フィールドの
数、及び図37に示される書式情報FI内に示される他
の同様の情報などの固定書式データ65が、マスタMG
DS 50Mに含まれる。優先順位順に表現される関連
するフィールドの識別が、MGDSの固定書式データ部
分内の77に挿入される。更に、書式処理テンプレート
33を空間33Sに挿入するためにオプション空間が提
供される。テンプレート33は書式の特定の群に対応す
る個別化データを含むため、実際のテンプレート・デー
タ33は処理の後の段階において、典型的には書式認識
及びフィールド抽出プロセッサ24により空間33Sに
挿入される。図17のマスタMGDS 50Mの固定書
式データ65には書式の各ページに対応するページ情報
PIが含まれる。ここに示される例では、単一のページ
書式が使用される。ページに対応する固定書式データ
は、例えばページ番号を含む。マスタMGDS 50M
にはまた、図16のマスタ書式10Fにおける6個のデ
ータ・フィールドの各々に対応する固定フィールド・デ
ータ64が含まれる。書式上の各フィールドは図17に
おけるフィールド・データ・セグメント52Mなどのフ
ィールド・データ・セグメントにより表される。これら
は図16の第1のデータ・フィールド14Fに対応す
る。フィールド・データ・セグメント52Mはフィール
ド座標64などの固定フィールド・データ67を含む。
図17には図16のマスタ書式10Fの各長方形のフィ
ールドの左上隅に対応する座標X1及びY1、及び右下
隅に対応するX2及びY2が示されている。固定フィー
ルド・データ67にはまたフィールド名が含まれ、例え
ば図16のラスト・ネーム・フィールド14Fに対応す
るフィールド・データ・セグメント52Mでは、フィー
ルド名68には "ラスト・ネーム" が指定される。図1
7の固定フィールド・データ67にはまたフィールド・
タイプ70が含まれる。例えば、図17のフィールド・
データ・セグメント52Mは英数字に対応するフィール
ド・タイプ"A/N" を有する。
Fに対応するマスタ書式定義に含まれる追加の情報を示
す。図17はマスタ機械生成データ構造(MGDS)5
0Mを表す。書式名 "申請(CLAIM)"、フィールドの
数、及び図37に示される書式情報FI内に示される他
の同様の情報などの固定書式データ65が、マスタMG
DS 50Mに含まれる。優先順位順に表現される関連
するフィールドの識別が、MGDSの固定書式データ部
分内の77に挿入される。更に、書式処理テンプレート
33を空間33Sに挿入するためにオプション空間が提
供される。テンプレート33は書式の特定の群に対応す
る個別化データを含むため、実際のテンプレート・デー
タ33は処理の後の段階において、典型的には書式認識
及びフィールド抽出プロセッサ24により空間33Sに
挿入される。図17のマスタMGDS 50Mの固定書
式データ65には書式の各ページに対応するページ情報
PIが含まれる。ここに示される例では、単一のページ
書式が使用される。ページに対応する固定書式データ
は、例えばページ番号を含む。マスタMGDS 50M
にはまた、図16のマスタ書式10Fにおける6個のデ
ータ・フィールドの各々に対応する固定フィールド・デ
ータ64が含まれる。書式上の各フィールドは図17に
おけるフィールド・データ・セグメント52Mなどのフ
ィールド・データ・セグメントにより表される。これら
は図16の第1のデータ・フィールド14Fに対応す
る。フィールド・データ・セグメント52Mはフィール
ド座標64などの固定フィールド・データ67を含む。
図17には図16のマスタ書式10Fの各長方形のフィ
ールドの左上隅に対応する座標X1及びY1、及び右下
隅に対応するX2及びY2が示されている。固定フィー
ルド・データ67にはまたフィールド名が含まれ、例え
ば図16のラスト・ネーム・フィールド14Fに対応す
るフィールド・データ・セグメント52Mでは、フィー
ルド名68には "ラスト・ネーム" が指定される。図1
7の固定フィールド・データ67にはまたフィールド・
タイプ70が含まれる。例えば、図17のフィールド・
データ・セグメント52Mは英数字に対応するフィール
ド・タイプ"A/N" を有する。
【0040】その他のフィールド・データ67が図39
に表されるフィールド情報内に示される。図17に示さ
れるマスタMGDS 50Mは、マスタ書式定義データ
が組成されて、書式認識及びフィールド抽出プロセッサ
24に格納される様子を示す1つの例である。書式認識
及びフィールド抽出プロセッサ24は書式情報FI及び
ページ情報PIに対応する固定書式データ65を組成
し、各それぞれのフィールド・データ・セグメント52
Mなどに対応する固定フィールド・データ67をマスタ
MGDS 50M内に組成し、これは文字認識プロセッ
サ26に転送される。こうした転送に先立ち、書式認識
処理ステップ100から102Bにより生成される追加
のデータが加えられる。特にこうしたデータとして書式
イメージ10^ に対応するスキュー及びオフセット・デ
ータ62が挙げられ、またオプションとして、テンプレ
ート33が空間33Sに挿入される。
に表されるフィールド情報内に示される。図17に示さ
れるマスタMGDS 50Mは、マスタ書式定義データ
が組成されて、書式認識及びフィールド抽出プロセッサ
24に格納される様子を示す1つの例である。書式認識
及びフィールド抽出プロセッサ24は書式情報FI及び
ページ情報PIに対応する固定書式データ65を組成
し、各それぞれのフィールド・データ・セグメント52
Mなどに対応する固定フィールド・データ67をマスタ
MGDS 50M内に組成し、これは文字認識プロセッ
サ26に転送される。こうした転送に先立ち、書式認識
処理ステップ100から102Bにより生成される追加
のデータが加えられる。特にこうしたデータとして書式
イメージ10^ に対応するスキュー及びオフセット・デ
ータ62が挙げられ、またオプションとして、テンプレ
ート33が空間33Sに挿入される。
【0041】認識処理の後の段階で追加される情報のた
めの追加的空間が、図17のマスタMGDS 50Mに
割当てられる。例えば、書式返却フィールド(FR)7
2用に空間が割当てられ、オプションの文書イメージ・
ファイル・ポインタ60及びオプションの抽出イメージ
・ファイル・ポインタ74が割当てられる。コード化デ
ータ部分75がその他に追加される。MGDS 50M
に割当てられるこれらのフィールドの各々は、システム
において、対応するデータが書式の文字認識修復におい
て生成される処理段階に達するまでは空である。
めの追加的空間が、図17のマスタMGDS 50Mに
割当てられる。例えば、書式返却フィールド(FR)7
2用に空間が割当てられ、オプションの文書イメージ・
ファイル・ポインタ60及びオプションの抽出イメージ
・ファイル・ポインタ74が割当てられる。コード化デ
ータ部分75がその他に追加される。MGDS 50M
に割当てられるこれらのフィールドの各々は、システム
において、対応するデータが書式の文字認識修復におい
て生成される処理段階に達するまでは空である。
【0042】ステップ103は次に図21のステップ1
04Aに移行し、ここでは書式処理テンプレート33が
入力される。書式処理テンプレート33の例が表1、表
2、表3、表4、表5及び表6に示され、これら全ての
表は図52に表される単一の処理テンプレート33を含
む。書式処理テンプレート33は書式群を特徴化するた
めに、書式処理テンプレート定義プロセッサ57により
生成される。処理テンプレート33は書式認識及びフィ
ールド抽出プロセッサ24に入力される。
04Aに移行し、ここでは書式処理テンプレート33が
入力される。書式処理テンプレート33の例が表1、表
2、表3、表4、表5及び表6に示され、これら全ての
表は図52に表される単一の処理テンプレート33を含
む。書式処理テンプレート33は書式群を特徴化するた
めに、書式処理テンプレート定義プロセッサ57により
生成される。処理テンプレート33は書式認識及びフィ
ールド抽出プロセッサ24に入力される。
【0043】図21のステップ104Aは次にステップ
104Bに移行し、ここでは例えば書式名66などの固
定書式データ65、及びフィールド名68、タイプ7
0、フィールド座標64などの固定フィールド・データ
67が、図17に示すマスタMGDS 50Mに組込ま
れる。
104Bに移行し、ここでは例えば書式名66などの固
定書式データ65、及びフィールド名68、タイプ7
0、フィールド座標64などの固定フィールド・データ
67が、図17に示すマスタMGDS 50Mに組込ま
れる。
【0044】ステップ104Bは図22のステップ10
5Aに移行し、ここでは書式のマスタMGDSにより指
定される各フィールドに対応してループが開始される。
フィールド変数が1に等しくセットされ、次にステップ
105Aにおいてループが開始され、第1のフィールド
に対するフィールド・ロケーションが第1のフィールド
座標64及び、スキュー及びオフセット値62から計算
される。
5Aに移行し、ここでは書式のマスタMGDSにより指
定される各フィールドに対応してループが開始される。
フィールド変数が1に等しくセットされ、次にステップ
105Aにおいてループが開始され、第1のフィールド
に対するフィールド・ロケーションが第1のフィールド
座標64及び、スキュー及びオフセット値62から計算
される。
【0045】ステップ105Aは次にステップ105B
に移行し、ここではステップ変数がテンプレート内の第
1の抽出処理ステップに等しくセットされる。例えば、
これは表1ではステップ1である。
に移行し、ここではステップ変数がテンプレート内の第
1の抽出処理ステップに等しくセットされる。例えば、
これは表1ではステップ1である。
【0046】ステップ105Bは次にステップ105C
に移行し、ここではテンプレートからステップ・データ
を読出す。これはテンプレート内の特定のステップに対
し、ループを開始する。次にステップ105Dにおい
て、フィールド抽出ルーチン・ステップが文書イメージ
10^ に対して実行される。次にステップ105Eにお
いて、抽出境界がフィールド抽出ルーチンを使用するこ
とにより調整される。次にステップ106Aにおいて、
図19に示されるようにフィールド抽出ルーチンを使用
することにより、フィールド・イメージ10^^が文書イ
メージ10^ から抽出される。
に移行し、ここではテンプレートからステップ・データ
を読出す。これはテンプレート内の特定のステップに対
し、ループを開始する。次にステップ105Dにおい
て、フィールド抽出ルーチン・ステップが文書イメージ
10^ に対して実行される。次にステップ105Eにお
いて、抽出境界がフィールド抽出ルーチンを使用するこ
とにより調整される。次にステップ106Aにおいて、
図19に示されるようにフィールド抽出ルーチンを使用
することにより、フィールド・イメージ10^^が文書イ
メージ10^ から抽出される。
【0047】ステップ106Aは次にステップ106B
に移行し、ここでフィールド抽出ルーチンの実行の結
果、誤りが発生したかが判断される。誤りが検出された
場合、ステップ変数はテンプレート内に提供される誤り
時の次のステップ値に等しくセットされる。フィールド
抽出ルーチンにおいて誤りが検出されない場合は、次に
ステップ変数はこのステップにおいて、テンプレート内
に提供されるOK時の次のステップに等しくセットされ
る。
に移行し、ここでフィールド抽出ルーチンの実行の結
果、誤りが発生したかが判断される。誤りが検出された
場合、ステップ変数はテンプレート内に提供される誤り
時の次のステップ値に等しくセットされる。フィールド
抽出ルーチンにおいて誤りが検出されない場合は、次に
ステップ変数はこのステップにおいて、テンプレート内
に提供されるOK時の次のステップに等しくセットされ
る。
【0048】次にステップ106Bはステップ106C
に移行し、ここでは新たなステップが抽出処理ステップ
であるかを判断する。そうである場合、次に処理ステッ
プ105Cにループして戻る。新たなステップが抽出処
理ステップではない場合は、次にこのフィールドに対す
る抽出ステップを終了する。
に移行し、ここでは新たなステップが抽出処理ステップ
であるかを判断する。そうである場合、次に処理ステッ
プ105Cにループして戻る。新たなステップが抽出処
理ステップではない場合は、次にこのフィールドに対す
る抽出ステップを終了する。
【0049】ステップ106Cは次にステップ107A
に移行し、ここではステップが再ルート化処理ステップ
かどうかを判断する。テンプレート33が新たなステッ
プが再ルート化処理ステップであると規定する場合、テ
ンプレート内に提供される行先がMGDS内の部分76
に挿入される。
に移行し、ここではステップが再ルート化処理ステップ
かどうかを判断する。テンプレート33が新たなステッ
プが再ルート化処理ステップであると規定する場合、テ
ンプレート内に提供される行先がMGDS内の部分76
に挿入される。
【0050】ステップ107Aはステップ107Bに移
行し、ここではフィールド変数を1だけ加算し、書式内
に別のフィールドが存在するかを判断する。存在する場
合、次に処理はステップ105Aに戻る。もはや追加の
フィールドが存在しない場合、処理はステップ108に
移行する。
行し、ここではフィールド変数を1だけ加算し、書式内
に別のフィールドが存在するかを判断する。存在する場
合、次に処理はステップ105Aに戻る。もはや追加の
フィールドが存在しない場合、処理はステップ108に
移行する。
【0051】ステップ108は書式返却コード72、テ
ンプレート名59、文書イメージ・ポインタ60、抽出
イメージ・ポインタ74、スキュー及びオフセット62
などの可変書式データを、図17に示されるマスタMG
DS 50Mに挿入する。それにより図3に示されるM
GDS 50Aが形成される。処理テンプレート33は
この時、図3に示されるようにMGDS 50Aに追加
される。処理テンプレート33を処理シーケンスに従い
プロセッサ24からプロセッサ32に伝達するためには
2つの選択があり、その第1は処理テンプレート33の
MGDS 50Aへの組込みであり、第2は処理テンプ
レート33をMGDS 50Aとは別に保持する方法で
ある。
ンプレート名59、文書イメージ・ポインタ60、抽出
イメージ・ポインタ74、スキュー及びオフセット62
などの可変書式データを、図17に示されるマスタMG
DS 50Mに挿入する。それにより図3に示されるM
GDS 50Aが形成される。処理テンプレート33は
この時、図3に示されるようにMGDS 50Aに追加
される。処理テンプレート33を処理シーケンスに従い
プロセッサ24からプロセッサ32に伝達するためには
2つの選択があり、その第1は処理テンプレート33の
MGDS 50Aへの組込みであり、第2は処理テンプ
レート33をMGDS 50Aとは別に保持する方法で
ある。
【0052】次に図22の流れ図はステップ110に移
行し、ここではMGDSメッセージ50Aを出力し、流
れ図は次にステップ111へ移行し、ここで抽出された
フィールド・イメージ・ファイル10^^を出力する。
行し、ここではMGDSメッセージ50Aを出力し、流
れ図は次にステップ111へ移行し、ここで抽出された
フィールド・イメージ・ファイル10^^を出力する。
【0053】図20を参照すると、これはフィールド抽
出処理の例を表す。図20は図18の文書イメージにお
いて現れるように、ファースト・ネーム・フィールドに
対応するフィールド・イメージ16^を表す。フィール
ド・イメージ16^は周囲ボックス17、文字18、及
び擬似ライン19及び19aと共に示される。フィール
ド抽出の過程において、ボックス17のイメージは除去
される。更に、外生的ライン除去の過程において、外生
的ライン19aのイメージが排除される。なぜなら、こ
の部分はフィールド16^ の予め定義された領域の外に
存在するからである。しかしながら、この例では外生的
ライン19は図20の抽出フィールド16^^に見られる
ように、フィールド16^ 内の文字のイメージ18から
は除去されない。抽出されたフィールド・イメージ16
^^は書式に対応する図19の抽出されたフィールド・イ
メージ10^^上に現れる。
出処理の例を表す。図20は図18の文書イメージにお
いて現れるように、ファースト・ネーム・フィールドに
対応するフィールド・イメージ16^を表す。フィール
ド・イメージ16^は周囲ボックス17、文字18、及
び擬似ライン19及び19aと共に示される。フィール
ド抽出の過程において、ボックス17のイメージは除去
される。更に、外生的ライン除去の過程において、外生
的ライン19aのイメージが排除される。なぜなら、こ
の部分はフィールド16^ の予め定義された領域の外に
存在するからである。しかしながら、この例では外生的
ライン19は図20の抽出フィールド16^^に見られる
ように、フィールド16^ 内の文字のイメージ18から
は除去されない。抽出されたフィールド・イメージ16
^^は書式に対応する図19の抽出されたフィールド・イ
メージ10^^上に現れる。
【0054】抽出フィールドに残る擬似ラインの他の例
が図18の書式イメージ10^ の州フィールド12a^
に示され、対応する抽出イメージ12a^^はフロリダ州
の略字に対応する"FL"におけるLの文字に重なる擬似ラ
インを有する。
が図18の書式イメージ10^ の州フィールド12a^
に示され、対応する抽出イメージ12a^^はフロリダ州
の略字に対応する"FL"におけるLの文字に重なる擬似ラ
インを有する。
【0055】次に図22のフィールド抽出処理24Bは
ステップ107に移行し、ここでは書式名66などの固
定書式データ65を、フィールド名68、タイプ70、
フィールド座標64などの固定フィールド・データ67
と共に、図17に示されるマスタMGDS 50Mに組
込む。次にステップ108において、可変書式データが
マスタMGDS 50Mに挿入される。こうしたものに
は、例えば、現行値 "ゼロ"を有する書式返却コード7
2、文書イメージ10^のファイルに対するポインタ・
アドレスである文書イメージ・ポインタ60、抽出イメ
ージ10^^を含むファイルに対するポインタ・アドレス
である抽出イメージ・ポインタ74、スキュー及びオフ
セット値62及び、書式認識及びフィールド抽出プロセ
ッサ24におけるこの段階において現行使用可能なその
他のデータが含まれる。
ステップ107に移行し、ここでは書式名66などの固
定書式データ65を、フィールド名68、タイプ70、
フィールド座標64などの固定フィールド・データ67
と共に、図17に示されるマスタMGDS 50Mに組
込む。次にステップ108において、可変書式データが
マスタMGDS 50Mに挿入される。こうしたものに
は、例えば、現行値 "ゼロ"を有する書式返却コード7
2、文書イメージ10^のファイルに対するポインタ・
アドレスである文書イメージ・ポインタ60、抽出イメ
ージ10^^を含むファイルに対するポインタ・アドレス
である抽出イメージ・ポインタ74、スキュー及びオフ
セット値62及び、書式認識及びフィールド抽出プロセ
ッサ24におけるこの段階において現行使用可能なその
他のデータが含まれる。
【0056】図22のフィールド抽出処理24Bは図3
に示されるMGDS 50Aを文字認識プロセッサ26
に出力する。これらの処理が図33の知能的書式プロセ
ッサ25においてマルチタスクで実行される場合、MG
DSメッセージ50Aはプロセッサ25のメモリにおけ
る共通アクセス可能区分に転送される。図1乃至図2の
マルチプロセッサLANの実施例では、MGDSメッセ
ージ50AはLAN20を介して文字認識プロセッサ2
6に転送される。
に示されるMGDS 50Aを文字認識プロセッサ26
に出力する。これらの処理が図33の知能的書式プロセ
ッサ25においてマルチタスクで実行される場合、MG
DSメッセージ50Aはプロセッサ25のメモリにおけ
る共通アクセス可能区分に転送される。図1乃至図2の
マルチプロセッサLANの実施例では、MGDSメッセ
ージ50AはLAN20を介して文字認識プロセッサ2
6に転送される。
【0057】図22の処理は抽出イメージ・ファイル1
0^^を出力する。抽出フィールド・イメージ・ファイル
10^^はそのアドレスが抽出イメージ・ポインタ74に
より参照されるファイルに配置され、抽出イメージ10
^^はバッファ40或いはバッファ・サーバ40^ に格納
される。或いは抽出フィールド・イメージ10^^は、直
接、文字認識プロセッサ26に転送される。
0^^を出力する。抽出フィールド・イメージ・ファイル
10^^はそのアドレスが抽出イメージ・ポインタ74に
より参照されるファイルに配置され、抽出イメージ10
^^はバッファ40或いはバッファ・サーバ40^ に格納
される。或いは抽出フィールド・イメージ10^^は、直
接、文字認識プロセッサ26に転送される。
【0058】図3は書式認識及びフィールド抽出プロセ
ッサ24から出力されるMGDS50Aの詳細を表す。
特に図3に示されるMGDS 50Aは、図18に示さ
れる書式イメージ10^ の6個のフィールドの内の最初
の2個に対応する、第1のフィールド・データ・セグメ
ント52A及び第2のフィールド・データ・セグメント
54Aを表す。
ッサ24から出力されるMGDS50Aの詳細を表す。
特に図3に示されるMGDS 50Aは、図18に示さ
れる書式イメージ10^ の6個のフィールドの内の最初
の2個に対応する、第1のフィールド・データ・セグメ
ント52A及び第2のフィールド・データ・セグメント
54Aを表す。
【0059】図8はMGDS 50Aの組込みにおける
後半の段階で、書式認識及びフィールド抽出プロセッサ
24から出力されるMGDS 50Aを示し、第1のフ
ィールド・データ・セグメント52A及び第2のフィー
ルド・データ・セグメント54A以外に、図18の書式
イメージ10^上の第3のフィールド12a^に対応する
第3のフィールド・データ・セグメント56Aを含む。
後半の段階で、書式認識及びフィールド抽出プロセッサ
24から出力されるMGDS 50Aを示し、第1のフ
ィールド・データ・セグメント52A及び第2のフィー
ルド・データ・セグメント54A以外に、図18の書式
イメージ10^上の第3のフィールド12a^に対応する
第3のフィールド・データ・セグメント56Aを含む。
【0060】書式認識及びフィールド抽出プロセッサ2
4は、図3に詳細に示される第1段階のMGDSデータ
構造メッセージ50Aを生成する。MGDS 50Aの
書式情報における特定の形式が図37に示される。書式
返却コード・パラメータは値6を有する、長さエンティ
ティ、IDエンティティ、及びデータ・エンティティを
有する。データ・エンティティは2バイト長、IDエン
ティティは2バイト長、長さエンティティは2バイト長
であり、長さエンティティの値は6であり、これはパラ
メータにおける合計バイト数を表す。MGDSは関連す
るパラメータの全グループが容易に転送され解析される
ように、関連パラメータを一緒にグループ化する。いく
つかのサブ・パラメータを包含するようにパラメータを
指定することにより、パラメータはグループ化される。
例えば、フィールド情報パラメータなどのこうした包含
パラメータ、或いはコンテナ・オブジェクトが図37に
示されており、これらは長さエンティティ、IDエンテ
ィティ、及びデータ・エンティティを有する。データ・
エンティティには矢印が含まれており、これは包含パラ
メータのデータがパラメータのグループであり、包含パ
ラメータの長さエンティティにおいて指定される長さ以
内に納まることを示している。
4は、図3に詳細に示される第1段階のMGDSデータ
構造メッセージ50Aを生成する。MGDS 50Aの
書式情報における特定の形式が図37に示される。書式
返却コード・パラメータは値6を有する、長さエンティ
ティ、IDエンティティ、及びデータ・エンティティを
有する。データ・エンティティは2バイト長、IDエン
ティティは2バイト長、長さエンティティは2バイト長
であり、長さエンティティの値は6であり、これはパラ
メータにおける合計バイト数を表す。MGDSは関連す
るパラメータの全グループが容易に転送され解析される
ように、関連パラメータを一緒にグループ化する。いく
つかのサブ・パラメータを包含するようにパラメータを
指定することにより、パラメータはグループ化される。
例えば、フィールド情報パラメータなどのこうした包含
パラメータ、或いはコンテナ・オブジェクトが図37に
示されており、これらは長さエンティティ、IDエンテ
ィティ、及びデータ・エンティティを有する。データ・
エンティティには矢印が含まれており、これは包含パラ
メータのデータがパラメータのグループであり、包含パ
ラメータの長さエンティティにおいて指定される長さ以
内に納まることを示している。
【0061】MGDS 50Aの最初の部分Hに含まれ
る書式情報FIは図37に示されるパラメータを含む。
MGDSパラメータは全MGDS 50Aを含む包含パ
ラメータである。MGDSバージョン・パラメータは使
用されるMGDSのバージョンを記述する。書式返却コ
ード・パラメータは、イメージの処理の際に誤りに遭遇
したかどうかを示す。返却コードがフィールド・レベル
において誤りが存在することを示すと、正確な誤りを判
断するために拒絶文字及び懐疑文字の返却コードがチェ
ックされねばならない。書式返却コードは拒絶処理が文
書イメージに対し、要求されるかどうかを判断するため
の主標識である。負の返却コードは書式或いはフィール
ド・レベルにおいて誤りが発生しており、書式が実際に
誤って識別される可能性があることを示す。正の返却コ
ードは書式上の全てのフィールドにおいて見いだされた
拒絶文字或いは懐疑文字の数を示す。この返却コードは
誤り訂正が成功して実施された後にゼロにリセットされ
る。
る書式情報FIは図37に示されるパラメータを含む。
MGDSパラメータは全MGDS 50Aを含む包含パ
ラメータである。MGDSバージョン・パラメータは使
用されるMGDSのバージョンを記述する。書式返却コ
ード・パラメータは、イメージの処理の際に誤りに遭遇
したかどうかを示す。返却コードがフィールド・レベル
において誤りが存在することを示すと、正確な誤りを判
断するために拒絶文字及び懐疑文字の返却コードがチェ
ックされねばならない。書式返却コードは拒絶処理が文
書イメージに対し、要求されるかどうかを判断するため
の主標識である。負の返却コードは書式或いはフィール
ド・レベルにおいて誤りが発生しており、書式が実際に
誤って識別される可能性があることを示す。正の返却コ
ードは書式上の全てのフィールドにおいて見いだされた
拒絶文字或いは懐疑文字の数を示す。この返却コードは
誤り訂正が成功して実施された後にゼロにリセットされ
る。
【0062】変換時(when-to-convert) パラメータは
MGDSを生成するアプリケーション、すなわち書式認
識及びフィールド抽出プロセッサ24がMGDS内の文
字データを、適切なホスト・コード・ページに変換した
かどうかを示す。パラメータ値ゼロはMGDSを生成す
るアプリケーションが、文字データが生成された元のA
SCIIコード・ページ内に文字データを残したことを
示し、数値データはワークステーション・バイト順序で
現れ、数値の16進表現はバイトをフリップすることに
より読出される。値2はMGDSを生成するアプリケー
ションが文字データを適切なホストEBCDICコード
・ページに変換したことを示し、数値データの複製がホ
スト・バイト順序で現れ、この時は数値の16進表現は
バイトをフリップすることなく読出される。値1は数値
データのバイト順序及び文字データがコード・ページに
変換されたかどうかを決定するために、書式返却コード
の検査を要求する。
MGDSを生成するアプリケーション、すなわち書式認
識及びフィールド抽出プロセッサ24がMGDS内の文
字データを、適切なホスト・コード・ページに変換した
かどうかを示す。パラメータ値ゼロはMGDSを生成す
るアプリケーションが、文字データが生成された元のA
SCIIコード・ページ内に文字データを残したことを
示し、数値データはワークステーション・バイト順序で
現れ、数値の16進表現はバイトをフリップすることに
より読出される。値2はMGDSを生成するアプリケー
ションが文字データを適切なホストEBCDICコード
・ページに変換したことを示し、数値データの複製がホ
スト・バイト順序で現れ、この時は数値の16進表現は
バイトをフリップすることなく読出される。値1は数値
データのバイト順序及び文字データがコード・ページに
変換されたかどうかを決定するために、書式返却コード
の検査を要求する。
【0063】書式クラス名パラメータは書式に対応して
認識された書式クラス名を示す。この名前は書式認識オ
ペレーションを実行する書式認識及びフィールド抽出プ
ロセッサ24により定義される。
認識された書式クラス名を示す。この名前は書式認識オ
ペレーションを実行する書式認識及びフィールド抽出プ
ロセッサ24により定義される。
【0064】書式名パラメータは書式名を提供し、これ
についても書式認識オペレーションを実行する書式認識
及びフィールド抽出プロセッサ24により定義される。
についても書式認識オペレーションを実行する書式認識
及びフィールド抽出プロセッサ24により定義される。
【0065】汎用コード・ページ・パラメータは未認識
の文字フラグ、書式クラス名、フィールド名、フィール
ド関係、及びフィールド修復パラメータに対応するコー
ド・ページである。これらの全ての項目が1コード・ペ
ージ上に現れるものと仮定する。いくつかのコード・ペ
ージがこれらの異なる項目に対し存在する場合、未認識
文字フラグのコード・ページが使用される。
の文字フラグ、書式クラス名、フィールド名、フィール
ド関係、及びフィールド修復パラメータに対応するコー
ド・ページである。これらの全ての項目が1コード・ペ
ージ上に現れるものと仮定する。いくつかのコード・ペ
ージがこれらの異なる項目に対し存在する場合、未認識
文字フラグのコード・ページが使用される。
【0066】未認識文字フラグ・パラメータは文字デー
タ・バッファ内の未認識文字を表すために使用される。
フィールド・パラメータの数はMGDSにおいてデータ
が返却されるフィールドの数を示す。
タ・バッファ内の未認識文字を表すために使用される。
フィールド・パラメータの数はMGDSにおいてデータ
が返却されるフィールドの数を示す。
【0067】書式コード・ページ・パラメータは書式上
の全てのデータに対して使用される。書式上の全てのデ
ータが同一のコード・ページを使用する場合、このパラ
メータはそのコード・ページを示す。書式上において異
なるコード・ページが使用される場合、このフィールド
は返却されず、フィールド・コード・ページ・パラメー
タは各フィールドにおけるコード・ページを示す。デー
タがコード・ページからコード・ページに変換され、M
GDS内に戻され格納される時、このパラメータは書式
データに対応する現行のコード・ページを反映するべき
である。
の全てのデータに対して使用される。書式上の全てのデ
ータが同一のコード・ページを使用する場合、このパラ
メータはそのコード・ページを示す。書式上において異
なるコード・ページが使用される場合、このフィールド
は返却されず、フィールド・コード・ページ・パラメー
タは各フィールドにおけるコード・ページを示す。デー
タがコード・ページからコード・ページに変換され、M
GDS内に戻され格納される時、このパラメータは書式
データに対応する現行のコード・ページを反映するべき
である。
【0068】ホスト書式コード・ページ・パラメータ
は、ホストがイメージから検索された全ての文字情報に
対し指定したコード・ページである。文字は情報が最後
の処理のためにホストに提供される以前に、このコード
に変換されるべきである。書式コード・ページ・パラメ
ータに関連する全ての文字情報は、変換時パラメータ値
に基づき、ホスト・コード・ページに変換される。
は、ホストがイメージから検索された全ての文字情報に
対し指定したコード・ページである。文字は情報が最後
の処理のためにホストに提供される以前に、このコード
に変換されるべきである。書式コード・ページ・パラメ
ータに関連する全ての文字情報は、変換時パラメータ値
に基づき、ホスト・コード・ページに変換される。
【0069】ホスト・コード・ページ・パラメータは、
特定のフィールド・コード・ページに対応するフィール
ド情報が変換されるべきホスト・コード・ページを示
す。このパラメータはフィールド・コード・ページ・パ
ラメータが存在する時にはそれと1対1でマップされ、
特定のフィールドのデータが変換されるべきホスト・コ
ード・ページを示す。
特定のフィールド・コード・ページに対応するフィール
ド情報が変換されるべきホスト・コード・ページを示
す。このパラメータはフィールド・コード・ページ・パ
ラメータが存在する時にはそれと1対1でマップされ、
特定のフィールドのデータが変換されるべきホスト・コ
ード・ページを示す。
【0070】ページ情報パラメータは文書の各ページに
関する情報を含む包含パラメータである。このパラメー
タは各ページ上のフィールドに関する情報は含まない。
関する情報を含む包含パラメータである。このパラメー
タは各ページ上のフィールドに関する情報は含まない。
【0071】フィールド情報パラメータはフィールド・
データ・セグメントに対応する包含パラメータであり、
書式のページ上の各それぞれのフィールドに対応して返
却される全ての情報をグループ化するために使用され
る。各フィールドに対応するフィールド・データの全セ
ットの長さ以外の情報はパラメータ内に存在しない。
データ・セグメントに対応する包含パラメータであり、
書式のページ上の各それぞれのフィールドに対応して返
却される全ての情報をグループ化するために使用され
る。各フィールドに対応するフィールド・データの全セ
ットの長さ以外の情報はパラメータ内に存在しない。
【0072】ページ情報形式が図38に示される。ペー
ジ番号パラメータはページ情報包含パラメータ内に現れ
る情報に対するページ番号を提供する。ページ解析パラ
メータは、ページ情報パラメータ内に配置されるページ
番号パラメータにより示される特定のページの解析を提
供する。ページ方向パラメータは特定の書式ページの方
向を提供する。その値は無回転、或いは時計回りの90
度、180度、或いは270度の回転を示す。
ジ番号パラメータはページ情報包含パラメータ内に現れ
る情報に対するページ番号を提供する。ページ解析パラ
メータは、ページ情報パラメータ内に配置されるページ
番号パラメータにより示される特定のページの解析を提
供する。ページ方向パラメータは特定の書式ページの方
向を提供する。その値は無回転、或いは時計回りの90
度、180度、或いは270度の回転を示す。
【0073】図39はフィールド情報の詳細な形式を表
す。拒絶文字返却コード・パラメータは、文字認識処理
の最中に拒絶文字に遭遇したことを示す。このパラメー
タは文字認識プロセッサがそのオペレーションを実行す
るまで、データにより充填されない。このフィールドの
数はそのフィールドにおいて遭遇した拒絶文字の数を示
す。数が負の場合はフィールドの処理の最中に、誤りに
遭遇したことを示す。
す。拒絶文字返却コード・パラメータは、文字認識処理
の最中に拒絶文字に遭遇したことを示す。このパラメー
タは文字認識プロセッサがそのオペレーションを実行す
るまで、データにより充填されない。このフィールドの
数はそのフィールドにおいて遭遇した拒絶文字の数を示
す。数が負の場合はフィールドの処理の最中に、誤りに
遭遇したことを示す。
【0074】懐疑文字返却コード・パラメータは文字認
識プロセッサ26による文字認識処理の間に、懐疑文字
に遭遇したことを示す。このフィールドの数はそのフィ
ールドにおいて遭遇した懐疑文字の数を示す。フィール
ド関連パラメータはそのフィールドをホスト・フィール
ドと関連づけるために使用される。これはユーザがその
関連値を示すために書式定義ユーティリティに入力する
IDであり、書式認識及びフィールド抽出プロセッサ2
4により提供される。このフィールドはフィールド名パ
ラメータとは異なる。なぜなら、これはフィールドを、
書式上に現れるフィールドといった観点よりも、アプリ
ケーション使用といった観点で記述することに依存す
る。例えば、このフィールドはホスト・アプリケーショ
ンにとって重要な指標化情報を含んだりする。
識プロセッサ26による文字認識処理の間に、懐疑文字
に遭遇したことを示す。このフィールドの数はそのフィ
ールドにおいて遭遇した懐疑文字の数を示す。フィール
ド関連パラメータはそのフィールドをホスト・フィール
ドと関連づけるために使用される。これはユーザがその
関連値を示すために書式定義ユーティリティに入力する
IDであり、書式認識及びフィールド抽出プロセッサ2
4により提供される。このフィールドはフィールド名パ
ラメータとは異なる。なぜなら、これはフィールドを、
書式上に現れるフィールドといった観点よりも、アプリ
ケーション使用といった観点で記述することに依存す
る。例えば、このフィールドはホスト・アプリケーショ
ンにとって重要な指標化情報を含んだりする。
【0075】フィールド名パラメータは誤り訂正、及び
データ入力の最中にフィールドを記述するために使用さ
れるフィールド記述である。フィールド書式ページ・パ
ラメータはそのフィールドが現れる書式ページである。
データ入力の最中にフィールドを記述するために使用さ
れるフィールド記述である。フィールド書式ページ・パ
ラメータはそのフィールドが現れる書式ページである。
【0076】フィールド座標パラメータは文字認識プロ
セッサ26により充填され、フィールドの座標はフィー
ルドを強調表示したり、続く修復段階においてフィール
ドを修復するために使用される。これらの座標はフィー
ルドを取り囲む長方形の左上端部、及び右下端部の座標
を示し、00座標がイメージの左上端部に配置される座
標系にもとづく。4個の座標値の各々は4バイトを使用
し、それぞれはX左端、Y下端、X右端、及びY上端を
示す。
セッサ26により充填され、フィールドの座標はフィー
ルドを強調表示したり、続く修復段階においてフィール
ドを修復するために使用される。これらの座標はフィー
ルドを取り囲む長方形の左上端部、及び右下端部の座標
を示し、00座標がイメージの左上端部に配置される座
標系にもとづく。4個の座標値の各々は4バイトを使用
し、それぞれはX左端、Y下端、X右端、及びY上端を
示す。
【0077】図40に示すコード化データ・パラメータ
は、各フィールドにおいて同一のコード・ページを有す
る全ての文字情報をグループ化するために使用される包
含パラメータである。複数のコード・ページが各フィー
ルドにおいて使用されるため、コード化データ・パラメ
ータはコード・ページ及び文字情報をグループ化する。
文字情報は文字認識プロセッサがそのオペレーションを
実行するまで供給されない。このパラメータにはコード
・ページ及び文字情報の長さ以外の情報は含まれない。
コード化データ・パラメータの存在はフィールド存在パ
ラメータの存在と互いに排他的である。両方のパラメー
タは同一のフィールドに対して同時には存在しない。フ
ィールド存在パラメータはフィールドがデータを含むか
どうかを示し、例えばチェック・ボックス・フィールド
として使用される。
は、各フィールドにおいて同一のコード・ページを有す
る全ての文字情報をグループ化するために使用される包
含パラメータである。複数のコード・ページが各フィー
ルドにおいて使用されるため、コード化データ・パラメ
ータはコード・ページ及び文字情報をグループ化する。
文字情報は文字認識プロセッサがそのオペレーションを
実行するまで供給されない。このパラメータにはコード
・ページ及び文字情報の長さ以外の情報は含まれない。
コード化データ・パラメータの存在はフィールド存在パ
ラメータの存在と互いに排他的である。両方のパラメー
タは同一のフィールドに対して同時には存在しない。フ
ィールド存在パラメータはフィールドがデータを含むか
どうかを示し、例えばチェック・ボックス・フィールド
として使用される。
【0078】図41に示される拒絶文字情報パラメータ
は文字認識プロセッサ26により追加される包含パラメ
ータであり、拒絶文字或いは懐疑文字に関する全ての情
報をグループ化するために使用される。拒絶情報の長さ
以外にはこのパラメータには情報は存在しない。
は文字認識プロセッサ26により追加される包含パラメ
ータであり、拒絶文字或いは懐疑文字に関する全ての情
報をグループ化するために使用される。拒絶情報の長さ
以外にはこのパラメータには情報は存在しない。
【0079】図3に示されるMDS50Aはテンプレー
トIDの記憶に対応する部分59を含む。表1乃至表6
に示される例では、テンプレートIDは "洪水申請(fl
oodclaims)" であり、これは部分59に挿入される。
図3のMGDS 50Aにはまた、再ルート行先(RR)
を格納する部分76が含まれる。誤りの特定の組合せが
再ルート行先を指すテンプレートに相当する場合、再ル
ート行先の識別は部分76に格納される。また図3には
MGDSの一部である63が示され、これは文字認識プ
ロセッサ26において、文字認識の対象となる各それぞ
れのフィールドにおける認識ルーチンの識別を格納す
る。図3にはまたMGDS 50Aにおいて選択的に含
まれる処理テンプレート33が示される。図3は更に、
MGDS50Aにおける関連するフィールド・データ7
7のロケーションが示される。
トIDの記憶に対応する部分59を含む。表1乃至表6
に示される例では、テンプレートIDは "洪水申請(fl
oodclaims)" であり、これは部分59に挿入される。
図3のMGDS 50Aにはまた、再ルート行先(RR)
を格納する部分76が含まれる。誤りの特定の組合せが
再ルート行先を指すテンプレートに相当する場合、再ル
ート行先の識別は部分76に格納される。また図3には
MGDSの一部である63が示され、これは文字認識プ
ロセッサ26において、文字認識の対象となる各それぞ
れのフィールドにおける認識ルーチンの識別を格納す
る。図3にはまたMGDS 50Aにおいて選択的に含
まれる処理テンプレート33が示される。図3は更に、
MGDS50Aにおける関連するフィールド・データ7
7のロケーションが示される。
【0080】オプションとしてイメージ・データ・パラ
メータ(図示せず)がプロセッサ24により提供され、
MGDSメッセージ50Aに含まれる。プロセッサ24
がそのフィールド抽出オペレーションを実行後に、フィ
ールドのクリーン・アップされたイメージは順番にビッ
ト・マップ配列され、時に圧縮され、MGDS 50A
にロードされる。
メータ(図示せず)がプロセッサ24により提供され、
MGDSメッセージ50Aに含まれる。プロセッサ24
がそのフィールド抽出オペレーションを実行後に、フィ
ールドのクリーン・アップされたイメージは順番にビッ
ト・マップ配列され、時に圧縮され、MGDS 50A
にロードされる。
【0081】図36を参照すると、MGDSメッセージ
構造における種々のMGDSパラメータ間の関係が表さ
れる。書式情報はMGDS 50Aの最初の部分に相当
する。その後には図36に一群として示されるページ情
報が続く。更にいくつかのフィールド情報セグメントが
それに続き、各フィールド情報セグメントは本書式のフ
ィールドの1個に対応する。フィールド情報セグメント
内には、1個以上のコード化データ・セグメントが含ま
れ、各コード化データ・セグメントは単一のコード・ペ
ージにより特徴づけられるフィールドの一部に対応す
る。全フィールドが単一のコード・ページにより特徴づ
けられる場合、フィールドに対応して単一のコード化デ
ータ・セグメントが存在する。フィールド情報にはまた
文字認識プロセッサ26により生成される拒絶文字情報
が含まれる。
構造における種々のMGDSパラメータ間の関係が表さ
れる。書式情報はMGDS 50Aの最初の部分に相当
する。その後には図36に一群として示されるページ情
報が続く。更にいくつかのフィールド情報セグメントが
それに続き、各フィールド情報セグメントは本書式のフ
ィールドの1個に対応する。フィールド情報セグメント
内には、1個以上のコード化データ・セグメントが含ま
れ、各コード化データ・セグメントは単一のコード・ペ
ージにより特徴づけられるフィールドの一部に対応す
る。全フィールドが単一のコード・ページにより特徴づ
けられる場合、フィールドに対応して単一のコード化デ
ータ・セグメントが存在する。フィールド情報にはまた
文字認識プロセッサ26により生成される拒絶文字情報
が含まれる。
【0082】文字認識プロセッサにより実行される文字
認識処理26Aは、図20のイメージ16^^に対して作
用し、文字ストリング42"Ja*n"を生成する。
認識処理26Aは、図20のイメージ16^^に対して作
用し、文字ストリング42"Ja*n"を生成する。
【0083】図23、図24及び図25は文字認識処理
26Aに対応するオペレーション・ステップのシーケン
スの流れ図である。
26Aに対応するオペレーション・ステップのシーケン
スの流れ図である。
【0084】ステップ112は書式処理テンプレート3
3を入力する。次にステップ113Aは図3に示される
MGDSメッセージ50Aを入力する。ステップ112
及び113Aは、書式処理テンプレート33がMGDS
50Aの一部として組込まれる場合には、単一のステ
ップにおいて実行される。ステップ113Bは次に図1
9に示される抽出されたフィールド・イメージ・ファイ
ルを入力する。
3を入力する。次にステップ113Aは図3に示される
MGDSメッセージ50Aを入力する。ステップ112
及び113Aは、書式処理テンプレート33がMGDS
50Aの一部として組込まれる場合には、単一のステ
ップにおいて実行される。ステップ113Bは次に図1
9に示される抽出されたフィールド・イメージ・ファイ
ルを入力する。
【0085】次にステップ114は書式上の各フィール
ドに対しループを開始する。最初にフィールド変数が1
にセットされる。ステップ114はMGDSメッセージ
50Aからフィールド・データ・セグメントを獲得す
る。
ドに対しループを開始する。最初にフィールド変数が1
にセットされる。ステップ114はMGDSメッセージ
50Aからフィールド・データ・セグメントを獲得す
る。
【0086】次にステップ115Aにおいて、MGDS
50Aの部分76に再ルート行先値が存在し、かつそ
の行先が文字認識処理26A以外の処理である場合、図
23の処理はステップ134に移行する。"skip"コマン
ドが部分76に存在する場合は、図23の処理はステッ
プ134に移行する。
50Aの部分76に再ルート行先値が存在し、かつそ
の行先が文字認識処理26A以外の処理である場合、図
23の処理はステップ134に移行する。"skip"コマン
ドが部分76に存在する場合は、図23の処理はステッ
プ134に移行する。
【0087】処理ステップ115Aは次にステップ11
5Bに移行する。ステップ115Bからステップ115
Eはテンプレートがこのフィールドに対応して、 "冗長
時のスキップ" ステップを含む場合、"冗長時のスキッ
プ"オペレーションを実行する。冗長である場合、次に
図23のステップ115BはMGDSから関連するフィ
ールド・データ77を獲得し、このフィールドよりも高
位の優先順位を有し、かつ文字認識コード化データを有
する関連するフィールドを識別する。この例は州の略字
フィールドに対応して表3に表される。表3のステップ
3では "冗長時のスキップ" 処理のタイプが指定され
る。ステップ115Bは図3に示される関連するフィー
ルド・データ77をチェックする。関連フィールドは "
(1、2);3"を指定する。これはフィールド1及び2が
一緒に獲得される時に上位の優先順位を有し、フィール
ド3に関連されることを表す。この例ではフィールド1
は"Doe" を含むラスト・ネーム・フィールドであり、フ
ィールド2は"John"を含むファースト・ネーム・フィー
ルドである。これらの2個のフィールドはそれらのコー
ド化データが特定の場合、ホスト・コンピュータ34及
びそこで実行される保険アプリケーションに対し、顧
客"John Doe"を特徴づける全ての情報を指定するのに十
分である。そうした情報には、彼が住む州であるフロリ
ダが含まれる。従って、図23のステップ115Bは2
個の関連フィールドすなわちフィールド1及び2を識別
し、これらはフィールド3よりも高位の優先順位を有
し、フィールド1及び2はまた文字認識コード化データ
を有し、それらについては図4のMGDS 50Bにお
けるそれぞれのデータ・セグメントにより表される。フ
ィールド1及び2はフィールド3の処理に先立ち、文字
認識プロセッサ26により処理され、従って、文字デー
タ・バッファB^ 内のコード化データ"Doe" 及び文字デ
ータ・バッファB内のコード化データ"Ja*n"42は、既
に図23のステップ115Bがフィールド3を処理して
いる時点には存在する。
5Bに移行する。ステップ115Bからステップ115
Eはテンプレートがこのフィールドに対応して、 "冗長
時のスキップ" ステップを含む場合、"冗長時のスキッ
プ"オペレーションを実行する。冗長である場合、次に
図23のステップ115BはMGDSから関連するフィ
ールド・データ77を獲得し、このフィールドよりも高
位の優先順位を有し、かつ文字認識コード化データを有
する関連するフィールドを識別する。この例は州の略字
フィールドに対応して表3に表される。表3のステップ
3では "冗長時のスキップ" 処理のタイプが指定され
る。ステップ115Bは図3に示される関連するフィー
ルド・データ77をチェックする。関連フィールドは "
(1、2);3"を指定する。これはフィールド1及び2が
一緒に獲得される時に上位の優先順位を有し、フィール
ド3に関連されることを表す。この例ではフィールド1
は"Doe" を含むラスト・ネーム・フィールドであり、フ
ィールド2は"John"を含むファースト・ネーム・フィー
ルドである。これらの2個のフィールドはそれらのコー
ド化データが特定の場合、ホスト・コンピュータ34及
びそこで実行される保険アプリケーションに対し、顧
客"John Doe"を特徴づける全ての情報を指定するのに十
分である。そうした情報には、彼が住む州であるフロリ
ダが含まれる。従って、図23のステップ115Bは2
個の関連フィールドすなわちフィールド1及び2を識別
し、これらはフィールド3よりも高位の優先順位を有
し、フィールド1及び2はまた文字認識コード化データ
を有し、それらについては図4のMGDS 50Bにお
けるそれぞれのデータ・セグメントにより表される。フ
ィールド1及び2はフィールド3の処理に先立ち、文字
認識プロセッサ26により処理され、従って、文字デー
タ・バッファB^ 内のコード化データ"Doe" 及び文字デ
ータ・バッファB内のコード化データ"Ja*n"42は、既
に図23のステップ115Bがフィールド3を処理して
いる時点には存在する。
【0088】ステップ115Bは次に図23のステップ
115Cに移行し、より高位の優先順位の関連フィール
ドのコード化データに対応する確率データを獲得する。
この場合、ステップ115Cは第2のフィールドに対応
する文字確率61を獲得し、これは図4に示されるよう
に50パーセントの値を有し、2個の拒絶文字が含ま
れ、それらは第1の拒絶文字31及び第2の懐疑文字で
ある。
115Cに移行し、より高位の優先順位の関連フィール
ドのコード化データに対応する確率データを獲得する。
この場合、ステップ115Cは第2のフィールドに対応
する文字確率61を獲得し、これは図4に示されるよう
に50パーセントの値を有し、2個の拒絶文字が含ま
れ、それらは第1の拒絶文字31及び第2の懐疑文字で
ある。
【0089】図23のステップ115Cは次にステップ
115Dに移行し、ここではより高位の優先順位関連フ
ィールドのコード化データに対応する確率が、テンプレ
ート33において指定されるステップに対応する分岐値
よりも大きいかを判断する。表3のステップ3を参照す
ると、最大認識拒絶誤りはゼロであり、最大認識懐疑文
字誤りもまたゼロである。従って、115Dはフィール
ド2のコード化データに対応する確率はテンプレート3
3の表3のステップ3において指定される分岐値よりも
大きくはないと判断する。従って、ステップ115Dは
ステップ116Aに移行し、"冗長時のスキップ"オペレ
ーションはフィールド3の処理のこの段階で終了され
る。
115Dに移行し、ここではより高位の優先順位関連フ
ィールドのコード化データに対応する確率が、テンプレ
ート33において指定されるステップに対応する分岐値
よりも大きいかを判断する。表3のステップ3を参照す
ると、最大認識拒絶誤りはゼロであり、最大認識懐疑文
字誤りもまたゼロである。従って、115Dはフィール
ド2のコード化データに対応する確率はテンプレート3
3の表3のステップ3において指定される分岐値よりも
大きくはないと判断する。従って、ステップ115Dは
ステップ116Aに移行し、"冗長時のスキップ"オペレ
ーションはフィールド3の処理のこの段階で終了され
る。
【0090】図23において、より高位の関連フィール
ドのコード化データに対応する確率が、テンプレート3
3のステップに対応して提供される分岐値よりも大きい
場合は、処理はステップ115Eに移行し、ここでこの
フィールドにおけるMGDS行先部分76に"スキップ"
コマンドを挿入する。次に処理はステップ134に移行
する。これはこのフィールドすなわちこの例において
は、州の略字に対応するフィールド3が、続く文字認識
或いはコード化データ誤り訂正処理において、更に処理
されることを阻止する作用を有する。これはこの場合の
例においては当てはまらないため、図23の処理はステ
ップ115Dからステップ116Aに移行する。
ドのコード化データに対応する確率が、テンプレート3
3のステップに対応して提供される分岐値よりも大きい
場合は、処理はステップ115Eに移行し、ここでこの
フィールドにおけるMGDS行先部分76に"スキップ"
コマンドを挿入する。次に処理はステップ134に移行
する。これはこのフィールドすなわちこの例において
は、州の略字に対応するフィールド3が、続く文字認識
或いはコード化データ誤り訂正処理において、更に処理
されることを阻止する作用を有する。これはこの場合の
例においては当てはまらないため、図23の処理はステ
ップ115Dからステップ116Aに移行する。
【0091】処理はステップ116Aに移行し、ここで
フィールド・データ・セグメントからフィールド座標6
4を獲得する。次にステップ116Bにおいて、図19
の抽出されたフィールド・イメージのビット・マップを
獲得する。
フィールド・データ・セグメントからフィールド座標6
4を獲得する。次にステップ116Bにおいて、図19
の抽出されたフィールド・イメージのビット・マップを
獲得する。
【0092】次にステップ117Aにおいて、ステップ
変数をテンプレート33における第1の認識処理ステッ
プに等しくセットする。これは表1ではステップ3であ
る。次にステップ117Bにおいて、このフィールドに
対する認識ステップが存在しない場合、次に処理はステ
ップ134に移行する。
変数をテンプレート33における第1の認識処理ステッ
プに等しくセットする。これは表1ではステップ3であ
る。次にステップ117Bにおいて、このフィールドに
対する認識ステップが存在しない場合、次に処理はステ
ップ134に移行する。
【0093】ステップ118は次にフィールド内の各ス
テップに対応してループを開始する。ここで表1を参照
しながら本発明のオペレーションについて説明する。図
24のステップ118ではテンプレートからステップ・
データを読出す。ステップは第1の認識処理ステップで
あるため、これは表1ではステップ3でありハンドプリ
ント認識ルーチンを指定する。図24のステップ119
はフィールド・イメージ上において認識ルーチン・ステ
ップを実行する。この場合、それはハンドプリント認識
ルーチンに相当する。次に図24のステップ120にお
いて、選択された認識ルーチンを使用することにより、
コード化データ42が生成される。ステップ121にお
いて、未認識の文字31が図20に示されるようにフラ
グ化される。次にステップ122において、懐疑文字位
置が図20に示されるように識別される。
テップに対応してループを開始する。ここで表1を参照
しながら本発明のオペレーションについて説明する。図
24のステップ118ではテンプレートからステップ・
データを読出す。ステップは第1の認識処理ステップで
あるため、これは表1ではステップ3でありハンドプリ
ント認識ルーチンを指定する。図24のステップ119
はフィールド・イメージ上において認識ルーチン・ステ
ップを実行する。この場合、それはハンドプリント認識
ルーチンに相当する。次に図24のステップ120にお
いて、選択された認識ルーチンを使用することにより、
コード化データ42が生成される。ステップ121にお
いて、未認識の文字31が図20に示されるようにフラ
グ化される。次にステップ122において、懐疑文字位
置が図20に示されるように識別される。
【0094】次に図24のステップ123において、選
択された認識ルーチンにより生成された拒絶誤りが、こ
のステップにおいてテンプレート内に指定される最大認
識拒絶誤り値よりも大きいかどうかが判断される(表1
参照)。また、選択された認識ルーチンにより生成され
た懐疑的誤りが、テンプレート内に指定される最大認識
懐疑的誤り値よりも大きいかどうかが判断される(表1
参照)。表1に示されるように、ステップ3におけるハ
ンドプリント認識ルーチンに対応して、最大拒絶誤り率
は1個の誤りであり、最大懐疑的誤り率は1個の誤りで
ある。従って、ステップ123は選択された認識ルーチ
ンすなわちハンドプリント認識ルーチンにより生成され
る実際の誤りの数が、1個の拒絶誤り或いは1個の懐疑
的誤りよりも大きいかどうかを判断する。大きい場合、
次にステップ変数が誤り時の次のステップ値に等しくセ
ットされ、これは表1に示されるように値4を有する。
値4は次に表1において実行されるステップをステップ
4とし、これは高速ラテン式フォント認識ルーチンを指
定する。
択された認識ルーチンにより生成された拒絶誤りが、こ
のステップにおいてテンプレート内に指定される最大認
識拒絶誤り値よりも大きいかどうかが判断される(表1
参照)。また、選択された認識ルーチンにより生成され
た懐疑的誤りが、テンプレート内に指定される最大認識
懐疑的誤り値よりも大きいかどうかが判断される(表1
参照)。表1に示されるように、ステップ3におけるハ
ンドプリント認識ルーチンに対応して、最大拒絶誤り率
は1個の誤りであり、最大懐疑的誤り率は1個の誤りで
ある。従って、ステップ123は選択された認識ルーチ
ンすなわちハンドプリント認識ルーチンにより生成され
る実際の誤りの数が、1個の拒絶誤り或いは1個の懐疑
的誤りよりも大きいかどうかを判断する。大きい場合、
次にステップ変数が誤り時の次のステップ値に等しくセ
ットされ、これは表1に示されるように値4を有する。
値4は次に表1において実行されるステップをステップ
4とし、これは高速ラテン式フォント認識ルーチンを指
定する。
【0095】或いは図24のステップ123において、
最大拒絶誤り率が越えられておらず、また最大懐疑的誤
り率が越えられていないと判断されると、ステップ変数
はOK時の次のステップに等しくセットされ、表1では
ステップ3に対応するこの値は7である。これは表1に
おいて次に実行されるステップをデータ・ベース処理ス
テップであるステップ7とする。
最大拒絶誤り率が越えられておらず、また最大懐疑的誤
り率が越えられていないと判断されると、ステップ変数
はOK時の次のステップに等しくセットされ、表1では
ステップ3に対応するこの値は7である。これは表1に
おいて次に実行されるステップをデータ・ベース処理ス
テップであるステップ7とする。
【0096】次に図24においてステップ124が実行
され、ステップ123で識別された次のステップが認識
処理ステップであるかどうかが判断される。それがステ
ップ4などの認識処理ステップである場合、次に処理は
ステップ118にループして戻り、ループを繰返す。ま
た、新たなステップが表1のステップ7などのように認
識ステップでない場合は、これは認識ステップの終わり
を意味する。
され、ステップ123で識別された次のステップが認識
処理ステップであるかどうかが判断される。それがステ
ップ4などの認識処理ステップである場合、次に処理は
ステップ118にループして戻り、ループを繰返す。ま
た、新たなステップが表1のステップ7などのように認
識ステップでない場合は、これは認識ステップの終わり
を意味する。
【0097】図24のステップ118乃至124のルー
プ・オペレーションから分かるように、表1で指定され
る文字認識処理のシーケンスが実行される。シーケンス
は表1における誤り時の次のステップ欄、及びOK時の
次のステップ欄の識別により管理される。拒絶誤り或い
は懐疑的誤りが、表1で与えられる分岐値により許可さ
れる数よりも多く発生すると、誤り時の次のステップ値
が認識シーケンスを表1で提供される次の目的の認識ス
テップに導くために使用される。認識誤りが表1で提供
される分岐値により提供される数よりも小さい場合は、
十分な認識オペレーションが実行され、追加のバックア
ップ認識ルーチンは実行されない。
プ・オペレーションから分かるように、表1で指定され
る文字認識処理のシーケンスが実行される。シーケンス
は表1における誤り時の次のステップ欄、及びOK時の
次のステップ欄の識別により管理される。拒絶誤り或い
は懐疑的誤りが、表1で与えられる分岐値により許可さ
れる数よりも多く発生すると、誤り時の次のステップ値
が認識シーケンスを表1で提供される次の目的の認識ス
テップに導くために使用される。認識誤りが表1で提供
される分岐値により提供される数よりも小さい場合は、
十分な認識オペレーションが実行され、追加のバックア
ップ認識ルーチンは実行されない。
【0098】例えば誤りが選択された認識ルーチンによ
り生成され続ける場合、認識ルーチン・シーケンスはス
テップ3のハンドプリント認識ルーチンを開始し、次に
ステップ4の高速ラテン式フォント認識ルーチンに移行
し、その後、表1のステップ5の精密ラテン式フォント
認識ルーチンを実行し終了する。
り生成され続ける場合、認識ルーチン・シーケンスはス
テップ3のハンドプリント認識ルーチンを開始し、次に
ステップ4の高速ラテン式フォント認識ルーチンに移行
し、その後、表1のステップ5の精密ラテン式フォント
認識ルーチンを実行し終了する。
【0099】精密ラテン式フォント認識ルーチンの実行
の結果、拒絶文字率或いは懐疑的誤り率が表1で提供さ
れる分岐値よりも大きい場合、表1の処理テンプレート
は次のステップを再ルート化ステップ6とする。これは
フィールド再ルート行先値をMGDS 50Bの部分7
6に挿入する。
の結果、拒絶文字率或いは懐疑的誤り率が表1で提供さ
れる分岐値よりも大きい場合、表1の処理テンプレート
は次のステップを再ルート化ステップ6とする。これは
フィールド再ルート行先値をMGDS 50Bの部分7
6に挿入する。
【0100】図24の文字認識処理は認識ステップの終
了後に図25のステップ125に遷移する。ステップ1
25では、拒絶文字返却コードRCがインクリメントさ
れ、書式返却コードFRがステップ118乃至124の
ループにおいて、実行される最終文字認識処理ステップ
において、識別された拒絶文字の数だけインクリメント
される。次にステップ126は懐疑文字返却コードSC
及び書式返却コードFRを、ステップ118乃至124
において実行される最終文字認識処理ステップにおいて
識別された懐疑文字の数だけインクリメントされる。
了後に図25のステップ125に遷移する。ステップ1
25では、拒絶文字返却コードRCがインクリメントさ
れ、書式返却コードFRがステップ118乃至124の
ループにおいて、実行される最終文字認識処理ステップ
において、識別された拒絶文字の数だけインクリメント
される。次にステップ126は懐疑文字返却コードSC
及び書式返却コードFRを、ステップ118乃至124
において実行される最終文字認識処理ステップにおいて
識別された懐疑文字の数だけインクリメントされる。
【0101】ステップ127は認識文字、懐疑文字、及
び拒絶フラグのコード化データ42をフィールド・デー
タ・セグメントの文字データ・バッファBにロードす
る。
び拒絶フラグのコード化データ42をフィールド・デー
タ・セグメントの文字データ・バッファBにロードす
る。
【0102】次にステップ128において、サブ・セグ
メントSをフィールド・データ・セグメントが増補し、
図4に示されるように懐疑文字のロケーション座標21
がロードされる。
メントSをフィールド・データ・セグメントが増補し、
図4に示されるように懐疑文字のロケーション座標21
がロードされる。
【0103】次にステップ129Aにおいて、サブ・セ
グメントS内の懐疑文字に対する第2の推測文字29が
ロードされる。次にステップ129Bにおいて、懐疑文
字に対する確率値61がサブ・セグメントSにロードさ
れる。
グメントS内の懐疑文字に対する第2の推測文字29が
ロードされる。次にステップ129Bにおいて、懐疑文
字に対する確率値61がサブ・セグメントSにロードさ
れる。
【0104】ステップ130において、サブ・セグメン
トRとしてフィールド・データ・セグメントが増補さ
れ、そこに拒絶文字のロケーション座標31がロードさ
れる。
トRとしてフィールド・データ・セグメントが増補さ
れ、そこに拒絶文字のロケーション座標31がロードさ
れる。
【0105】次にステップ131において、ステップ1
18乃至124のループにおいて実行される最終認識ル
ーチンの名称がフィールド・データ・セグメントの部分
63にロードされる。
18乃至124のループにおいて実行される最終認識ル
ーチンの名称がフィールド・データ・セグメントの部分
63にロードされる。
【0106】次にステップ132において、ステップ1
18乃至124のループにより指示される最終ステップ
が再ルート処理ステップである場合、行先値がMGDS
部分76に挿入される。
18乃至124のループにより指示される最終ステップ
が再ルート処理ステップである場合、行先値がMGDS
部分76に挿入される。
【0107】選択的には次のステップはステップ133
Aであり、これはイメージ・フィールドであるフィール
ド・タイプに対し、図19に示される抽出フィールド・
イメージを獲得する。次に選択的ステップ133Bにお
いて、抽出フィールド・イメージが図11に示されるよ
うに、フィールド・データ・セグメントのイメージ・デ
ータ・サブ・セグメント47にロードされる。
Aであり、これはイメージ・フィールドであるフィール
ド・タイプに対し、図19に示される抽出フィールド・
イメージを獲得する。次に選択的ステップ133Bにお
いて、抽出フィールド・イメージが図11に示されるよ
うに、フィールド・データ・セグメントのイメージ・デ
ータ・サブ・セグメント47にロードされる。
【0108】次にステップ134において、フィールド
変数が1だけインクリメントされ、処理される書式内に
別のフィールドが存在するかが判断される。存在する場
合、次に処理はループの開始であるステップ114に移
行する。その他の場合は、処理は出力ステップ136に
移行し、ここで図12に示されるMGDSメッセージ5
0Bが出力される。
変数が1だけインクリメントされ、処理される書式内に
別のフィールドが存在するかが判断される。存在する場
合、次に処理はループの開始であるステップ114に移
行する。その他の場合は、処理は出力ステップ136に
移行し、ここで図12に示されるMGDSメッセージ5
0Bが出力される。
【0109】表1乃至表6に示される"洪水申請"の例で
は、第2のフィールドはファースト・ネーム・フィール
ドであり、これは表2のテンプレート33に表される。
図25の処理は表2に示される書式の第2のフィールド
に対して指定される値に従い実施される。次に図25の
ステップ134は処理されるべき第3のフィールドが存
在するかを判断し、第3のフィールドは表3のテンプレ
ート部分により示される。書式の第3のフィールドに対
応する表3に示されるテンプレート部分により指定され
るステップが実行される。
は、第2のフィールドはファースト・ネーム・フィール
ドであり、これは表2のテンプレート33に表される。
図25の処理は表2に示される書式の第2のフィールド
に対して指定される値に従い実施される。次に図25の
ステップ134は処理されるべき第3のフィールドが存
在するかを判断し、第3のフィールドは表3のテンプレ
ート部分により示される。書式の第3のフィールドに対
応する表3に示されるテンプレート部分により指定され
るステップが実行される。
【0110】図25のステップ134は更に処理される
べき第4のフィールドが存在することを判断する。表4
に示されるテンプレート部分が次に図23乃至図25の
処理により実行される。表4に示されるフィールド4に
対応する第1のオペレーションは"スキップ・フィール
ド"オペレーションであり、第4のフィールド(これは"
アドレス"フィールドである)は書式においてスキップ
される。
べき第4のフィールドが存在することを判断する。表4
に示されるテンプレート部分が次に図23乃至図25の
処理により実行される。表4に示されるフィールド4に
対応する第1のオペレーションは"スキップ・フィール
ド"オペレーションであり、第4のフィールド(これは"
アドレス"フィールドである)は書式においてスキップ
される。
【0111】図23乃至図25は書式内で更に処理され
るべき第5のフィールドが存在することを判断し、表5
に表されるテンプレート部分が実行される。
るべき第5のフィールドが存在することを判断し、表5
に表されるテンプレート部分が実行される。
【0112】最後に図25のステップ134は、書式に
おける処理されるべき第6のフィールドの存在を判断す
る。表6に表されるテンプレート部分がこのフィールド
に対応して実行される。次にステップ134は、もはや
この書式には処理されるべきフィールドが存在しないと
判断し、文字認識処理26Aはステップ136におい
て、MGDSメッセージを出力する。
おける処理されるべき第6のフィールドの存在を判断す
る。表6に表されるテンプレート部分がこのフィールド
に対応して実行される。次にステップ134は、もはや
この書式には処理されるべきフィールドが存在しないと
判断し、文字認識処理26Aはステップ136におい
て、MGDSメッセージを出力する。
【0113】ここで図4において、第1のフィールドに
対応する認識ルーチンの識別は "高速ラテン式フォン
ト" であり、これはMGDS 50Bのデータ・セグメ
ント52Bの部分63^ にロードされる。
対応する認識ルーチンの識別は "高速ラテン式フォン
ト" であり、これはMGDS 50Bのデータ・セグメ
ント52Bの部分63^ にロードされる。
【0114】図4を参照すると、文字認識プロセッサ2
6によりMGDSメッセージ50Bに加えられるいくつ
かの情報が表される。文字データ・バッファBは認識文
字ストリングによりロードされ、これは完全に認識され
た文字"J"及び"n"、懐疑文字"a"、及びアスタリスク"*"
で示される拒絶文字或いは未認識文字の位置を含む。更
に第1の拒絶文字情報Sは、文字位置、文字座標、第2
の推測文字、及び文字確率を識別する拒絶文字情報セグ
メント内に配置される。第1の文字に対応する文字位置
は"0"、第2の文字は"1"の様に示される。従って、懐疑
文字 "a"に対応する文字位置は"1"と示される。文字座
標が懐疑文字"a"のフィールド・イメージにおけるロケ
ーションに対し提供される。更に文字認識プロセッサ2
6は低い確率を有するいくつかの代わりの候補文字を公
式化する。次に高い確率値は文字"o" に相当し、これは
第2の推測文字として拒絶情報セグメントSの第2の推
測文字パラメータに提供される。更に、この例では文字
の確率である50パーセントが、拒絶文字情報セグメン
トSにロードされる。第2の拒絶文字情報セグメントR
は拒絶文字位置"*" に対して提供される。文字位置は2
として示され、すなわちこれは3番目の文字位置を示
す。また、文字位置に対応する座標がフィールド・イメ
ージに対して提供される。この情報は図4のMGDSメ
ッセージ50Bにロードされる。
6によりMGDSメッセージ50Bに加えられるいくつ
かの情報が表される。文字データ・バッファBは認識文
字ストリングによりロードされ、これは完全に認識され
た文字"J"及び"n"、懐疑文字"a"、及びアスタリスク"*"
で示される拒絶文字或いは未認識文字の位置を含む。更
に第1の拒絶文字情報Sは、文字位置、文字座標、第2
の推測文字、及び文字確率を識別する拒絶文字情報セグ
メント内に配置される。第1の文字に対応する文字位置
は"0"、第2の文字は"1"の様に示される。従って、懐疑
文字 "a"に対応する文字位置は"1"と示される。文字座
標が懐疑文字"a"のフィールド・イメージにおけるロケ
ーションに対し提供される。更に文字認識プロセッサ2
6は低い確率を有するいくつかの代わりの候補文字を公
式化する。次に高い確率値は文字"o" に相当し、これは
第2の推測文字として拒絶情報セグメントSの第2の推
測文字パラメータに提供される。更に、この例では文字
の確率である50パーセントが、拒絶文字情報セグメン
トSにロードされる。第2の拒絶文字情報セグメントR
は拒絶文字位置"*" に対して提供される。文字位置は2
として示され、すなわちこれは3番目の文字位置を示
す。また、文字位置に対応する座標がフィールド・イメ
ージに対して提供される。この情報は図4のMGDSメ
ッセージ50Bにロードされる。
【0115】認識文字"J"及び"n"懐疑文字"a"、拒絶フ
ラグ"*"を含むコード化データ42は図4に示されるフ
ィールド・データ・セグメント54Bの文字データ・バ
ッファBにロードされる。
ラグ"*"を含むコード化データ42は図4に示されるフ
ィールド・データ・セグメント54Bの文字データ・バ
ッファBにロードされる。
【0116】懐疑文字に対応する第2の推測文字29は
図4に示されるように、サブ・セグメントSにロードさ
れる。この例では第2の推測文字29は"o" である。こ
の例では第1の推測文字"a" の確率は50パーセントで
あり、この値は確率に対応する値61に示される。
図4に示されるように、サブ・セグメントSにロードさ
れる。この例では第2の推測文字29は"o" である。こ
の例では第1の推測文字"a" の確率は50パーセントで
あり、この値は確率に対応する値61に示される。
【0117】第3のフィールド・データ・セグメント5
6Bが図9に示され、これは図19の州フィールド12
a^^に対応する。図19ではフロリダ州の略字の内の"
L" がその上に重なる擬似マークを有する。文字認識プ
ロセッサ26は第2の文字位置に対応する第1の推測と
して"A"を解釈する。従って、文字ストリング"FA" が図
9のフィールド・データ・セグメント56Bの文字デー
タ・バッファBに入力される。文字認識プロセッサ26
はまた第2の文字位置に対応する第2の推測として"L"
を判断し、この第2の推測"L"29が図9に示される懐
疑文字サブ・セグメントSの第2の推測文字部分に入力
される。
6Bが図9に示され、これは図19の州フィールド12
a^^に対応する。図19ではフロリダ州の略字の内の"
L" がその上に重なる擬似マークを有する。文字認識プ
ロセッサ26は第2の文字位置に対応する第1の推測と
して"A"を解釈する。従って、文字ストリング"FA" が図
9のフィールド・データ・セグメント56Bの文字デー
タ・バッファBに入力される。文字認識プロセッサ26
はまた第2の文字位置に対応する第2の推測として"L"
を判断し、この第2の推測"L"29が図9に示される懐
疑文字サブ・セグメントSの第2の推測文字部分に入力
される。
【0118】図12は図19の書式における6個のフィ
ールドの各フィールド・セグメントにおけるコード化デ
ータに対応する文字バッファBを示す。第1のフィール
ド・セグメント52は文字ストリング"Doe" をバッファ
Bに有する。第2のフィールド・セグメント54は文字
ストリング"Ja*n"をバッファBに有する。第3のフィー
ルド・セグメント56は文字ストリング"FA"をバッファ
Bに有する。第4のフィールド・セグメント12bは、
図18の書式イメージ10^ のフィールド12b^ に対
応するイメージ情報が存在しないために、バッファBに
空ストリングを有する。第5のフィールド・データ・セ
グメント44はそのフィールド・イメージ部分に署名イ
メージ45を有する。第6のフィールド・データ・セグ
メント12はそのバッファにストリング W1248を
含む。各それぞれのフィールド・データ・セグメント内
の文字バッファBの各々の内容は、図19の抽出フィー
ルド・イメージ10^^のそれぞれのフィールドに含まれ
るイメージに対応する正しい英数字ストリングの、現行
の最適な推定に相当する。
ールドの各フィールド・セグメントにおけるコード化デ
ータに対応する文字バッファBを示す。第1のフィール
ド・セグメント52は文字ストリング"Doe" をバッファ
Bに有する。第2のフィールド・セグメント54は文字
ストリング"Ja*n"をバッファBに有する。第3のフィー
ルド・セグメント56は文字ストリング"FA"をバッファ
Bに有する。第4のフィールド・セグメント12bは、
図18の書式イメージ10^ のフィールド12b^ に対
応するイメージ情報が存在しないために、バッファBに
空ストリングを有する。第5のフィールド・データ・セ
グメント44はそのフィールド・イメージ部分に署名イ
メージ45を有する。第6のフィールド・データ・セグ
メント12はそのバッファにストリング W1248を
含む。各それぞれのフィールド・データ・セグメント内
の文字バッファBの各々の内容は、図19の抽出フィー
ルド・イメージ10^^のそれぞれのフィールドに含まれ
るイメージに対応する正しい英数字ストリングの、現行
の最適な推定に相当する。
【0119】図40に示されるコード化データ情報形式
はフィールド内の各特定の文字ストリングに対応して使
用されるコード・ページに相当する、フィールド・コー
ド・ページ・パラメータを表す。フィールド内において
コード・ページが変化する時、フィールド・ページ・パ
ラメータはそれを使用する文字ストリングに先行する。
書式上の全てのコード・ページが同一である場合には、
フィールド・コード・パラメータは使用される必要はな
く、書式コード・ページ・パラメータが書式上の全ての
文字データに対応て使用されるコード・ページを示す。
はフィールド内の各特定の文字ストリングに対応して使
用されるコード・ページに相当する、フィールド・コー
ド・ページ・パラメータを表す。フィールド内において
コード・ページが変化する時、フィールド・ページ・パ
ラメータはそれを使用する文字ストリングに先行する。
書式上の全てのコード・ページが同一である場合には、
フィールド・コード・パラメータは使用される必要はな
く、書式コード・ページ・パラメータが書式上の全ての
文字データに対応て使用されるコード・ページを示す。
【0120】文字バッファ・パラメータBもまた図40
に示され、これは1コード・ページを使用する文字スト
リングの記憶ロケーションを示す。フィールドが文字を
含まず、プロセッサ24により強制的フィールドに指摘
される場合、拒絶文字返却コードはいずれの値も誤りで
はないことを示す。文字バッファはフィールドを表す文
字ストリングの現行の訂正値を格納する。フィールド修
復の各順序的段階において、フィールドを表す最も確率
の高い文字ストリングが文字バッファBにロードされ
る。
に示され、これは1コード・ページを使用する文字スト
リングの記憶ロケーションを示す。フィールドが文字を
含まず、プロセッサ24により強制的フィールドに指摘
される場合、拒絶文字返却コードはいずれの値も誤りで
はないことを示す。文字バッファはフィールドを表す文
字ストリングの現行の訂正値を格納する。フィールド修
復の各順序的段階において、フィールドを表す最も確率
の高い文字ストリングが文字バッファBにロードされ
る。
【0121】拒絶情報形式は図41に詳細に示される。
拒絶文字情報包含パラメータは、全フィールドに対応す
る文字ストリングにおける文字の位置を識別する文字位
置パラメータを包含する。これに関し、文字値及びイメ
ージ文字との間の関係が、それぞれの修復ステーション
において発生することが要求される。この位置はフィー
ルドにおける文字位置を示し、文字に先行するバイト数
は示さない。
拒絶文字情報包含パラメータは、全フィールドに対応す
る文字ストリングにおける文字の位置を識別する文字位
置パラメータを包含する。これに関し、文字値及びイメ
ージ文字との間の関係が、それぞれの修復ステーション
において発生することが要求される。この位置はフィー
ルドにおける文字位置を示し、文字に先行するバイト数
は示さない。
【0122】MGDSメッセージ50BはLAN20を
介して人工知能誤り訂正プロセッサ28に転送され、そ
のフィールド・セグメントが誤りを有するフィールドの
第1の修復を実行するために使用される。訂正プロセッ
サ28はいくつかの実施例における文字認識プロセッサ
26の一部に相当する。人工知能誤り訂正処理の例は、
文字認識プロセッサ26により生成される文字ストリン
グの語彙テストに相当する。一般に書式の特定のフィー
ルドに含まれるデータは、全ての文字ストリングが許容
されるわけではないと言った意味において制約される。
量フィールドは典型的には数値データにより充填され、
名前フィールドは典型的にはアルファベット・データに
より充填される。こうした制約は文字認識訂正において
有用である。例えば、特定のフィールドが数値だけの場
合、フィールド内の懐疑文字と数値との比較が適切とな
る。こうした例としてジップ・コード・フィールドが挙
げられ、ジップ・コード・フィールドのイメージにおけ
る1個以上の数値文字は懐疑的であるか読出されない。
書式における州、或いは特に州及び市に対応するフィー
ルドが未認識文字を有さずに読出される場合、語彙解析
はジップ・コード・ディレクトリに相当するデータ・ベ
ースを使用することにより、ジップ・コード・フィール
ド内の拒絶文字或いは懐疑文字に対応する最も可能性の
高い数値を記入して実行される。特定のタイプのフィー
ルドに対し、桁だけではなく、文字及び句読点も読出し
誤りされた文字の位置或いは文脈から推論される。例え
ば、特定のフィールドが州フィールドであり、フィール
ド内に読出し誤り文字が存在する場合、50州のリスト
が語彙分析のために使用され、正確に認識された文字に
対する最高確率の一致が見い出され、拒絶文字或いは懐
疑文字に対応する値の推論を可能とする。
介して人工知能誤り訂正プロセッサ28に転送され、そ
のフィールド・セグメントが誤りを有するフィールドの
第1の修復を実行するために使用される。訂正プロセッ
サ28はいくつかの実施例における文字認識プロセッサ
26の一部に相当する。人工知能誤り訂正処理の例は、
文字認識プロセッサ26により生成される文字ストリン
グの語彙テストに相当する。一般に書式の特定のフィー
ルドに含まれるデータは、全ての文字ストリングが許容
されるわけではないと言った意味において制約される。
量フィールドは典型的には数値データにより充填され、
名前フィールドは典型的にはアルファベット・データに
より充填される。こうした制約は文字認識訂正において
有用である。例えば、特定のフィールドが数値だけの場
合、フィールド内の懐疑文字と数値との比較が適切とな
る。こうした例としてジップ・コード・フィールドが挙
げられ、ジップ・コード・フィールドのイメージにおけ
る1個以上の数値文字は懐疑的であるか読出されない。
書式における州、或いは特に州及び市に対応するフィー
ルドが未認識文字を有さずに読出される場合、語彙解析
はジップ・コード・ディレクトリに相当するデータ・ベ
ースを使用することにより、ジップ・コード・フィール
ド内の拒絶文字或いは懐疑文字に対応する最も可能性の
高い数値を記入して実行される。特定のタイプのフィー
ルドに対し、桁だけではなく、文字及び句読点も読出し
誤りされた文字の位置或いは文脈から推論される。例え
ば、特定のフィールドが州フィールドであり、フィール
ド内に読出し誤り文字が存在する場合、50州のリスト
が語彙分析のために使用され、正確に認識された文字に
対する最高確率の一致が見い出され、拒絶文字或いは懐
疑文字に対応する値の推論を可能とする。
【0123】本発明における別の応用例は、共通英語の
名前或いはファースト・ネームの場合である。MGDS
50Bは人工知能誤り訂正プロセッサ28に入力さ
れ、ファースト・ネーム・フィールド16^^は文字イメ
ージ18である文字"John"を含む。文字認識プロセッサ
26からの出力文字ストリング42"Ja*n"は、語彙解析
を使用することにより誤り訂正プロセッサ28において
処理される。ストリング42内の第2番目の文字に対応
する第2の推測文字"o" もまた、語彙解析を使用してテ
ストされ、その結果"Jo*n"がテストされる。この場合、
語彙解析は最初の文字が"J"であり、最後の文字が"n"で
ある4文字を有する任意の名前に対して実施される。語
彙解析の結果、"Joel"、"Jack"、"John"、"Jake"、"Jan
e"、"Jean"、"Jill"、"Joan"、"Judy"、及び"June"が候
補名のリストに挙げられる。人工知能訂正プロセッサ2
8により実行されるこの語彙解析の例では、第1の修復
を発生するために、入力MGDSメッセージ50Bはそ
のフィールドに関連する情報を供給する。供給された情
報はストリング42"Ja*n"の文字データ・バッファBか
らのストリング、及び第2番目の文字位置に対応する第
2の推測文字すなわち"o"である。人工知能訂正プロセ
ッサ28はその語彙解析からストリング"Joan"が50パ
ーセントの確率を有し、ストリング"John"が50パーセ
ントの確率を有すると判断する。
名前或いはファースト・ネームの場合である。MGDS
50Bは人工知能誤り訂正プロセッサ28に入力さ
れ、ファースト・ネーム・フィールド16^^は文字イメ
ージ18である文字"John"を含む。文字認識プロセッサ
26からの出力文字ストリング42"Ja*n"は、語彙解析
を使用することにより誤り訂正プロセッサ28において
処理される。ストリング42内の第2番目の文字に対応
する第2の推測文字"o" もまた、語彙解析を使用してテ
ストされ、その結果"Jo*n"がテストされる。この場合、
語彙解析は最初の文字が"J"であり、最後の文字が"n"で
ある4文字を有する任意の名前に対して実施される。語
彙解析の結果、"Joel"、"Jack"、"John"、"Jake"、"Jan
e"、"Jean"、"Jill"、"Joan"、"Judy"、及び"June"が候
補名のリストに挙げられる。人工知能訂正プロセッサ2
8により実行されるこの語彙解析の例では、第1の修復
を発生するために、入力MGDSメッセージ50Bはそ
のフィールドに関連する情報を供給する。供給された情
報はストリング42"Ja*n"の文字データ・バッファBか
らのストリング、及び第2番目の文字位置に対応する第
2の推測文字すなわち"o"である。人工知能訂正プロセ
ッサ28はその語彙解析からストリング"Joan"が50パ
ーセントの確率を有し、ストリング"John"が50パーセ
ントの確率を有すると判断する。
【0124】人工知能訂正処理28Aは図26乃至図2
8のオペレーション・ステップ・シーケンスの流れ図に
示される。処理はステップ137で開始され、書式処理
テンプレート33を入力する。
8のオペレーション・ステップ・シーケンスの流れ図に
示される。処理はステップ137で開始され、書式処理
テンプレート33を入力する。
【0125】ステップ138はMGDSメッセージ50
Bを入力する。次にステップ139は書式内の各それぞ
れのフィールドに対して実行されるループを開始する。
このループはフィールド変数が1にセットされて初期化
される。ステップ139において、フィールド・データ
・セグメントがゼロでない懐疑文字返却コードSC、或
いはゼロでない拒絶文字返却コードRCを有するか、或
いはフィールドがこの処理に再ルート化されたかどうか
が判断される。再ルート化はAI訂正処理28Aを指す
MGDSの部分76におけるフィールド再ルート行先値
により示される。これらのどれかの条件が適合すると、
次に処理はステップ140に移行する。適合しない場
合、処理は図28のステップ161に移行する。
Bを入力する。次にステップ139は書式内の各それぞ
れのフィールドに対して実行されるループを開始する。
このループはフィールド変数が1にセットされて初期化
される。ステップ139において、フィールド・データ
・セグメントがゼロでない懐疑文字返却コードSC、或
いはゼロでない拒絶文字返却コードRCを有するか、或
いはフィールドがこの処理に再ルート化されたかどうか
が判断される。再ルート化はAI訂正処理28Aを指す
MGDSの部分76におけるフィールド再ルート行先値
により示される。これらのどれかの条件が適合すると、
次に処理はステップ140に移行する。適合しない場
合、処理は図28のステップ161に移行する。
【0126】ステップ140Aにおいて、再ルート行先
フィールド76が別の処理28Aを指すか、"スキップ"
コマンドを含む場合、図26の処理はステップ161に
移行する。それ以外の場合、処理は140Bに移行す
る。
フィールド76が別の処理28Aを指すか、"スキップ"
コマンドを含む場合、図26の処理はステップ161に
移行する。それ以外の場合、処理は140Bに移行す
る。
【0127】ステップ140Bからステップ140E
は"冗長時のスキップ"機能を表し、これはテンプレート
33がこのフィールドに対し、"冗長時のスキップ"ステ
ップを含むかどうかを判断する。ここで表3の州略字フ
ィールドにおける特にステップ8を参照すると、ステッ
プ8は処理テンプレート33に対する "冗長時のスキッ
プ" 処理タイプ入力であり、AI処理タイプ・ステップ
9に先行する。
は"冗長時のスキップ"機能を表し、これはテンプレート
33がこのフィールドに対し、"冗長時のスキップ"ステ
ップを含むかどうかを判断する。ここで表3の州略字フ
ィールドにおける特にステップ8を参照すると、ステッ
プ8は処理テンプレート33に対する "冗長時のスキッ
プ" 処理タイプ入力であり、AI処理タイプ・ステップ
9に先行する。
【0128】図26のステップ140Bは次にMGDS
から関連するフィールド・データ77を獲得し、このフ
ィールドよりも高位の優先順位を有し、またそのフィー
ルド・セグメントに文字認識コード化データを有する関
連するフィールドを識別する。関連するフィールド・デ
ータ77は入力"(1、2);3"を含む。これはフィールド
3が関連フィールド1及び2を有し、これらは組合わさ
れてフィールド3よりも高位の優先順位を有することを
示す。ステップ140Bは第1のフィールド・セグメン
ト52Bに対応する文字データ・バッファB^ を検査
し、第2のフィールドのフィールド・セグメント54B
に対応する文字データ・バッファBを検査し、フィール
ド1及びフィールド2の両方に対し、コード化データが
存在するかを判断する。ステップ140Bのテストは満
足されるため、次にステップ140Cに移行する。ステ
ップ140Bのテストが満足されない場合、処理はステ
ップ141に移行し、"冗長時のスキップ"機能は処理の
この部分において終了される。
から関連するフィールド・データ77を獲得し、このフ
ィールドよりも高位の優先順位を有し、またそのフィー
ルド・セグメントに文字認識コード化データを有する関
連するフィールドを識別する。関連するフィールド・デ
ータ77は入力"(1、2);3"を含む。これはフィールド
3が関連フィールド1及び2を有し、これらは組合わさ
れてフィールド3よりも高位の優先順位を有することを
示す。ステップ140Bは第1のフィールド・セグメン
ト52Bに対応する文字データ・バッファB^ を検査
し、第2のフィールドのフィールド・セグメント54B
に対応する文字データ・バッファBを検査し、フィール
ド1及びフィールド2の両方に対し、コード化データが
存在するかを判断する。ステップ140Bのテストは満
足されるため、次にステップ140Cに移行する。ステ
ップ140Bのテストが満足されない場合、処理はステ
ップ141に移行し、"冗長時のスキップ"機能は処理の
この部分において終了される。
【0129】ステップ140Cはより高位の優先順位を
有する関連フィールドのコード化データに対する確率デ
ータを獲得する。ステップ140Cは図4のセグメント
Sにおける懐疑文字である第1の拒絶文字が存在し、そ
の文字確率が50パーセントであり、更に第2のフィー
ルドに対応する第2の拒絶文字が存在することを判断す
る。次に図26のステップ140Cはステップ140D
に遷移する。
有する関連フィールドのコード化データに対する確率デ
ータを獲得する。ステップ140Cは図4のセグメント
Sにおける懐疑文字である第1の拒絶文字が存在し、そ
の文字確率が50パーセントであり、更に第2のフィー
ルドに対応する第2の拒絶文字が存在することを判断す
る。次に図26のステップ140Cはステップ140D
に遷移する。
【0130】ステップ140Dにおいて、より高位の優
先順位の関連フィールドのコード化データに対応する確
率が、テンプレート33内に提供されるステップにおけ
る分岐値よりも大きいかどうかを判断する。この例では
表3におけるステップ8に対応して提供される最小AI
確率は100パーセントであるため、フィールド2にお
けるコード化データに対応する確率はテンプレート内の
ステップにおける分岐値よりも大きくはない。従って、
図26のステップ140Dはステップ141に遷移し、
ここにおいて"冗長時のスキップ"機能が終了される。
先順位の関連フィールドのコード化データに対応する確
率が、テンプレート33内に提供されるステップにおけ
る分岐値よりも大きいかどうかを判断する。この例では
表3におけるステップ8に対応して提供される最小AI
確率は100パーセントであるため、フィールド2にお
けるコード化データに対応する確率はテンプレート内の
ステップにおける分岐値よりも大きくはない。従って、
図26のステップ140Dはステップ141に遷移し、
ここにおいて"冗長時のスキップ"機能が終了される。
【0131】また、ステップ140Dが、より高位の優
先順位の関連フィールドのコード化データに対応する確
率が、テンプレート33内のステップにおける分岐値よ
りも大きいと判断すると、処理はステップ140Eに移
行し、パラメータ"スキップ"がこのフィールドに対応す
るMGDS行先部分76に挿入され、次に処理はステッ
プ161に移行する。必要に応じ、このフィールドは誤
り訂正プロセッサにより更に処理されることはない。図
26の処理は次にステップ141に移行する。
先順位の関連フィールドのコード化データに対応する確
率が、テンプレート33内のステップにおける分岐値よ
りも大きいと判断すると、処理はステップ140Eに移
行し、パラメータ"スキップ"がこのフィールドに対応す
るMGDS行先部分76に挿入され、次に処理はステッ
プ161に移行する。必要に応じ、このフィールドは誤
り訂正プロセッサにより更に処理されることはない。図
26の処理は次にステップ141に移行する。
【0132】図26のステップ141において、第1の
修復セグメントR1が図4のMGDSメッセージ50B
に追加され、図5に示されるMGDSメッセージ50C
が形成される。
修復セグメントR1が図4のMGDSメッセージ50B
に追加され、図5に示されるMGDSメッセージ50C
が形成される。
【0133】図27のステップ142Aにおいて、ステ
ップ変数がテンプレート33内のフィールドの第1の人
工知能処理ステップに等しくセットされる。これは例え
ば表2のステップ7に相当する。
ップ変数がテンプレート33内のフィールドの第1の人
工知能処理ステップに等しくセットされる。これは例え
ば表2のステップ7に相当する。
【0134】ステップ142Bにおいて、このフィール
ドに対応する人工知能ステップが存在しないことが判断
され、次に処理はステップ161に移行する。
ドに対応する人工知能ステップが存在しないことが判断
され、次に処理はステップ161に移行する。
【0135】図27のステップ143Aは、テンプレー
ト33内に指定されるフィールドにおける各ステップに
対し実行されるループを開始する。フィールド2に対応
する表2を参照することにより、本発明のオペレーショ
ンが更に説明される。ステップ143Aにおいて、テン
プレートからのステップ・データが読出される。ステッ
プは第1のAI処理ステップであるため、表2は第1の
AI処理ステップが英語のファースト・ネームにもとづ
く語彙ルーチンを実行するオペレーションを有するステ
ップ7であることを示す。図27のステップ143B
は、フィールド・データ・セグメント・バッファB内の
コード化データに対し、AIルーチン・ステップを実行
する。ステップ144Aはフィールド・データ・セグメ
ントのバッファBからコード化データ42を獲得する。
次にステップ144Bは懐疑文字27を含むコード化デ
ータ42の語彙チェックを実行し、選択される語彙処理
手順により第1の確率値を計算する。この場合、選択さ
れる語彙処理手順は英語によるファースト・ネームのA
I参照リストとの比較である。
ト33内に指定されるフィールドにおける各ステップに
対し実行されるループを開始する。フィールド2に対応
する表2を参照することにより、本発明のオペレーショ
ンが更に説明される。ステップ143Aにおいて、テン
プレートからのステップ・データが読出される。ステッ
プは第1のAI処理ステップであるため、表2は第1の
AI処理ステップが英語のファースト・ネームにもとづ
く語彙ルーチンを実行するオペレーションを有するステ
ップ7であることを示す。図27のステップ143B
は、フィールド・データ・セグメント・バッファB内の
コード化データに対し、AIルーチン・ステップを実行
する。ステップ144Aはフィールド・データ・セグメ
ントのバッファBからコード化データ42を獲得する。
次にステップ144Bは懐疑文字27を含むコード化デ
ータ42の語彙チェックを実行し、選択される語彙処理
手順により第1の確率値を計算する。この場合、選択さ
れる語彙処理手順は英語によるファースト・ネームのA
I参照リストとの比較である。
【0136】次に図27の処理はステップ145Aに移
行し、フィールド・データ・セグメントから第2の推測
文字29を獲得し、図5に示されるように第2の推測コ
ード化データ46を形成する。次にステップ145Bに
おいて、語彙チェックが第2のコード化データ46に対
し実行され、表2のステップ7により提供される選択さ
れる語彙処理手順により第2の確率値が計算される。
行し、フィールド・データ・セグメントから第2の推測
文字29を獲得し、図5に示されるように第2の推測コ
ード化データ46を形成する。次にステップ145Bに
おいて、語彙チェックが第2のコード化データ46に対
し実行され、表2のステップ7により提供される選択さ
れる語彙処理手順により第2の確率値が計算される。
【0137】次にステップ146において、ステップ1
44Bにおいて計算される第1の確率値、或いはステッ
プ145Bにおいて計算される第2の確率値が、表2の
ステップ7に対応する分岐値において提供される最小A
I確率値よりも大きいかが判断される。表2に見られる
ように、ステップ7は最小AI確率として50パーセン
トを提供する。従って、図27のステップ146はそれ
ぞれステップ144B及びステップ145Bにおいて計
算された第1及び第2の確率が、共に50パーセントよ
りも大きくないと判断する。次にステップ変数は、表2
のステップ7に対応して提供される誤り時の次のステッ
プ値にセットされる。表2のステップ7に見られるよう
に、誤り時の次のステップ値は8であり、これは次に実
行されるステップがステップ8であることを意味する。
ステップ8は国際的ファースト・ネーム語彙ルーチンで
ある。
44Bにおいて計算される第1の確率値、或いはステッ
プ145Bにおいて計算される第2の確率値が、表2の
ステップ7に対応する分岐値において提供される最小A
I確率値よりも大きいかが判断される。表2に見られる
ように、ステップ7は最小AI確率として50パーセン
トを提供する。従って、図27のステップ146はそれ
ぞれステップ144B及びステップ145Bにおいて計
算された第1及び第2の確率が、共に50パーセントよ
りも大きくないと判断する。次にステップ変数は、表2
のステップ7に対応して提供される誤り時の次のステッ
プ値にセットされる。表2のステップ7に見られるよう
に、誤り時の次のステップ値は8であり、これは次に実
行されるステップがステップ8であることを意味する。
ステップ8は国際的ファースト・ネーム語彙ルーチンで
ある。
【0138】また図27のステップ146は、それぞれ
ステップ144B或いはステップ145Bで計算された
第1の確率値或いは第2の確率値が、表2のステップ7
に対応して提供される最小確率値よりも大きいことを判
断し、次にステップ変数は表2のステップ7に対応して
提供されるOK時の次のステップ値にセットされる。表
2では、ステップ7はOK時の次のステップ値として1
0を有し、これは次に実行されるステップがステップ1
0であることを意味する。表2のステップ10は非保険
者名データ・ベース・ルーチンのオペレーションを有す
る。
ステップ144B或いはステップ145Bで計算された
第1の確率値或いは第2の確率値が、表2のステップ7
に対応して提供される最小確率値よりも大きいことを判
断し、次にステップ変数は表2のステップ7に対応して
提供されるOK時の次のステップ値にセットされる。表
2では、ステップ7はOK時の次のステップ値として1
0を有し、これは次に実行されるステップがステップ1
0であることを意味する。表2のステップ10は非保険
者名データ・ベース・ルーチンのオペレーションを有す
る。
【0139】ステップ146は次にステップ147に移
行し、ステップ146において識別された新たなステッ
プが別のAI処理ステップであるかを判断する。そうで
ある場合、次に処理はステップ143Aにループして戻
り、表2に提供されるステップを実行する。また、新た
なステップがAI処理ステップでない場合は、これはA
Iステップの終了を意味する。
行し、ステップ146において識別された新たなステッ
プが別のAI処理ステップであるかを判断する。そうで
ある場合、次に処理はステップ143Aにループして戻
り、表2に提供されるステップを実行する。また、新た
なステップがAI処理ステップでない場合は、これはA
Iステップの終了を意味する。
【0140】表2におけるステップ7及び8において、
2つの連続する人工知能誤り訂正処理ルーチンが提供さ
れる。ステップ7における第1のルーチンの性能が、表
2のそのステップに対応して示される分岐値よりも大き
い確率を提供できない場合、次に実行されるステップ
は、シーケンスにおける次のAI誤り訂正ステップすな
わちステップ8である。ステップ8が表2における分岐
値により提供される十分な確率を提供できない場合、次
に実行されるステップは表2のステップ9において識別
される。ステップ9は再ルート・ステップであり、MG
DS 50Cにフィールド再ルート行先値を挿入する。
また、ステップ8が成功する場合、次のステップはステ
ップ10となり、これは表2のデータ・ベース・ステッ
プ10に相当する。
2つの連続する人工知能誤り訂正処理ルーチンが提供さ
れる。ステップ7における第1のルーチンの性能が、表
2のそのステップに対応して示される分岐値よりも大き
い確率を提供できない場合、次に実行されるステップ
は、シーケンスにおける次のAI誤り訂正ステップすな
わちステップ8である。ステップ8が表2における分岐
値により提供される十分な確率を提供できない場合、次
に実行されるステップは表2のステップ9において識別
される。ステップ9は再ルート・ステップであり、MG
DS 50Cにフィールド再ルート行先値を挿入する。
また、ステップ8が成功する場合、次のステップはステ
ップ10となり、これは表2のデータ・ベース・ステッ
プ10に相当する。
【0141】このように、書式処理テンプレート33は
フィールド2から導出されるコード化データに対し、実
行される人工知能誤り訂正ステップの好適なシーケンス
の仕様を提供する。
フィールド2から導出されるコード化データに対し、実
行される人工知能誤り訂正ステップの好適なシーケンス
の仕様を提供する。
【0142】図27は次にステップ147から図28の
ステップ152に遷移する。ステップ152はステップ
145Bにおいて計算された第2の確率値が、ステップ
144Bにおいて計算された第1の確率値よりも大きい
かどうかを判断する。大きい場合、次にステップ152
はデータ・バッファBからのコード化データ42を、第
1の修復セグメントR1のデータ修復部分37に転送す
る。次に第2の推測コード化データ46を図5の54C
に示されるフィールド・データ・セグメントのバッファ
Bにロードする。
ステップ152に遷移する。ステップ152はステップ
145Bにおいて計算された第2の確率値が、ステップ
144Bにおいて計算された第1の確率値よりも大きい
かどうかを判断する。大きい場合、次にステップ152
はデータ・バッファBからのコード化データ42を、第
1の修復セグメントR1のデータ修復部分37に転送す
る。次に第2の推測コード化データ46を図5の54C
に示されるフィールド・データ・セグメントのバッファ
Bにロードする。
【0143】図28の処理はステップ154に移行し、
確率値39を第1の修復セグメントR1にロードする。
処理は次にステップ155に移行し、クラスタ・データ
及び/或いは代替選択48を第1の修復セグメントR1
にロードする。
確率値39を第1の修復セグメントR1にロードする。
処理は次にステップ155に移行し、クラスタ・データ
及び/或いは代替選択48を第1の修復セグメントR1
にロードする。
【0144】ステップ156では、修復オペレーション
は第1の修復セグメントR1にロードされる。図5に表
されるように、実行されるオペレーションは"NAME LEX"
と指定され、これは表2のステップ7により規定された
英語語彙ルーチンに対応する。更にタイム・スタンプ値
が第1の修復セグメントR1に配置される。
は第1の修復セグメントR1にロードされる。図5に表
されるように、実行されるオペレーションは"NAME LEX"
と指定され、これは表2のステップ7により規定された
英語語彙ルーチンに対応する。更にタイム・スタンプ値
が第1の修復セグメントR1に配置される。
【0145】図28のステップ157は、ステップ14
3Aからステップ147に至るループ内で識別される最
後の処理ステップが、再ルート処理ステップであるかど
うかを判断する。そうである場合、次に再ルート行先値
がMGDS部分76に挿入される。
3Aからステップ147に至るループ内で識別される最
後の処理ステップが、再ルート処理ステップであるかど
うかを判断する。そうである場合、次に再ルート行先値
がMGDS部分76に挿入される。
【0146】ステップ157は次にステップ159に遷
移し、ここでテンプレート33内の現行ステップが"ク
ロス・チェック"ステップであるかを判断する。そうで
ある場合、次にステップ159はMGDSから関連する
フィールド・データ77を獲得し、現行フィールド及び
その関連フィールドにおいて、関連フィールド・クロス
・チェック・ルーチンを実行する。この例として、現行
フィールドが市フィールドであり、関連するフィールド
・データ77が関連フィールドとしてジップ・コード・
フィールドを示す場合がある。適切にプログラムされた
関連フィールド・クロス・チェック・ルーチンは、ジッ
プ・コード・コード化データが高確率値を有する場合、
市フィールド・コード化データをジップ・コード・ディ
レクトリと比較することによりこれを確認する。
移し、ここでテンプレート33内の現行ステップが"ク
ロス・チェック"ステップであるかを判断する。そうで
ある場合、次にステップ159はMGDSから関連する
フィールド・データ77を獲得し、現行フィールド及び
その関連フィールドにおいて、関連フィールド・クロス
・チェック・ルーチンを実行する。この例として、現行
フィールドが市フィールドであり、関連するフィールド
・データ77が関連フィールドとしてジップ・コード・
フィールドを示す場合がある。適切にプログラムされた
関連フィールド・クロス・チェック・ルーチンは、ジッ
プ・コード・コード化データが高確率値を有する場合、
市フィールド・コード化データをジップ・コード・ディ
レクトリと比較することによりこれを確認する。
【0147】図28のステップ159は次にステップ1
60に遷移し、"再順序フィールド"ステップがテンプレ
ート33内に存在するかを判断する。"再順序化フィー
ルド"ステップが存在する場合、フィールド変数が新フ
ィールド−1の値にセットされる。新フィールド値をパ
スするために、都合上これはテンプレート33のステッ
プにおける"最小AI確率"変数に等しくセットされた。
この値は次に、次のステップ161に移行するために1
減算される。
60に遷移し、"再順序フィールド"ステップがテンプレ
ート33内に存在するかを判断する。"再順序化フィー
ルド"ステップが存在する場合、フィールド変数が新フ
ィールド−1の値にセットされる。新フィールド値をパ
スするために、都合上これはテンプレート33のステッ
プにおける"最小AI確率"変数に等しくセットされた。
この値は次に、次のステップ161に移行するために1
減算される。
【0148】ステップ161では、フィールド変数が1
だけインクリメントされ、フィールド値を"再順序フィ
ールド"機能に対応する目的の新たなフィールド値まで
増加させる。再順序フィールド機能はユーザが当初にM
GDSにおいて指定されたフィールドの順序を再定義す
ることを可能とする。このフィールドは誤り訂正処理に
おけるシーケンスにおいて、再順序化される。
だけインクリメントされ、フィールド値を"再順序フィ
ールド"機能に対応する目的の新たなフィールド値まで
増加させる。再順序フィールド機能はユーザが当初にM
GDSにおいて指定されたフィールドの順序を再定義す
ることを可能とする。このフィールドは誤り訂正処理に
おけるシーケンスにおいて、再順序化される。
【0149】次にステップ161において、フィールド
変数が1だけインクリメントされ、別のフィールド・デ
ータ・セグメントが存在するかどうかが判断される。存
在する場合、図28の処理はループの開始のステップ1
39に移行する。そうでない場合、処理はステップ16
2に移行し、図13に示されるMGDSメッセージ50
Cを出力する。
変数が1だけインクリメントされ、別のフィールド・デ
ータ・セグメントが存在するかどうかが判断される。存
在する場合、図28の処理はループの開始のステップ1
39に移行する。そうでない場合、処理はステップ16
2に移行し、図13に示されるMGDSメッセージ50
Cを出力する。
【0150】表1乃至表6に示される"洪水申請"と命名
されるテンプレートの例では、6個のフィールドが存在
し、従って、ループは全6フィールドに対し、ステップ
161からステップ139まで戻り継続される。各それ
ぞれのフィールドに対し、表1乃至表6のテンプレート
の対応する部分が実行される。"ファースト・ネーム"に
相当する第2のフィールドの例で見られるように、表2
で指定された人工知能ルーチンは英語のファースト・ネ
ーム語彙ルーチンであるステップ7、及び国際的ファー
スト・ネーム語彙ルーチンであるステップ8に対応す
る。州略字フィールドに相当するフィールド3に対応し
て、処理テンプレート33の表3は人工知能誤り訂正ス
テップ7を提供し、これは州略字語彙ルーチンに相当す
る。
されるテンプレートの例では、6個のフィールドが存在
し、従って、ループは全6フィールドに対し、ステップ
161からステップ139まで戻り継続される。各それ
ぞれのフィールドに対し、表1乃至表6のテンプレート
の対応する部分が実行される。"ファースト・ネーム"に
相当する第2のフィールドの例で見られるように、表2
で指定された人工知能ルーチンは英語のファースト・ネ
ーム語彙ルーチンであるステップ7、及び国際的ファー
スト・ネーム語彙ルーチンであるステップ8に対応す
る。州略字フィールドに相当するフィールド3に対応し
て、処理テンプレート33の表3は人工知能誤り訂正ス
テップ7を提供し、これは州略字語彙ルーチンに相当す
る。
【0151】アジアの積荷申請に関するアジア式テンプ
レート33^ に相当する表7を参照すると興味深いこと
が分かる。表1乃至表6の例で使用されたものと同一の
文書書式が使用されている。表7は書式の第2のフィー
ルドに相当するファースト・ネーム・フィールドに対応
するテンプレート33^ の一部分であり、ラテン式アル
ファベット文字と同様、ある書式に対応してマンダリン
式中国文字、また別の書式では漢字文字が存在すること
が予想される。このように、表7に表される "アジアの
積荷申請" テンプレートはステップ3でマンダリン文字
認識ルーチンを、またステップ4で漢字文字認識ルーチ
ンを提供し、これらはステップ5における精密ラテン式
フォント認識ルーチンの実行に先立ち、シーケンス内で
実行される。これは表8において"東欧積荷"と命名され
るテンプレート33^^におけるフィールド2に対応して
示される第3の書式と対比される。表8のテンプレート
33^^において、ラテン式アルファベット文字と同様に
シリル・アルファベット文字、及びギリシャ・アルファ
ベット文字が含まれるものと予想される。従って、表8
の東欧積荷テンプレートはこれらの書式のファースト・
ネーム・フィールドを解析するために使用される。表8
は書式の第2のフィールドに相当するファースト・ネー
ム・フィールドに対応する。ここで処理テンプレート3
3、33^ 、及び33^^は全て同一の文書書式10を意
味する。
レート33^ に相当する表7を参照すると興味深いこと
が分かる。表1乃至表6の例で使用されたものと同一の
文書書式が使用されている。表7は書式の第2のフィー
ルドに相当するファースト・ネーム・フィールドに対応
するテンプレート33^ の一部分であり、ラテン式アル
ファベット文字と同様、ある書式に対応してマンダリン
式中国文字、また別の書式では漢字文字が存在すること
が予想される。このように、表7に表される "アジアの
積荷申請" テンプレートはステップ3でマンダリン文字
認識ルーチンを、またステップ4で漢字文字認識ルーチ
ンを提供し、これらはステップ5における精密ラテン式
フォント認識ルーチンの実行に先立ち、シーケンス内で
実行される。これは表8において"東欧積荷"と命名され
るテンプレート33^^におけるフィールド2に対応して
示される第3の書式と対比される。表8のテンプレート
33^^において、ラテン式アルファベット文字と同様に
シリル・アルファベット文字、及びギリシャ・アルファ
ベット文字が含まれるものと予想される。従って、表8
の東欧積荷テンプレートはこれらの書式のファースト・
ネーム・フィールドを解析するために使用される。表8
は書式の第2のフィールドに相当するファースト・ネー
ム・フィールドに対応する。ここで処理テンプレート3
3、33^ 、及び33^^は全て同一の文書書式10を意
味する。
【0152】類似の興味深い対比が表2、表7、及び表
8において指定される人工知能誤り訂正処理を比較する
ことにより参照される。図2でファースト・ネーム・フ
ィールド部分に対応して示される"洪水申請"と命名され
るテンプレート33は、ステップ7で英語のファースト
・ネーム語彙ルーチンを、ステップ8で国際的ファース
ト・ネーム語彙ルーチンを提供する。それに対し、表7
の"アジア積荷申請"と命名されるテンプレート33^ で
は、ファースト・ネーム・フィールドに対応して、ステ
ップ7で中国語のファースト・ネーム語彙ルーチンを、
またステップ8で国際的ファースト・ネーム語彙ルーチ
ンを提供する。更に表8の"東欧積荷"と命名されるテン
プレート33^^では、第2のフィールドである "ファー
スト・ネーム" フィールドに対応して、ステップ7でロ
シア語のファースト・ネーム語彙ルーチンを、ステップ
8で国際的ファースト・ネーム語彙ルーチンを提供す
る。これら3つの全てのテンプレートは同一の文書書
式、すなわち保険申請書10に当てはまる。しかしなが
ら、主に西欧の言葉を話す書き手による"洪水申請"を扱
う第1の書式群が受取られるものと予想される。また主
にアジアの書き手による第2の書式群が受取られる場合
は、代わりに表7に表される"アジアの積荷申請"テンプ
レート33^ が使用される。更に、書式の主な作成者が
東欧人であることが予想される場合、表8に示される"
欧州積荷テンプレート33^^が使用される。
8において指定される人工知能誤り訂正処理を比較する
ことにより参照される。図2でファースト・ネーム・フ
ィールド部分に対応して示される"洪水申請"と命名され
るテンプレート33は、ステップ7で英語のファースト
・ネーム語彙ルーチンを、ステップ8で国際的ファース
ト・ネーム語彙ルーチンを提供する。それに対し、表7
の"アジア積荷申請"と命名されるテンプレート33^ で
は、ファースト・ネーム・フィールドに対応して、ステ
ップ7で中国語のファースト・ネーム語彙ルーチンを、
またステップ8で国際的ファースト・ネーム語彙ルーチ
ンを提供する。更に表8の"東欧積荷"と命名されるテン
プレート33^^では、第2のフィールドである "ファー
スト・ネーム" フィールドに対応して、ステップ7でロ
シア語のファースト・ネーム語彙ルーチンを、ステップ
8で国際的ファースト・ネーム語彙ルーチンを提供す
る。これら3つの全てのテンプレートは同一の文書書
式、すなわち保険申請書10に当てはまる。しかしなが
ら、主に西欧の言葉を話す書き手による"洪水申請"を扱
う第1の書式群が受取られるものと予想される。また主
にアジアの書き手による第2の書式群が受取られる場合
は、代わりに表7に表される"アジアの積荷申請"テンプ
レート33^ が使用される。更に、書式の主な作成者が
東欧人であることが予想される場合、表8に示される"
欧州積荷テンプレート33^^が使用される。
【0153】人工知能誤り訂正プロセッサ28の別の機
能は、適切な知識ベース・リストを探索する機能であ
る。特定のフィールドの内容がそのフィールドを記入す
るために典型的に選択されるアルファベットに関連する
場合、最低の誤り率を提供する文字認識処理と、人工知
能コード化データ誤り訂正処理における最低の誤り率を
提供する対応する知識ベース・リストとの間に関係が生
成される。この例として、特定の国の居住者に使用され
る主要なアルファベット間の関係が挙げられる。文書書
式上のフィールドが書式を記入する人間の国を識別する
場合、そのフィールドに対応する最適な文字認識処理と
最適な人工知能誤り訂正処理との間に、ある関係が生成
される可能性がある。表10を参照するとこの関係の例
が示される。表10は国を表す5つのリストを示し、各
リストはそれらの国により使用される主なアルファベッ
トに対応する。例えば、リスト1はラテン式アルファベ
ットの国に対応し、このリストはアンゴラ、アルゼンチ
ン、カナダ、フランス、英国、米国などを含む。リスト
2はシリル式アルファベット国に対応し、ブルガリア、
白ロシア、ロシア、ウクライナなどを含む。リスト3は
ギリシャ式アルファベット国に対応し、アルバニラ、キ
プロス、ギリシャ、ユーゴスラビアなどを含む。リスト
4はマンダリン式アルファベット国に対応し、中国、モ
ンゴルなどを含む。リスト5はアラブ式アルファベット
国に対応し、アフガニスタン、エジプト、ヨルダンなど
を含む。
能は、適切な知識ベース・リストを探索する機能であ
る。特定のフィールドの内容がそのフィールドを記入す
るために典型的に選択されるアルファベットに関連する
場合、最低の誤り率を提供する文字認識処理と、人工知
能コード化データ誤り訂正処理における最低の誤り率を
提供する対応する知識ベース・リストとの間に関係が生
成される。この例として、特定の国の居住者に使用され
る主要なアルファベット間の関係が挙げられる。文書書
式上のフィールドが書式を記入する人間の国を識別する
場合、そのフィールドに対応する最適な文字認識処理と
最適な人工知能誤り訂正処理との間に、ある関係が生成
される可能性がある。表10を参照するとこの関係の例
が示される。表10は国を表す5つのリストを示し、各
リストはそれらの国により使用される主なアルファベッ
トに対応する。例えば、リスト1はラテン式アルファベ
ットの国に対応し、このリストはアンゴラ、アルゼンチ
ン、カナダ、フランス、英国、米国などを含む。リスト
2はシリル式アルファベット国に対応し、ブルガリア、
白ロシア、ロシア、ウクライナなどを含む。リスト3は
ギリシャ式アルファベット国に対応し、アルバニラ、キ
プロス、ギリシャ、ユーゴスラビアなどを含む。リスト
4はマンダリン式アルファベット国に対応し、中国、モ
ンゴルなどを含む。リスト5はアラブ式アルファベット
国に対応し、アフガニスタン、エジプト、ヨルダンなど
を含む。
【0154】表9は保険申請書10に対応する処理テン
プレート33^^を示し、ここでフィールド3は国フィー
ルドに対応するように変更される。テンプレート名は "
国際申請" であり、様々な国際的国々からの書式群に対
応して使用される。書式を記入する様々なアルファベッ
トの予測において、表9のステップ3、4、5、6及び
7は、それぞれラテン式アルファベット、シリル式アル
ファベット、ギリシャ式アルファベット、マンダリン式
アルファベット、及びアラブ式アルファベットを呼出
す。本発明のこの機能によれば、表9のステップ9はそ
のオペレーションが知識ベース・リスト探索ルーチンに
相当する人工知能処理ステップを提供する。
プレート33^^を示し、ここでフィールド3は国フィー
ルドに対応するように変更される。テンプレート名は "
国際申請" であり、様々な国際的国々からの書式群に対
応して使用される。書式を記入する様々なアルファベッ
トの予測において、表9のステップ3、4、5、6及び
7は、それぞれラテン式アルファベット、シリル式アル
ファベット、ギリシャ式アルファベット、マンダリン式
アルファベット、及びアラブ式アルファベットを呼出
す。本発明のこの機能によれば、表9のステップ9はそ
のオペレーションが知識ベース・リスト探索ルーチンに
相当する人工知能処理ステップを提供する。
【0155】図50は人工知能誤り訂正プロセッサ28
上で実行されて、知識ベース・リスト探索ルーチン処理
を実行する、人工知能誤り訂正処理28Bに対応するオ
ペレーション・ステップ・シーケンスの流れ図を示す。
図50の処理はステップ137^で開始され、表9のテ
ンプレート33^^を入力する。ステップ138^はMG
DSメッセージを入力し、ステップ139は各フィール
ドに対しループを開始する。ステップ140^ はフィー
ルドが再ルート化されるかどうかを判断する。ステップ
141^ は第1の修復セグメントR1をMGDSメッセ
ージに追加する。
上で実行されて、知識ベース・リスト探索ルーチン処理
を実行する、人工知能誤り訂正処理28Bに対応するオ
ペレーション・ステップ・シーケンスの流れ図を示す。
図50の処理はステップ137^で開始され、表9のテ
ンプレート33^^を入力する。ステップ138^はMG
DSメッセージを入力し、ステップ139は各フィール
ドに対しループを開始する。ステップ140^ はフィー
ルドが再ルート化されるかどうかを判断する。ステップ
141^ は第1の修復セグメントR1をMGDSメッセ
ージに追加する。
【0156】ステップ142A^ はステップ変数をテン
プレート内のフィールドの第1の人工知能処理ステップ
に等しくセットし、例えば表9ではステップ9にセット
する。次にステップ142B^ はこのフィールドにAI
ステップが存在するかを判断する。次にステップ143
A^は、テンプレート33^^^からステップ・データを読
出すループを開始する。
プレート内のフィールドの第1の人工知能処理ステップ
に等しくセットし、例えば表9ではステップ9にセット
する。次にステップ142B^ はこのフィールドにAI
ステップが存在するかを判断する。次にステップ143
A^は、テンプレート33^^^からステップ・データを読
出すループを開始する。
【0157】次にステップ143B^ はAIルーチンが
知識ベース・リスト探索ルーチンであるかを判断し、も
しそうである場合は次に、処理は図51のステップ14
8^に移行する。ステップ148^ において、ステップ
はMGDS部分63から認識ルーチン名を獲得する。次
にステップ149A^ において、表10におけるMGD
S部分63から獲得された認識ルーチン名に対応するA
I参照リストをアクセスする。
知識ベース・リスト探索ルーチンであるかを判断し、も
しそうである場合は次に、処理は図51のステップ14
8^に移行する。ステップ148^ において、ステップ
はMGDS部分63から認識ルーチン名を獲得する。次
にステップ149A^ において、表10におけるMGD
S部分63から獲得された認識ルーチン名に対応するA
I参照リストをアクセスする。
【0158】次にステップ149B^ において、ステッ
プはコード化データ42の語彙チェックを実行し、最適
な推測データを生成し、表10からアクセスされたAI
参照リストを使用することにより、そのコード化データ
の確率を計算する。
プはコード化データ42の語彙チェックを実行し、最適
な推測データを生成し、表10からアクセスされたAI
参照リストを使用することにより、そのコード化データ
の確率を計算する。
【0159】次にステップ150^において、ステップ
149B^で計算された確率が表9のステップ9で説明
された"最小AI確率"よりも小さい場合、ステップ変数
は誤り時の次のステップに等しくセットされる。また、
確率がテンプレート内のステップにおいて提供される最
小AI確率よりも大きい場合は、ステップ変数はOK時
の次のステップに等しくセットされる。表9のステップ
9を参照すると、最小AI確率値は100パーセントと
記述されている。
149B^で計算された確率が表9のステップ9で説明
された"最小AI確率"よりも小さい場合、ステップ変数
は誤り時の次のステップに等しくセットされる。また、
確率がテンプレート内のステップにおいて提供される最
小AI確率よりも大きい場合は、ステップ変数はOK時
の次のステップに等しくセットされる。表9のステップ
9を参照すると、最小AI確率値は100パーセントと
記述されている。
【0160】次にステップ151^において、ステップ
150^で計算された確率がテンプレート内のステップ
に対応する最小AI確率よりも大きいと判断されると、
コード化データ42がデータ・バッファBから第1の修
復セグメントR1に転送され、次にステップはステップ
149B^ で計算された最適推測データをフィールド・
データ・セグメントのバッファBにロードする。次にス
テップ151^ はステップ154^ に移行する。ステッ
プ148^からステップ151^のシーケンスは、表9及
び表10の例に示されるような知識ベース・リスト探索
ルーチンの処理を実行する。
150^で計算された確率がテンプレート内のステップ
に対応する最小AI確率よりも大きいと判断されると、
コード化データ42がデータ・バッファBから第1の修
復セグメントR1に転送され、次にステップはステップ
149B^ で計算された最適推測データをフィールド・
データ・セグメントのバッファBにロードする。次にス
テップ151^ はステップ154^ に移行する。ステッ
プ148^からステップ151^のシーケンスは、表9及
び表10の例に示されるような知識ベース・リスト探索
ルーチンの処理を実行する。
【0161】図50の流れ図において、ステップ143
B^ がAIルーチンが知識ベース・リスト・ルーチンで
はないと判断すると、次に処理はステップ144A^ か
らステップ147^ に移行し、前述した図27の流れ図
の処理28Aのステップ143Aからステップ147に
おいて実行された人工知能誤り訂正処理と同一のタイプ
を実行する。ステップ147^は表9のテンプレート3
3^^^における全てのAIステップの終わりにおいて、
ステップ152^ に移行し、ここでも前述した図28の
ステップ152と同様にオペレートする。
B^ がAIルーチンが知識ベース・リスト・ルーチンで
はないと判断すると、次に処理はステップ144A^ か
らステップ147^ に移行し、前述した図27の流れ図
の処理28Aのステップ143Aからステップ147に
おいて実行された人工知能誤り訂正処理と同一のタイプ
を実行する。ステップ147^は表9のテンプレート3
3^^^における全てのAIステップの終わりにおいて、
ステップ152^ に移行し、ここでも前述した図28の
ステップ152と同様にオペレートする。
【0162】次に図51のステップ154^ は確率値3
9を第1の修復セグメントR1にロードする。ステップ
156^ はクラスタ・データ或いは代替選択48を第1
の修復セグメントR1にロードする。次にステップ15
8^ は修復オペレーション69及びタイム・スタンプを
第1の修復セグメントR1にロードする。次にステップ
160^ はテンプレート内の現行のステップが再ルート
処理ステップであるかを判断し、そうである場合には、
目的の再ルート行先がMGDS部分76に挿入される。
次にステップ161^ において、フィールド変数が1だ
けインクリメントされ、別のデータ・フィールド・セグ
メントが処理のために存在するかが判断される。存在す
る場合、次にループはステップ139^ に戻る。存在し
ない場合、処理は出力ステップ162^ に移行し、MG
DSメッセージ50Cが出力される。図50乃至図51
の処理28Bは知識ベース・リスト探索ルーチンのサポ
ートを実行する。図50乃至図51の処理28Bのステ
ップは、図26乃至図28の処理28Aのステップと結
合されて、適切な人工知能誤り訂正処理のアプリケーシ
ョンを生成することが可能である。
9を第1の修復セグメントR1にロードする。ステップ
156^ はクラスタ・データ或いは代替選択48を第1
の修復セグメントR1にロードする。次にステップ15
8^ は修復オペレーション69及びタイム・スタンプを
第1の修復セグメントR1にロードする。次にステップ
160^ はテンプレート内の現行のステップが再ルート
処理ステップであるかを判断し、そうである場合には、
目的の再ルート行先がMGDS部分76に挿入される。
次にステップ161^ において、フィールド変数が1だ
けインクリメントされ、別のデータ・フィールド・セグ
メントが処理のために存在するかが判断される。存在す
る場合、次にループはステップ139^ に戻る。存在し
ない場合、処理は出力ステップ162^ に移行し、MG
DSメッセージ50Cが出力される。図50乃至図51
の処理28Bは知識ベース・リスト探索ルーチンのサポ
ートを実行する。図50乃至図51の処理28Bのステ
ップは、図26乃至図28の処理28Aのステップと結
合されて、適切な人工知能誤り訂正処理のアプリケーシ
ョンを生成することが可能である。
【0163】処理28Aのステップ161が解析される
フィールド・データ・セグメントがもはや存在しないと
判断すると、次に処理はステップ162に遷移し、図1
3に示されるMGDSメッセージ50Cを出力する。図
13に示されるMGDSメッセージ50Cは6個のフィ
ールド・データ・セグメントを含む。6個のフィールド
・データ・セグメントに加え、2個の修復セグメントが
存在し、R1はファースト・ネームに対応する第2のフ
ィールドに関連し、修復セグメントR1^ は州に対応す
る第3のフィールドに関連する。第1のフィールド・デ
ータ・セグメント52は、MGDS 50Bより変更の
無いバッファBを有する。MGDS 50Cに対応する
フィールド・データ・セグメント54は、新たな文字ス
トリング"Joan"に変更されたバッファBを有する。MG
DS 50Cにおける第3の州フィールド・セグメント
56は、文字ストリング"FL"に変更されたバッファBを
有する。第4、第5、及び第6のフィールド・セグメン
トである12b、44、及び12は、それぞれMGDS
50Cにおいて無変更であり、MGDS 50Bのま
まである。ファースト・ネーム・フィールドを修復した
追加の修復セグメントR1は、文字ストリング"Ja*n"を
含むバッファ37を有する。州フィールドを修復した第
2の修復セグメントR1^ はストリング"FA"を含むバッ
ファ37を有する。ここで修復の履歴は修復セグメント
R1及びR1^ が存在する書式におけるMGDS 50
C内に蓄積されることが理解される。更に、図19の抽
出フィールド・イメージ10^^における各それぞれのフ
ィールドを表す文字ストリングの最適な予測が、MGD
S 50C内の各フィールド・データ・セグメントに対
応する、各それぞれの文字バッファB内に存在する。
フィールド・データ・セグメントがもはや存在しないと
判断すると、次に処理はステップ162に遷移し、図1
3に示されるMGDSメッセージ50Cを出力する。図
13に示されるMGDSメッセージ50Cは6個のフィ
ールド・データ・セグメントを含む。6個のフィールド
・データ・セグメントに加え、2個の修復セグメントが
存在し、R1はファースト・ネームに対応する第2のフ
ィールドに関連し、修復セグメントR1^ は州に対応す
る第3のフィールドに関連する。第1のフィールド・デ
ータ・セグメント52は、MGDS 50Bより変更の
無いバッファBを有する。MGDS 50Cに対応する
フィールド・データ・セグメント54は、新たな文字ス
トリング"Joan"に変更されたバッファBを有する。MG
DS 50Cにおける第3の州フィールド・セグメント
56は、文字ストリング"FL"に変更されたバッファBを
有する。第4、第5、及び第6のフィールド・セグメン
トである12b、44、及び12は、それぞれMGDS
50Cにおいて無変更であり、MGDS 50Bのま
まである。ファースト・ネーム・フィールドを修復した
追加の修復セグメントR1は、文字ストリング"Ja*n"を
含むバッファ37を有する。州フィールドを修復した第
2の修復セグメントR1^ はストリング"FA"を含むバッ
ファ37を有する。ここで修復の履歴は修復セグメント
R1及びR1^ が存在する書式におけるMGDS 50
C内に蓄積されることが理解される。更に、図19の抽
出フィールド・イメージ10^^における各それぞれのフ
ィールドを表す文字ストリングの最適な予測が、MGD
S 50C内の各フィールド・データ・セグメントに対
応する、各それぞれの文字バッファB内に存在する。
【0164】図5において、MGDSメッセージ50C
は誤り訂正プロセッサ28により、文字認識プロセッサ
26から受信されるMGDS 50Bを使用して形成さ
れる。図5のMGDS 50Cは、プロセッサ28にお
ける修復アドレスを、MGDS 50Bに対して増補さ
れた修復セグメントR1に入力している。セグメントR
1はまた修復IDすなわち人工知能或いは"AI"を有す
る。更に修復タイム・スタンプが含まれ、この場合には
5時3分58秒或いは日である。実行されるオペレーシ
ョンは"語彙"として入力され、英語の語彙解析がこの最
初の修復に対応して実行されたことを示す。次に図5の
MGDS 50Cにおけるフィールド修復包含パラメー
タは、"ファースト"なるフィールド・ネーム、及び第2
の文字或いはこの例では"1" が使用されている文字位置
を含む。訂正プロセッサ28において実行される第1段
階の修復は、文字認識プロセッサ26からの入力MGD
Sメッセージ50Bに含まれる第1及び第2の選択情報
を利用する。
は誤り訂正プロセッサ28により、文字認識プロセッサ
26から受信されるMGDS 50Bを使用して形成さ
れる。図5のMGDS 50Cは、プロセッサ28にお
ける修復アドレスを、MGDS 50Bに対して増補さ
れた修復セグメントR1に入力している。セグメントR
1はまた修復IDすなわち人工知能或いは"AI"を有す
る。更に修復タイム・スタンプが含まれ、この場合には
5時3分58秒或いは日である。実行されるオペレーシ
ョンは"語彙"として入力され、英語の語彙解析がこの最
初の修復に対応して実行されたことを示す。次に図5の
MGDS 50Cにおけるフィールド修復包含パラメー
タは、"ファースト"なるフィールド・ネーム、及び第2
の文字或いはこの例では"1" が使用されている文字位置
を含む。訂正プロセッサ28において実行される第1段
階の修復は、文字認識プロセッサ26からの入力MGD
Sメッセージ50Bに含まれる第1及び第2の選択情報
を利用する。
【0165】この時点において、本発明の実施例が如何
に単一の知能的書式プロセッサ25を使用し、マルチタ
スク形式で書式認識及びフィールド抽出プロセッサ2
4、文字認識プロセッサ26、及び人工知能誤り訂正プ
ロセッサ28において実行されるそれぞれの処理を実行
するかについて説明することが適切である。
に単一の知能的書式プロセッサ25を使用し、マルチタ
スク形式で書式認識及びフィールド抽出プロセッサ2
4、文字認識プロセッサ26、及び人工知能誤り訂正プ
ロセッサ28において実行されるそれぞれの処理を実行
するかについて説明することが適切である。
【0166】図33は知能的書式プロセッサ25の詳細
体系図を示す。プロセッサ25はメモリ302を含み、
これはバス322によりCPU310、大容量記憶装置
312、表示及びキーボード314、及びLANアダプ
タ316に接続される。スキャナ・アダプタ318はス
キャナ22をバス322に接続する。LANアダプタ3
16はLAN20をバス322に接続する。更に、オプ
ションのFAX及び通信ネットワーク・アダプタ320
がファックス電話線をバス322に結合し、データ通信
ネットワークがバス322に接続される。CPU310
は例えばインテル386或いは486データ処理装置で
ある。大容量記憶装置312は例えば200メガバイト
のハード・ディスク装置などのハード・ディスク記憶装
置であったり、或いはハード・ディスク磁気記憶装置と
光学式読出し/書込み記憶装置との組合せであったりす
る。
体系図を示す。プロセッサ25はメモリ302を含み、
これはバス322によりCPU310、大容量記憶装置
312、表示及びキーボード314、及びLANアダプ
タ316に接続される。スキャナ・アダプタ318はス
キャナ22をバス322に接続する。LANアダプタ3
16はLAN20をバス322に接続する。更に、オプ
ションのFAX及び通信ネットワーク・アダプタ320
がファックス電話線をバス322に結合し、データ通信
ネットワークがバス322に接続される。CPU310
は例えばインテル386或いは486データ処理装置で
ある。大容量記憶装置312は例えば200メガバイト
のハード・ディスク装置などのハード・ディスク記憶装
置であったり、或いはハード・ディスク磁気記憶装置と
光学式読出し/書込み記憶装置との組合せであったりす
る。
【0167】メモリ302はいくつかのコンピュータ・
プログラムを含み、各々は処理を実行するための実行可
能命令のシーケンスである。メモリ302は書式処理テ
ンプレート定義プログラム57A^ を含み、これは書式
処理テンプレート定義プロセッサ57により、実行され
る処理57Aを実行する。メモリ302は更にテンプレ
ート・アセンブリ区分33Pを含み、これはテンプレー
ト定義プログラム57A^ のオペレーションを通じて、
テンプレート33のアセンブリのために確保される空間
である。メモリ302にはまた書式処理テンプレート3
3が含まれ、これは例えば表1乃至表6、及び図52と
して表される。更にハンドプリント認識ルーチン、高速
ラテン式フォント認識ルーチン、精密ラテン式フォント
認識ルーチンがメモリ302内に提供され、文字認識処
理26A^ により使用される。更に、英語のファースト
・ネームAI誤り訂正ルーチン、国際的ファースト・ネ
ームAI誤り訂正ルーチン、及び州の略字誤り訂正ルー
チンがメモリ302に提供され、AI訂正プログラム2
8A^ と共に使用される。メモリ302はスキャナ・イ
ンタフェース・プログラム23A^ を含み、これは前述
のようにスキャナ・プロセッサ23により達成される処
理を実行する。メモリ302にはまたバッファ40に対
応する区分が含まれる。更に図16及び図17に示され
るマスタ書式形式10Fに対応する区分が提供される。
プログラムを含み、各々は処理を実行するための実行可
能命令のシーケンスである。メモリ302は書式処理テ
ンプレート定義プログラム57A^ を含み、これは書式
処理テンプレート定義プロセッサ57により、実行され
る処理57Aを実行する。メモリ302は更にテンプレ
ート・アセンブリ区分33Pを含み、これはテンプレー
ト定義プログラム57A^ のオペレーションを通じて、
テンプレート33のアセンブリのために確保される空間
である。メモリ302にはまた書式処理テンプレート3
3が含まれ、これは例えば表1乃至表6、及び図52と
して表される。更にハンドプリント認識ルーチン、高速
ラテン式フォント認識ルーチン、精密ラテン式フォント
認識ルーチンがメモリ302内に提供され、文字認識処
理26A^ により使用される。更に、英語のファースト
・ネームAI誤り訂正ルーチン、国際的ファースト・ネ
ームAI誤り訂正ルーチン、及び州の略字誤り訂正ルー
チンがメモリ302に提供され、AI訂正プログラム2
8A^ と共に使用される。メモリ302はスキャナ・イ
ンタフェース・プログラム23A^ を含み、これは前述
のようにスキャナ・プロセッサ23により達成される処
理を実行する。メモリ302にはまたバッファ40に対
応する区分が含まれる。更に図16及び図17に示され
るマスタ書式形式10Fに対応する区分が提供される。
【0168】メモリ302は書式認識プログラム24A
^ に対応する区分が提供され、これは図21乃至図22
に示される書式認識処理24Aを実行する。この区分は
またフィールド抽出プログラム24B^ を含み、これは
図21乃至図22に示されるフィールド抽出処理24B
を実行する。書式認識プログラム24A^ 及びフィール
ド抽出プログラム24B^ の実行の結果、前述のように
抽出フィールド・イメージ10^^、及びMGDS 50
Aが生成される。
^ に対応する区分が提供され、これは図21乃至図22
に示される書式認識処理24Aを実行する。この区分は
またフィールド抽出プログラム24B^ を含み、これは
図21乃至図22に示されるフィールド抽出処理24B
を実行する。書式認識プログラム24A^ 及びフィール
ド抽出プログラム24B^ の実行の結果、前述のように
抽出フィールド・イメージ10^^、及びMGDS 50
Aが生成される。
【0169】メモリ302には文字認識プログラム26
A^ に対応する別の区分が提供され、これは図23乃至
図25に示される文字認識処理26Aを実行する。文字
認識プログラム26A^ の実行の結果、MGDS 50
Bが生成される。文字認識プログラム26A^は書式認
識プログラム24A^及びフィールド抽出プログラム2
4B^ により生成されるMGDS 50A上において作
用し、MGDS 50Bを生成する。
A^ に対応する別の区分が提供され、これは図23乃至
図25に示される文字認識処理26Aを実行する。文字
認識プログラム26A^ の実行の結果、MGDS 50
Bが生成される。文字認識プログラム26A^は書式認
識プログラム24A^及びフィールド抽出プログラム2
4B^ により生成されるMGDS 50A上において作
用し、MGDS 50Bを生成する。
【0170】メモリ302には人工知能誤り訂正プログ
ラム28A^ に対応する区分が提供され、これは図26
乃至図28に示される人工知能処理28Aを実行する。
人工知能誤り訂正プログラム28A^は文字認識プログ
ラム26A^により生成されるMGDS 50B上にお
いて作用し、MGDS 50Cを生成する。
ラム28A^ に対応する区分が提供され、これは図26
乃至図28に示される人工知能処理28Aを実行する。
人工知能誤り訂正プログラム28A^は文字認識プログ
ラム26A^により生成されるMGDS 50B上にお
いて作用し、MGDS 50Cを生成する。
【0171】IBMのOperating System/2、Extended E
ditionなどのマルチタスキング・オペレーティング・シ
ステム304がマルチタスキング・モードで使用され
て、メモリ302内のプログラムのマルチタスク実行を
制御する。その代わりとして、オペレーティング・シス
テム304はアプリケーション・プログラムのマルチタ
スク実行を監視する必要はないが、その代わりにアプリ
ケーション・プログラムはMGDS内の特定のデータ・
フィールド・セグメントを処理するために順次的に実行
される。
ditionなどのマルチタスキング・オペレーティング・シ
ステム304がマルチタスキング・モードで使用され
て、メモリ302内のプログラムのマルチタスク実行を
制御する。その代わりとして、オペレーティング・シス
テム304はアプリケーション・プログラムのマルチタ
スク実行を監視する必要はないが、その代わりにアプリ
ケーション・プログラムはMGDS内の特定のデータ・
フィールド・セグメントを処理するために順次的に実行
される。
【0172】電話ファクシミリ線をプロセッサ25に接
続するためのファクシミリ及びネットワーク・アダプタ
320は、スキャナ・アダプタ318を介し提供される
イメージの代わりに、ファクシミリ・イメージの受信を
可能とする。同様にアダプタ320のデータ通信ネット
ワークへの接続は、スキャナ22によるこうした文書イ
メージ・ファイルの生成の代わりに、ネットワークから
の現存する文書イメージ・ファイルの受信を可能とす
る。
続するためのファクシミリ及びネットワーク・アダプタ
320は、スキャナ・アダプタ318を介し提供される
イメージの代わりに、ファクシミリ・イメージの受信を
可能とする。同様にアダプタ320のデータ通信ネット
ワークへの接続は、スキャナ22によるこうした文書イ
メージ・ファイルの生成の代わりに、ネットワークから
の現存する文書イメージ・ファイルの受信を可能とす
る。
【0173】MGDSメッセージ50CはAI誤り訂正
プロセッサ28から、ローカル・エリア・ネットワーク
20を介し、第2の修復ステーションに相当するデータ
・ベース誤り訂正プロセッサ30に出力される。データ
・ベース誤り訂正プロセッサ30は、ホスト・コンピュ
ータ34上で実行される特定のアプリケーションにおい
て使用される顧客名のデータ・ベースを含む。この例で
はホスト・コンピュータ34は保険会社における保険書
式の文書イメージ保管システムを管理する。保険会社は
多数の保険顧客を有し、これらの保険顧客のリストはデ
ータ・ベース誤り訂正プロセッサ30に含まれる。デー
タ・ベース誤り訂正プロセッサ30に入力されるMGD
S 50Cにおける提示される文字ストリングを比較す
ることにより、特定のホスト・コンピュータ・アプリケ
ーションにおけるある保険顧客の実際の名前と同じ文字
ストリングが選択される。この例では、MGDS 50
CはAI誤り訂正プロセッサ28からデータ・ベース誤
り訂正プロセッサ30に入力され、ここで第2の修復セ
グメントR2が追加される。第2の修復セグメントR2
はプロセッサ30により実行される第2の修復を特徴づ
ける。本発明の別の実施例では、データ・ベース誤り訂
正プロセッサ30は、マルチタスク・アプリケーション
において、同一のプロセッサ25内における人工知能誤
り訂正プロセッサ28及び文字認識プロセッサ26と組
合わされる。
プロセッサ28から、ローカル・エリア・ネットワーク
20を介し、第2の修復ステーションに相当するデータ
・ベース誤り訂正プロセッサ30に出力される。データ
・ベース誤り訂正プロセッサ30は、ホスト・コンピュ
ータ34上で実行される特定のアプリケーションにおい
て使用される顧客名のデータ・ベースを含む。この例で
はホスト・コンピュータ34は保険会社における保険書
式の文書イメージ保管システムを管理する。保険会社は
多数の保険顧客を有し、これらの保険顧客のリストはデ
ータ・ベース誤り訂正プロセッサ30に含まれる。デー
タ・ベース誤り訂正プロセッサ30に入力されるMGD
S 50Cにおける提示される文字ストリングを比較す
ることにより、特定のホスト・コンピュータ・アプリケ
ーションにおけるある保険顧客の実際の名前と同じ文字
ストリングが選択される。この例では、MGDS 50
CはAI誤り訂正プロセッサ28からデータ・ベース誤
り訂正プロセッサ30に入力され、ここで第2の修復セ
グメントR2が追加される。第2の修復セグメントR2
はプロセッサ30により実行される第2の修復を特徴づ
ける。本発明の別の実施例では、データ・ベース誤り訂
正プロセッサ30は、マルチタスク・アプリケーション
において、同一のプロセッサ25内における人工知能誤
り訂正プロセッサ28及び文字認識プロセッサ26と組
合わされる。
【0174】データ・ベース誤り訂正プロセッサ30は
文字データ・バッファBから好適な選択文字ストリン
グ"Joan"46を取得し、全ての保険顧客名を含むデータ
・ベースとの比較を実行する。"Joan Doe"との一致が存
在しないことが見いだされる。次にデータ・ベース誤り
訂正プロセッサ30はMGDS 50Cから受信される
代わりの選択48"John"を取得し、これをデータ・ベー
ス内の保険顧客名との比較に適用する。比較は成功
し、"John Doe"が見い出される。この第2の修復オペレ
ーションの結果、ストリング46"Joan"を有する文字デ
ータ・バッファBの内容が、第2の修復セグメントR2
内の入力データ修復部分37に転送される。次に文字デ
ータ・バッファBの内容として、文字ストリング48"J
ohn"に対応する修復値がロードされる。
文字データ・バッファBから好適な選択文字ストリン
グ"Joan"46を取得し、全ての保険顧客名を含むデータ
・ベースとの比較を実行する。"Joan Doe"との一致が存
在しないことが見いだされる。次にデータ・ベース誤り
訂正プロセッサ30はMGDS 50Cから受信される
代わりの選択48"John"を取得し、これをデータ・ベー
ス内の保険顧客名との比較に適用する。比較は成功
し、"John Doe"が見い出される。この第2の修復オペレ
ーションの結果、ストリング46"Joan"を有する文字デ
ータ・バッファBの内容が、第2の修復セグメントR2
内の入力データ修復部分37に転送される。次に文字デ
ータ・バッファBの内容として、文字ストリング48"J
ohn"に対応する修復値がロードされる。
【0175】図29乃至図30はデータ・ベース誤り訂
正プロセッサ30により実行される、データ・ベース誤
り訂正処理30Aを表す。データ・ベース誤り訂正プロ
セッサ30は図35にその詳細体系図が示される。プロ
セッサ30はメモリ502を含み、これはバス522に
よりCPU510、大容量記憶装置512、表示及びキ
ーボード514、LANアダプタ516、ファックス及
びネットワーク・アダプタ520に接続される。LAN
アダプタ516はLAN20をバス522に接続する。
正プロセッサ30により実行される、データ・ベース誤
り訂正処理30Aを表す。データ・ベース誤り訂正プロ
セッサ30は図35にその詳細体系図が示される。プロ
セッサ30はメモリ502を含み、これはバス522に
よりCPU510、大容量記憶装置512、表示及びキ
ーボード514、LANアダプタ516、ファックス及
びネットワーク・アダプタ520に接続される。LAN
アダプタ516はLAN20をバス522に接続する。
【0176】データ・ベース誤り訂正プロセッサ30の
メモリ502は書式テンプレート33を受信及び格納す
るための区分を含む。また、MGDS 50Cを受信及
び格納するための別の区分も含まれる。更に第2の修復
処理を実行し、MGDS 50Dを出力するデータ・ベ
ース誤り訂正プログラム30A^ を格納するための区分
が含まれる。またメモリ502にはオペレーティング・
システム504が含まれる。
メモリ502は書式テンプレート33を受信及び格納す
るための区分を含む。また、MGDS 50Cを受信及
び格納するための別の区分も含まれる。更に第2の修復
処理を実行し、MGDS 50Dを出力するデータ・ベ
ース誤り訂正プログラム30A^ を格納するための区分
が含まれる。またメモリ502にはオペレーティング・
システム504が含まれる。
【0177】図29乃至図30の流れ図はプログラム3
0A^ を形成する、実行可能命令のシーケンスにコード
化されるデータ・ベース誤り訂正処理30Aを表す。図
29乃至図30の処理は書式処理テンプレート33を入
力するステップ163で開始される。処理は次にステッ
プ164に遷移し、これは図5に示されるMGDSメッ
セージ50Cを入力する。
0A^ を形成する、実行可能命令のシーケンスにコード
化されるデータ・ベース誤り訂正処理30Aを表す。図
29乃至図30の処理は書式処理テンプレート33を入
力するステップ163で開始される。処理は次にステッ
プ164に遷移し、これは図5に示されるMGDSメッ
セージ50Cを入力する。
【0178】次にステップ166は書式内の各フィール
ドに対しループを開始する。フィールド変数は1にセッ
トされ、ステップ166はフィールド・データ・セグメ
ントがゼロに等しくない懐疑文字返却コードSC、或い
はゼロに等しくない拒絶文字返却コードRCを有するか
を判断することより開始される。これは次に第1の修復
セグメントR1が100パーセントより小さな確率値3
9を有する要求を伴う。別の条件として、フィールドが
この処理に再ルートされたかが判断される。これは処理
30Aを行先処理として識別するロケーション76内の
再ルート行先値により示される。これら条件のいずれか
が適合すると、次に処理はステップ167に移行する。
どの条件も適合しない場合は処理はステップ184に移
行する。
ドに対しループを開始する。フィールド変数は1にセッ
トされ、ステップ166はフィールド・データ・セグメ
ントがゼロに等しくない懐疑文字返却コードSC、或い
はゼロに等しくない拒絶文字返却コードRCを有するか
を判断することより開始される。これは次に第1の修復
セグメントR1が100パーセントより小さな確率値3
9を有する要求を伴う。別の条件として、フィールドが
この処理に再ルートされたかが判断される。これは処理
30Aを行先処理として識別するロケーション76内の
再ルート行先値により示される。これら条件のいずれか
が適合すると、次に処理はステップ167に移行する。
どの条件も適合しない場合は処理はステップ184に移
行する。
【0179】ステップ167において、このフィールド
に対応する再ルート行先が、別の処理に移行する様に指
示されているかどうかが判断される。そうである場合、
処理はステップ184に移行する。そうでない場合は、
図29の処理はステップ168に移行する。ステップ1
68において、第2の修復セグメントR2が図5のMG
DSメッセージ50Cに追加され、図6に示されるMG
DSメッセージ50Dが形成される。
に対応する再ルート行先が、別の処理に移行する様に指
示されているかどうかが判断される。そうである場合、
処理はステップ184に移行する。そうでない場合は、
図29の処理はステップ168に移行する。ステップ1
68において、第2の修復セグメントR2が図5のMG
DSメッセージ50Cに追加され、図6に示されるMG
DSメッセージ50Dが形成される。
【0180】次に処理はステップ169Aに移行し、ス
テップ変数をテンプレート33内のフィールドの第1の
データ・ベース・ステップに等しくセットする。これは
例えば表1のステップ7に対応して示される。次に処理
はステップ169Bに移行し、テンプレート33内のこ
のフィールドにもはやデータ・ベース・ステップが存在
しないかどうかを判断し、存在しない場合には処理は図
30のステップ184に移行する。
テップ変数をテンプレート33内のフィールドの第1の
データ・ベース・ステップに等しくセットする。これは
例えば表1のステップ7に対応して示される。次に処理
はステップ169Bに移行し、テンプレート33内のこ
のフィールドにもはやデータ・ベース・ステップが存在
しないかどうかを判断し、存在しない場合には処理は図
30のステップ184に移行する。
【0181】ステップ170Aはループを開始し、これ
はテンプレート33内に指定されるフィールドにおける
各それぞれのステップに対して実行される。ステップ1
70Aはテンプレートからステップ・データを読出す。
この例に対応して表1を参照すると、ステップ7はフィ
ールド1に対応する第1のデータ・ベース・ステップで
あり、そのオペレーションは保険顧客名データ・ベース
・ルーチンとして指定される。図29のステップ170
Bはコード化データに対し、データ・ベース・ルーチン
・ステップを実行する。ステップ171はフィールド・
データ・セグメントのバッファBからコード化データ4
6を獲得する。次にステップ172はコード化データ4
6のデータ・ベース・チェックを実行し、第1の確率値
を計算する。
はテンプレート33内に指定されるフィールドにおける
各それぞれのステップに対して実行される。ステップ1
70Aはテンプレートからステップ・データを読出す。
この例に対応して表1を参照すると、ステップ7はフィ
ールド1に対応する第1のデータ・ベース・ステップで
あり、そのオペレーションは保険顧客名データ・ベース
・ルーチンとして指定される。図29のステップ170
Bはコード化データに対し、データ・ベース・ルーチン
・ステップを実行する。ステップ171はフィールド・
データ・セグメントのバッファBからコード化データ4
6を獲得する。次にステップ172はコード化データ4
6のデータ・ベース・チェックを実行し、第1の確率値
を計算する。
【0182】次にステップ174は第1の修復セグメン
トR1から代替選択コード化データ48を獲得する。ス
テップ175は代替選択コード化データ48のデータ・
ベース・チェックを実行し、第2の確率値を計算する。
トR1から代替選択コード化データ48を獲得する。ス
テップ175は代替選択コード化データ48のデータ・
ベース・チェックを実行し、第2の確率値を計算する。
【0183】次にステップ176はどちらの確率値も、
ステップに対応してテンプレート内に提供される最小デ
ータ・ベース確率値よりも大きくないかどうかを判断す
る。表1のステップ7に戻り、最小データ・ベース確率
に対応する分岐値として100パーセントが提供されて
いる。これはステップ172或いはステップ175にお
いて計算される確率値が100パーセントよりも大きく
なければならないことを意味する。ステップ176で、
ステップ172或いは175のどちらにおいて計算され
た確率値も、最小データ・ベース確率値よりも大きくは
ないことが判断されると、次にステップ変数はテンプレ
ート内に提供される誤り時の次のステップ値に等しくセ
ットされる。表1を参照すると、ステップ7において誤
り時の次のステップ値は8と示され、これはすなわち次
のステップが再ルート・ステップ8であることを示し、
MGDS 50D内にフィールド再ルート行先を挿入す
る。
ステップに対応してテンプレート内に提供される最小デ
ータ・ベース確率値よりも大きくないかどうかを判断す
る。表1のステップ7に戻り、最小データ・ベース確率
に対応する分岐値として100パーセントが提供されて
いる。これはステップ172或いはステップ175にお
いて計算される確率値が100パーセントよりも大きく
なければならないことを意味する。ステップ176で、
ステップ172或いは175のどちらにおいて計算され
た確率値も、最小データ・ベース確率値よりも大きくは
ないことが判断されると、次にステップ変数はテンプレ
ート内に提供される誤り時の次のステップ値に等しくセ
ットされる。表1を参照すると、ステップ7において誤
り時の次のステップ値は8と示され、これはすなわち次
のステップが再ルート・ステップ8であることを示し、
MGDS 50D内にフィールド再ルート行先を挿入す
る。
【0184】またステップ176において、ステップ1
72或いは175で計算された確率値のどちらか一方或
いは両方が、テンプレート33内に提供される最小デー
タ・ベース確率値よりも大きいと判断されると、次にス
テップ変数はテンプレート33内のOK時の次のステッ
プ値に等しくセットされる。表1に戻り、ステップ7に
おけるOK時の次ステップは9と示され、これは次のス
テップが表1のテンプレートのステップ9であることを
意味する。ここでステップ9は手動検査訂正ルーチンに
相当する。
72或いは175で計算された確率値のどちらか一方或
いは両方が、テンプレート33内に提供される最小デー
タ・ベース確率値よりも大きいと判断されると、次にス
テップ変数はテンプレート33内のOK時の次のステッ
プ値に等しくセットされる。表1に戻り、ステップ7に
おけるOK時の次ステップは9と示され、これは次のス
テップが表1のテンプレートのステップ9であることを
意味する。ここでステップ9は手動検査訂正ルーチンに
相当する。
【0185】図29の流れ図は次にステップ177に遷
移し、ステップ176で識別された新たなステップがデ
ータ・ベース・ステップであるかどうかを判断する。こ
れがデータ・ベース・ステップである場合、次に処理は
ステップ170Aにループして戻る。また、データ・ベ
ース・ステップでない場合は、これはこのフィールドに
おけるデータ・ベース・ステップの終了を意味する。
移し、ステップ176で識別された新たなステップがデ
ータ・ベース・ステップであるかどうかを判断する。こ
れがデータ・ベース・ステップである場合、次に処理は
ステップ170Aにループして戻る。また、データ・ベ
ース・ステップでない場合は、これはこのフィールドに
おけるデータ・ベース・ステップの終了を意味する。
【0186】次に処理は図30のステップ178に移行
し、ステップ175で計算された第2の確率値が、ステ
ップ172で計算された第1の確率値よりも大きいかど
うかを判断する。大きい場合、コード化データ46はフ
ィールド・データ・セグメントのデータ・バッファBか
ら第2の修復セグメントR2のバッファ43に転送され
る。次に図6に示されるように、代替選択コード化デー
タ48がバッファBにロードされる。
し、ステップ175で計算された第2の確率値が、ステ
ップ172で計算された第1の確率値よりも大きいかど
うかを判断する。大きい場合、コード化データ46はフ
ィールド・データ・セグメントのデータ・バッファBか
ら第2の修復セグメントR2のバッファ43に転送され
る。次に図6に示されるように、代替選択コード化デー
タ48がバッファBにロードされる。
【0187】ステップ180は、ステップ178で計算
及び識別された確率値41を、第2の修復セグメント4
2にロードする。次にステップ182において、修復オ
ペレーション73及びタイム・スタンプが第2の修復セ
グメントR2にロードされる。図6を参照すると、修復
セグメントR2のオペレーション実行部分73はオペレ
ーション行先"ICN-DB"をロードし、これは"保険顧客名
データ・ベース"を表す。
及び識別された確率値41を、第2の修復セグメント4
2にロードする。次にステップ182において、修復オ
ペレーション73及びタイム・スタンプが第2の修復セ
グメントR2にロードされる。図6を参照すると、修復
セグメントR2のオペレーション実行部分73はオペレ
ーション行先"ICN-DB"をロードし、これは"保険顧客名
データ・ベース"を表す。
【0188】次に図30のステップ183において、ス
テップ170A乃至177のループで識別された最後の
ステップが再ルート処理ステップであるかが判断され
る。そうである場合、再ルート行先がMGDS部分76
に挿入される。
テップ170A乃至177のループで識別された最後の
ステップが再ルート処理ステップであるかが判断され
る。そうである場合、再ルート行先がMGDS部分76
に挿入される。
【0189】次にステップ184において、フィールド
変数が1だけインクリメントされ、書式内に別のフィー
ルドが存在するかどうかが判断される。存在する場合、
次に処理はステップ166にループして戻る。その他の
場合、処理はステップ186に移行する。ステップ18
6において、MGDS 50Dが出力される。これは図
14に示される。
変数が1だけインクリメントされ、書式内に別のフィー
ルドが存在するかどうかが判断される。存在する場合、
次に処理はステップ166にループして戻る。その他の
場合、処理はステップ186に移行する。ステップ18
6において、MGDS 50Dが出力される。これは図
14に示される。
【0190】図14に示されるMGDS 50Dは6フ
ィールド・データ・セグメント及び3修復セグメントを
有する。6フィールド・データ・セグメントは、図19
の抽出フィールド・イメージ10^^に存在する6フィー
ルドに対応する。MGDS50Dの各それぞれのフィー
ルド・データ・セグメントにおけるバッファBは、抽出
フィールド・イメージ10^^の対応するフィールド内の
文字イメージの最適現行予測に相当する文字ストリング
を含む。更に、文字認識修復履歴が3つの修復セグメン
トR1、R1^ 及びR2の書式に生成される。これら3
つの修復セグメントの存在は、それぞれのフィールド・
データ・セグメントの後続の解析を支援する。これら3
つの修復セグメントの存在はまた、全体的な文字認識処
理を改善するための監査証跡を提供する。
ィールド・データ・セグメント及び3修復セグメントを
有する。6フィールド・データ・セグメントは、図19
の抽出フィールド・イメージ10^^に存在する6フィー
ルドに対応する。MGDS50Dの各それぞれのフィー
ルド・データ・セグメントにおけるバッファBは、抽出
フィールド・イメージ10^^の対応するフィールド内の
文字イメージの最適現行予測に相当する文字ストリング
を含む。更に、文字認識修復履歴が3つの修復セグメン
トR1、R1^ 及びR2の書式に生成される。これら3
つの修復セグメントの存在は、それぞれのフィールド・
データ・セグメントの後続の解析を支援する。これら3
つの修復セグメントの存在はまた、全体的な文字認識処
理を改善するための監査証跡を提供する。
【0191】誤り訂正プロセッサ30は修復アドレス"3
0"をセグメントR2にロードし、この場合の修復IDす
なわちデータ・ベース"DB"を第2のセグメントR2にロ
ードし、更に修復タイム・スタンプの5時4分1秒をR
2の修復タイム・スタンプ・パラメータにロードする。
実行オペレーションが"DATA BASE" としてセグメントR
2にロードされ、その時、R2におけるそれらのフィー
ルド修復包含パラメータにはファースト・ネームを示
す"FIRST" がロードされ、文字位置として変更された文
字がストリング内における3番目の文字に相当すること
を示す"2" がロードされる。データ・ベース照会もまた
入力され、セグメントR2において "顧客名" として特
徴化される。更に、確率レベルを示す100パーセント
がセグメントR2に入力される。データ・ベース誤り訂
正プロセッサ30から出力される完了済みのMGDSメ
ッセージ50Dを図6に示す。
0"をセグメントR2にロードし、この場合の修復IDす
なわちデータ・ベース"DB"を第2のセグメントR2にロ
ードし、更に修復タイム・スタンプの5時4分1秒をR
2の修復タイム・スタンプ・パラメータにロードする。
実行オペレーションが"DATA BASE" としてセグメントR
2にロードされ、その時、R2におけるそれらのフィー
ルド修復包含パラメータにはファースト・ネームを示
す"FIRST" がロードされ、文字位置として変更された文
字がストリング内における3番目の文字に相当すること
を示す"2" がロードされる。データ・ベース照会もまた
入力され、セグメントR2において "顧客名" として特
徴化される。更に、確率レベルを示す100パーセント
がセグメントR2に入力される。データ・ベース誤り訂
正プロセッサ30から出力される完了済みのMGDSメ
ッセージ50Dを図6に示す。
【0192】MGDS 50Dは次にローカル・エリア
・ネットワーク20を介して、手動検査及び訂正プロセ
ッサ32に転送される。
・ネットワーク20を介して、手動検査及び訂正プロセ
ッサ32に転送される。
【0193】手動検査及び誤り訂正プロセッサ32はM
GDS 50Dを受取り、これを第3の修復セグメント
R3に追加する。アプリケーションに応じて、要求され
る手動検査は、特定のフィールドに対応してフラグ化さ
れた文字ストリングの順次的訂正の結果、実行される。
GDS 50Dを受取り、これを第3の修復セグメント
R3に追加する。アプリケーションに応じて、要求され
る手動検査は、特定のフィールドに対応してフラグ化さ
れた文字ストリングの順次的訂正の結果、実行される。
【0194】データ・ベース誤り訂正プロセッサ30か
ら出力され、手動検査及び訂正プロセッサ32により受
信されるMGDSメッセージ50Dは、プロセッサ30
においてオペレータにより検査された文字データ48"J
ohn"を含む。訂正プロセッサ32は第3の修復段階に対
応して第3の修復セグメントR3を追加し、実際の修
復、或いは単に妥当性検査が実行される。修復アドレ
ス"32"及びオペレータ"Jones" の識別がセグメントR3
に入力される。また、修復タイム・スタンプとして5時
5分15秒がセグメントR3に入力される。実行オペレ
ーションは "検査" としてセグメントR3に示される。
アプリケーションが要求する文字或いは全ストリングに
対応する座標が、当初文字認識プロセッサ26により生
成された拒絶文字情報Sから抽出される。これらはフィ
ールドにおけるイメージ・ビット・マップ及び文字認識
プロセッサ26より識別される拒絶文字、或いは懐疑文
字のロケーションの座標を示す。訂正プロセッサ32は
フィールドがオペレータに表示される時に、それらを強
調表示及び/或いは拡大するために、これらの座標を使
用する。文書イメージ10^ のコピーはLAN20を介
し訂正プロセッサ32に渡され、オペレータにより見ら
れる。拒絶文字或いは懐疑文字の座標により指定される
ロケーションは、表示される文書イメージのその部分を
強調表示及び/或いは拡大するために使用される。オペ
レータは次に文書イメージの強調表示部分を、同様にプ
ロセッサ32の表示画面上に英数字文字により表示され
る文字ストリング48"John"と迅速に比較することがで
きる。オペレータがストリング48"John"の表示を容認
すると、次に検査容認がセグメントR3に記録される。
検査の指摘がセグメントR3に入力され、例えばコメン
ト部分として記入される。
ら出力され、手動検査及び訂正プロセッサ32により受
信されるMGDSメッセージ50Dは、プロセッサ30
においてオペレータにより検査された文字データ48"J
ohn"を含む。訂正プロセッサ32は第3の修復段階に対
応して第3の修復セグメントR3を追加し、実際の修
復、或いは単に妥当性検査が実行される。修復アドレ
ス"32"及びオペレータ"Jones" の識別がセグメントR3
に入力される。また、修復タイム・スタンプとして5時
5分15秒がセグメントR3に入力される。実行オペレ
ーションは "検査" としてセグメントR3に示される。
アプリケーションが要求する文字或いは全ストリングに
対応する座標が、当初文字認識プロセッサ26により生
成された拒絶文字情報Sから抽出される。これらはフィ
ールドにおけるイメージ・ビット・マップ及び文字認識
プロセッサ26より識別される拒絶文字、或いは懐疑文
字のロケーションの座標を示す。訂正プロセッサ32は
フィールドがオペレータに表示される時に、それらを強
調表示及び/或いは拡大するために、これらの座標を使
用する。文書イメージ10^ のコピーはLAN20を介
し訂正プロセッサ32に渡され、オペレータにより見ら
れる。拒絶文字或いは懐疑文字の座標により指定される
ロケーションは、表示される文書イメージのその部分を
強調表示及び/或いは拡大するために使用される。オペ
レータは次に文書イメージの強調表示部分を、同様にプ
ロセッサ32の表示画面上に英数字文字により表示され
る文字ストリング48"John"と迅速に比較することがで
きる。オペレータがストリング48"John"の表示を容認
すると、次に検査容認がセグメントR3に記録される。
検査の指摘がセグメントR3に入力され、例えばコメン
ト部分として記入される。
【0195】また、オペレータがストリング48をスト
リング49"JOHN"に変更するために、全ての文字を大文
字化するような変更を望む場合、本発明によれば、スト
リング48は文字データ・バッファBからセグメントR
3の入力データ修復部分55に転送される。次にプロセ
ッサ32は訂正値ストリング49"JOHN"を文字データ・
バッファBにロードする。フィールド名、文字位置、及
びコメントなどの他の適切なフィールドがセグメントR
3に記入される。
リング49"JOHN"に変更するために、全ての文字を大文
字化するような変更を望む場合、本発明によれば、スト
リング48は文字データ・バッファBからセグメントR
3の入力データ修復部分55に転送される。次にプロセ
ッサ32は訂正値ストリング49"JOHN"を文字データ・
バッファBにロードする。フィールド名、文字位置、及
びコメントなどの他の適切なフィールドがセグメントR
3に記入される。
【0196】手動検査及び訂正処理32Aを図31及び
図32に示す。図31の流れ図は書式処理テンプレート
33を入力するステップ187で開始される。次にステ
ップ188において、図6に示されるMGDS 50D
が入力される。
図32に示す。図31の流れ図は書式処理テンプレート
33を入力するステップ187で開始される。次にステ
ップ188において、図6に示されるMGDS 50D
が入力される。
【0197】次にステップ190は書式内の各フィール
ドに対応してループを開始する。フィールド変数は1に
セットされ、次にステップ190において、フィールド
・データ・セグメントがゼロに等しくない懐疑文字返却
コードSC、或いはゼロに等しくない拒絶文字返却コー
ドRCを有するかが判断される。また、ステップ199
0は第2の修復セグメントR2が、100パーセントよ
りも小さな確率値41を有するかどうかを判断する。更
にステップ190は、フィールド・データ・セグメント
が処理32Aを指し示すMGDS内の再ルート行先値に
より、この処理に再ルートされているかを判断する。こ
れらいずれかの条件が適合する場合、次に処理はステッ
プ191に移行する。適合しない場合、処理は図32の
ステップ212に移行する。
ドに対応してループを開始する。フィールド変数は1に
セットされ、次にステップ190において、フィールド
・データ・セグメントがゼロに等しくない懐疑文字返却
コードSC、或いはゼロに等しくない拒絶文字返却コー
ドRCを有するかが判断される。また、ステップ199
0は第2の修復セグメントR2が、100パーセントよ
りも小さな確率値41を有するかどうかを判断する。更
にステップ190は、フィールド・データ・セグメント
が処理32Aを指し示すMGDS内の再ルート行先値に
より、この処理に再ルートされているかを判断する。こ
れらいずれかの条件が適合する場合、次に処理はステッ
プ191に移行する。適合しない場合、処理は図32の
ステップ212に移行する。
【0198】ステップ191において、フィールドに対
応する再ルート行先が別の処理であるかどうかが判断さ
れる。そうである場合、次に処理はステップ212に移
行する。それ以外の場合、図31の処理はステップ19
2に移行し、ここで第3の修復セグメントR3を図6に
示されるMGDSメッセージ50Dに追加し、その結
果、図7に示されるMGDSメッセージ50Eが形成さ
れる。
応する再ルート行先が別の処理であるかどうかが判断さ
れる。そうである場合、次に処理はステップ212に移
行する。それ以外の場合、図31の処理はステップ19
2に移行し、ここで第3の修復セグメントR3を図6に
示されるMGDSメッセージ50Dに追加し、その結
果、図7に示されるMGDSメッセージ50Eが形成さ
れる。
【0199】次にステップ193Aにおいて、ステップ
変数はテンプレート33内のフィールドの第1の手動処
理ステップに等しくセットされる。これは表1のステッ
プ9に対応する。次にステップ193Bにおいて、テン
プレート33に示されるこのフィールドにおいて、もは
や手動処理ステップが存在しないかどうかが判断され、
存在しない場合には処理はステップ212に移行する。
変数はテンプレート33内のフィールドの第1の手動処
理ステップに等しくセットされる。これは表1のステッ
プ9に対応する。次にステップ193Bにおいて、テン
プレート33に示されるこのフィールドにおいて、もは
や手動処理ステップが存在しないかどうかが判断され、
存在しない場合には処理はステップ212に移行する。
【0200】ステップ194Aはフィールド内の各ステ
ップに対応してループを開始する。ステップ194Aは
テンプレートからステップ・データを読出す。表1を参
照すると、ステップ9はこのフィールドに対応するテン
プレート内における最初の手動処理ステップである。ス
テップ194Bにおいて、ステップはコード化データに
対し、手動ルーチンを実行する。手動ルーチンはテンプ
レート33内に記述されている手動検査及び訂正ルーチ
ンである。ステップ195はフィールド・データ・セグ
メントのバッファBからコード化データ48を獲得す
る。次にステップ196はコード化データ48を修復オ
ペレータに表示する。次にステップ198は書式文書イ
メージ10^ を獲得し、それを修復オペレータに表示す
る。ステップ200は、図4に示される懐疑文字イメー
ジの座標21及び/或いは拒絶文字イメージの座標31
を、フィールド・データ・セグメントから獲得する。次
にステップ202において、懐疑文字及び/或いは拒絶
文字位置に対応する文字イメージが強調表示及び/或い
は拡大される。次にステップ204において、訂正コー
ド化データ49がオペレータ・キーボードから入力され
る。
ップに対応してループを開始する。ステップ194Aは
テンプレートからステップ・データを読出す。表1を参
照すると、ステップ9はこのフィールドに対応するテン
プレート内における最初の手動処理ステップである。ス
テップ194Bにおいて、ステップはコード化データに
対し、手動ルーチンを実行する。手動ルーチンはテンプ
レート33内に記述されている手動検査及び訂正ルーチ
ンである。ステップ195はフィールド・データ・セグ
メントのバッファBからコード化データ48を獲得す
る。次にステップ196はコード化データ48を修復オ
ペレータに表示する。次にステップ198は書式文書イ
メージ10^ を獲得し、それを修復オペレータに表示す
る。ステップ200は、図4に示される懐疑文字イメー
ジの座標21及び/或いは拒絶文字イメージの座標31
を、フィールド・データ・セグメントから獲得する。次
にステップ202において、懐疑文字及び/或いは拒絶
文字位置に対応する文字イメージが強調表示及び/或い
は拡大される。次にステップ204において、訂正コー
ド化データ49がオペレータ・キーボードから入力され
る。
【0201】ステップ205はステップ変数を1だけイ
ンクリメントし、新たなステップが手動処理ステップか
どうかを判断する。そうでない場合、ステップ194A
から205までのループに対応する手動処理ステップを
終了する。
ンクリメントし、新たなステップが手動処理ステップか
どうかを判断する。そうでない場合、ステップ194A
から205までのループに対応する手動処理ステップを
終了する。
【0202】図31の処理は次に図32のステップ20
6に移行し、ここでコード化データ48をデータ・バッ
ファBから第3の修復セグメントR3のバッファ55に
転送し、訂正コード化データ49をバッファBにロード
する。この様子は図7に示される。次にステップ208
において、オペレータ・コマンドが第3の修復セグメン
トR3にロードされる。
6に移行し、ここでコード化データ48をデータ・バッ
ファBから第3の修復セグメントR3のバッファ55に
転送し、訂正コード化データ49をバッファBにロード
する。この様子は図7に示される。次にステップ208
において、オペレータ・コマンドが第3の修復セグメン
トR3にロードされる。
【0203】次にステップ210において、修復プロセ
ッサ・アドレス及びタイム・スタンプが第3の修復セグ
メントR3にロードされる。ステップ111において、
ステップ194A乃至205のループにおいて識別され
る最後のステップが、再ルート処理ステップであるかが
判断される。そうである場合、次に再ルート行先値がM
GDSに挿入される。
ッサ・アドレス及びタイム・スタンプが第3の修復セグ
メントR3にロードされる。ステップ111において、
ステップ194A乃至205のループにおいて識別され
る最後のステップが、再ルート処理ステップであるかが
判断される。そうである場合、次に再ルート行先値がM
GDSに挿入される。
【0204】次にステップ212において、フィールド
変数が1だけインクリメントされ、書式内に別のフィー
ルドが存在するかどうかが判断される。存在しない場
合、次に処理はステップ214に遷移する。ステップ2
14は図15に示されるMGDSメッセージ50Eを出
力する。
変数が1だけインクリメントされ、書式内に別のフィー
ルドが存在するかどうかが判断される。存在しない場
合、次に処理はステップ214に遷移する。ステップ2
14は図15に示されるMGDSメッセージ50Eを出
力する。
【0205】この例では、手動検査及び訂正処理32A
により処理するべき他のフィールドは存在しない。従っ
て、処理はステップ214に遷移し、図15に示される
MGDSメッセージ50Eを出力する。図15に示され
るMGDSメッセージ50Eは6個のフィールド・デー
タ・セグメントを及び5個の修復セグメントを有する。
により処理するべき他のフィールドは存在しない。従っ
て、処理はステップ214に遷移し、図15に示される
MGDSメッセージ50Eを出力する。図15に示され
るMGDSメッセージ50Eは6個のフィールド・デー
タ・セグメントを及び5個の修復セグメントを有する。
【0206】図15はMGDS 50Eの書式を示し、
修復履歴記憶装置38へ格納するために、ホスト・コン
ピュータ34に出力される。MGDS 50Eを修復履
歴記憶装置38に格納する以前に、ホスト・コンピュー
タ34は図18の書式10^の6個の各フィールドにお
ける各フィールド・データ・セグメントに対応するバッ
ファBの内容を取出し、各バッファBの内容を書式内の
対応するフィールドのイメージを表す、文字ストリング
の最適な予測として格納する。MGDS 50Eのフィ
ールド・セグメント52からのコード化データは、バッ
ファBに"Doe"として含まれる。このコード化データは
図18の走査書式イメージ10^ のラスト・ネーム・フ
ィールド14^ を表すものとして、ホスト・コンピュー
タ34によりコード化データ記憶装置35に格納され
る。同様に、文字ストリング"JOHN"を含むフィールド・
データ・セグメント54に対応するバッファBは、走査
書式イメージ10^のファースト・ネーム・フィールド
16^を表す文字ストリングの最適な予測として、ホス
ト・コンピュータ34によりコード化データ記憶装置3
5に格納される。同様に、文字ストリング"Fla" を含む
フィールド・データ・セグメント56のバッファBの内
容は、図18の走査書式イメージ10^ の州フィールド
12a^ の最適な予測として、ホスト・コンピュータ3
4によりコード化データ記憶装置35に格納される。
修復履歴記憶装置38へ格納するために、ホスト・コン
ピュータ34に出力される。MGDS 50Eを修復履
歴記憶装置38に格納する以前に、ホスト・コンピュー
タ34は図18の書式10^の6個の各フィールドにお
ける各フィールド・データ・セグメントに対応するバッ
ファBの内容を取出し、各バッファBの内容を書式内の
対応するフィールドのイメージを表す、文字ストリング
の最適な予測として格納する。MGDS 50Eのフィ
ールド・セグメント52からのコード化データは、バッ
ファBに"Doe"として含まれる。このコード化データは
図18の走査書式イメージ10^ のラスト・ネーム・フ
ィールド14^ を表すものとして、ホスト・コンピュー
タ34によりコード化データ記憶装置35に格納され
る。同様に、文字ストリング"JOHN"を含むフィールド・
データ・セグメント54に対応するバッファBは、走査
書式イメージ10^のファースト・ネーム・フィールド
16^を表す文字ストリングの最適な予測として、ホス
ト・コンピュータ34によりコード化データ記憶装置3
5に格納される。同様に、文字ストリング"Fla" を含む
フィールド・データ・セグメント56のバッファBの内
容は、図18の走査書式イメージ10^ の州フィールド
12a^ の最適な予測として、ホスト・コンピュータ3
4によりコード化データ記憶装置35に格納される。
【0207】後に、ホスト・コンピュータ34がMGD
S 50E内の特定のフィールド・データ・セグメント
に対応する、バッファB内の文字ストリングの修復方法
に関する監査を実施するように命令される場合、そのフ
ィールドの文字認識に関する修復の履歴が、修復履歴記
憶装置38からMGDS 50Eをアクセスすることに
より確認される。監査されるフィールドに対応する各そ
れぞれの修復セグメントは、どのようにして修復が実行
されたかを判断するために調査される。例えば、ファー
スト・ネーム・フィールド16^ を表す第2のフィール
ド・セグメント54に対応して、文字認識修復の監査は
フィールド・データ・セグメント54、修復セグメント
R3、修復セグメントR2、及び修復セグメントR1を
この順序で調査する。これはMGDS 50Eのフィー
ルド・データ・セグメント54に含まれるフィールドの
最後の最適予測から逆方向に作用することを可能とし、
すなわち、そのフィールドに対し実行された修復に対す
る逆シーケンスが可能となる。こうした監視が全体的な
修復処理を改善するために実施される場合、修復の各段
階が如何に実行されたかに関する明確な指摘が、MGD
S 50E内の修復セグメントにより表される、集合的
な修復履歴から明らかにされる。
S 50E内の特定のフィールド・データ・セグメント
に対応する、バッファB内の文字ストリングの修復方法
に関する監査を実施するように命令される場合、そのフ
ィールドの文字認識に関する修復の履歴が、修復履歴記
憶装置38からMGDS 50Eをアクセスすることに
より確認される。監査されるフィールドに対応する各そ
れぞれの修復セグメントは、どのようにして修復が実行
されたかを判断するために調査される。例えば、ファー
スト・ネーム・フィールド16^ を表す第2のフィール
ド・セグメント54に対応して、文字認識修復の監査は
フィールド・データ・セグメント54、修復セグメント
R3、修復セグメントR2、及び修復セグメントR1を
この順序で調査する。これはMGDS 50Eのフィー
ルド・データ・セグメント54に含まれるフィールドの
最後の最適予測から逆方向に作用することを可能とし、
すなわち、そのフィールドに対し実行された修復に対す
る逆シーケンスが可能となる。こうした監視が全体的な
修復処理を改善するために実施される場合、修復の各段
階が如何に実行されたかに関する明確な指摘が、MGD
S 50E内の修復セグメントにより表される、集合的
な修復履歴から明らかにされる。
【0208】結果的に生ずるMGDSメッセージ50E
は、ファースト・ネーム・フィールド16の内容に対し
て実行される順序的修復の履歴を含む。MGDSメッセ
ージ50Eは次にLAN20を介して、一時記憶用のバ
ッファ記憶装置40^ に転送される。また、このメッセ
ージは長期間記憶のために修復履歴記憶装置38にも転
送される。またホスト・コンピュータ34にも転送さ
れ、ストリング49に相当するフィールド・データ・セ
グメント54のコード化データ・バッファBの内容が、
コード化データ記憶装置35にロードされる。この内容
は例えば指標値として使用され、アプリケーションが文
書イメージ10^ を格納するために、保険顧客名を指標
値として使用する。
は、ファースト・ネーム・フィールド16の内容に対し
て実行される順序的修復の履歴を含む。MGDSメッセ
ージ50Eは次にLAN20を介して、一時記憶用のバ
ッファ記憶装置40^ に転送される。また、このメッセ
ージは長期間記憶のために修復履歴記憶装置38にも転
送される。またホスト・コンピュータ34にも転送さ
れ、ストリング49に相当するフィールド・データ・セ
グメント54のコード化データ・バッファBの内容が、
コード化データ記憶装置35にロードされる。この内容
は例えば指標値として使用され、アプリケーションが文
書イメージ10^ を格納するために、保険顧客名を指標
値として使用する。
【0209】手動検査及び訂正プロセッサ32は図34
にその詳細体系図が示される。プロセッサ32はメモリ
402を含み、これはバス422によりCPU410、
大容量記憶装置412、表示及びキーボード414、L
ANアダプタ416、及びファクシミリ及びネットワー
ク・アダプタ420に接続される。LANアダプタ41
6はLAN20をバス422に接続する。FAX及びネ
ットワーク・アダプタ420はファクシミリ電話線をバ
ス422に接続し、これはデータ通信ネットワーク線を
バス422に接続する。
にその詳細体系図が示される。プロセッサ32はメモリ
402を含み、これはバス422によりCPU410、
大容量記憶装置412、表示及びキーボード414、L
ANアダプタ416、及びファクシミリ及びネットワー
ク・アダプタ420に接続される。LANアダプタ41
6はLAN20をバス422に接続する。FAX及びネ
ットワーク・アダプタ420はファクシミリ電話線をバ
ス422に接続し、これはデータ通信ネットワーク線を
バス422に接続する。
【0210】プロセッサ32のメモリ402はいくつか
の区分を含み、これらは上述の処理を実行するための、
実行可能命令シーケンスに相当するコンピュータ・プロ
グラムを含む。特に手動検査及び訂正プログラム32A
^ がメモリ402に格納され、その命令がCPU410
によりに実行される時、図31乃至図32の手動検査及
び訂正処理32Aが実行される。
の区分を含み、これらは上述の処理を実行するための、
実行可能命令シーケンスに相当するコンピュータ・プロ
グラムを含む。特に手動検査及び訂正プログラム32A
^ がメモリ402に格納され、その命令がCPU410
によりに実行される時、図31乃至図32の手動検査及
び訂正処理32Aが実行される。
【0211】メモリ402はまた図6に詳細に示される
MGDS 50Dを受信及び格納するための区分を含
む。メモリ402は更に書式文書イメージ10^ を受信
及び格納するための区分を有する。
MGDS 50Dを受信及び格納するための区分を含
む。メモリ402は更に書式文書イメージ10^ を受信
及び格納するための区分を有する。
【0212】メモリ402はまた、表示バッファ区分4
24を有し、ここには書式文書イメージ10^ が強調表
示領域58と共にアセンブルされる。強調表示領域はフ
ィールド・イメージ16^ 上の懐疑文字位置21及び拒
絶文字位置31にスーパーインポーズされる。この合成
イメージは次にプロセッサ32において、オペレータに
表示される。更に、表示バッファはコード化データ4
8"John"についても、前述のようにオペレータに表示さ
れるようにアセンブルする。コード化データ48はMG
DS 50Dのコード化データ部分75の文字データ・
バッファBから獲得される。メモリ402内の表示バッ
ファ424は、表示装置414上にその内容が表示され
る。オペレータは代替文字ストリング49"JOHN"をキー
ボードから入力する。
24を有し、ここには書式文書イメージ10^ が強調表
示領域58と共にアセンブルされる。強調表示領域はフ
ィールド・イメージ16^ 上の懐疑文字位置21及び拒
絶文字位置31にスーパーインポーズされる。この合成
イメージは次にプロセッサ32において、オペレータに
表示される。更に、表示バッファはコード化データ4
8"John"についても、前述のようにオペレータに表示さ
れるようにアセンブルする。コード化データ48はMG
DS 50Dのコード化データ部分75の文字データ・
バッファBから獲得される。メモリ402内の表示バッ
ファ424は、表示装置414上にその内容が表示され
る。オペレータは代替文字ストリング49"JOHN"をキー
ボードから入力する。
【0213】図42乃至図49は書式処理テンプレート
33に対する定義処理57Aのオペレーション・ステッ
プ・シーケンスの流れ図を示す。処理57Aは、図1に
示される書式処理テンプレート定義プロセッサ57内の
プログラム57A^ の実行可能プログラム命令のシーケ
ンスとして具現化される。
33に対する定義処理57Aのオペレーション・ステッ
プ・シーケンスの流れ図を示す。処理57Aは、図1に
示される書式処理テンプレート定義プロセッサ57内の
プログラム57A^ の実行可能プログラム命令のシーケ
ンスとして具現化される。
【0214】テンプレート定義処理57Aは、ユーザが
個別の文字認識処理、及び個別のコード化データ誤り訂
正処理を選択することを可能とする。これらの処理はそ
のフィールドが特定の、予想される、一様な特徴を有す
る一群の文書書式を自動的に処理するために必要とな
る。図52は処理57Aにより形成されるテンプレート
33のレイアウトを示す。
個別の文字認識処理、及び個別のコード化データ誤り訂
正処理を選択することを可能とする。これらの処理はそ
のフィールドが特定の、予想される、一様な特徴を有す
る一群の文書書式を自動的に処理するために必要とな
る。図52は処理57Aにより形成されるテンプレート
33のレイアウトを示す。
【0215】図42の処理はユーザが書式名を入力する
ステップ600で開始される。この例では、書式名は"
保険申請書式"である。ステップ602において、マス
タ書式MGDS 50Mが特定の入力書式名に対応して
アクセスされ、これは図17に示される。次にステップ
604において、ユーザはテンプレート名を入力する。
この例では、表1乃至表6はその名が"洪水申請"である
テンプレートを表す。この時点で、処理57Aは図52
に示される処理テンプレート33のヘッダ部分78を形
成する。ヘッダ部分78はテンプレート名、書式名、書
式内のフィールドの数を含む。更に書式の全てのフィー
ルドに対応して、"冗長時のスキップ"ステップがオプシ
ョン的選択として提供される。図52で示されるよう
に、このオプションは選択不可であるため、個々のフィ
ールドだけが"冗長時のスキップ"機能の対象として選定
される。更に書式内の全ての関連フィールドの "クロス
・チェック" に対応して、オプションがヘッダ部分78
に提供される。図52で示されるように、このオプショ
ンは選択不可であり、従って、クロス・チェッキングは
この例における個々のフィールドに対してのみ選定され
る。次にステップ604はステップ606に移行し、図
52に示される処理テンプレート33のフィールド処理
定義部分80の編成を開始する。
ステップ600で開始される。この例では、書式名は"
保険申請書式"である。ステップ602において、マス
タ書式MGDS 50Mが特定の入力書式名に対応して
アクセスされ、これは図17に示される。次にステップ
604において、ユーザはテンプレート名を入力する。
この例では、表1乃至表6はその名が"洪水申請"である
テンプレートを表す。この時点で、処理57Aは図52
に示される処理テンプレート33のヘッダ部分78を形
成する。ヘッダ部分78はテンプレート名、書式名、書
式内のフィールドの数を含む。更に書式の全てのフィー
ルドに対応して、"冗長時のスキップ"ステップがオプシ
ョン的選択として提供される。図52で示されるよう
に、このオプションは選択不可であるため、個々のフィ
ールドだけが"冗長時のスキップ"機能の対象として選定
される。更に書式内の全ての関連フィールドの "クロス
・チェック" に対応して、オプションがヘッダ部分78
に提供される。図52で示されるように、このオプショ
ンは選択不可であり、従って、クロス・チェッキングは
この例における個々のフィールドに対してのみ選定され
る。次にステップ604はステップ606に移行し、図
52に示される処理テンプレート33のフィールド処理
定義部分80の編成を開始する。
【0216】ステップ606は各フィールドに対応して
ループを開始する。この例における保険申請書式は6個
のフィールドを有するため、このループは6回繰返され
る。ステップ610はフィールド抽出処理シーケンスの
定義を開始する。ステップ変数が1にセットされ、次に
試行変数が1にセットされる。
ループを開始する。この例における保険申請書式は6個
のフィールドを有するため、このループは6回繰返され
る。ステップ610はフィールド抽出処理シーケンスの
定義を開始する。ステップ変数が1にセットされ、次に
試行変数が1にセットされる。
【0217】別のループがステップ612で各試行に対
応して開始される。ステップ613において、ユーザは
試行に対応するオペレーション名を入力する。例えば、
表1において、ステップ1は"フィールド抽出ルーチン"
のオペレーションに対応して試行1を有する。
応して開始される。ステップ613において、ユーザは
試行に対応するオペレーション名を入力する。例えば、
表1において、ステップ1は"フィールド抽出ルーチン"
のオペレーションに対応して試行1を有する。
【0218】次にステップ614において、ユーザはそ
のステップに対応する分岐値を入力する。例えば表1に
おいて、ステップ3に対応するハンドプリントの認識処
理において、最大拒絶誤りに対応する分岐値は1であ
り、最大懐疑文字誤りに対応する分岐値は1である。
のステップに対応する分岐値を入力する。例えば表1に
おいて、ステップ3に対応するハンドプリントの認識処
理において、最大拒絶誤りに対応する分岐値は1であ
り、最大懐疑文字誤りに対応する分岐値は1である。
【0219】次に図42のステップ615において、ユ
ーザは誤り時の次のステップ値及びOK時の次のステッ
プ値を入力する。例えば、表1のステップ3において誤
り時の次のステップ値は4であり、OK時の次のステッ
プは7である。
ーザは誤り時の次のステップ値及びOK時の次のステッ
プ値を入力する。例えば、表1のステップ3において誤
り時の次のステップ値は4であり、OK時の次のステッ
プは7である。
【0220】次にステップ616において、現行ステッ
プに対応するテンプレート部分がアセンブルされる。例
えば、文書ID、フィールドID、ステップ番号、 "フ
ィールド抽出" オペレーションに相当する処理タイプ、
分岐値、誤り時の次のステップ、及びOK時の次のステ
ップ値がアセンブルされる。表1によりこれらが参照さ
れる。
プに対応するテンプレート部分がアセンブルされる。例
えば、文書ID、フィールドID、ステップ番号、 "フ
ィールド抽出" オペレーションに相当する処理タイプ、
分岐値、誤り時の次のステップ、及びOK時の次のステ
ップ値がアセンブルされる。表1によりこれらが参照さ
れる。
【0221】ステップ617において、ステップ変数が
1だけインクリメントされ、プロンプト"Any more tria
ls for this process type?"が表示される。ユーザが"y
es"と応答すると、次に試行変数が1だけインクリメン
トされ、処理はステップ612にループして戻る。ま
た、ユーザがこの処理タイプに対応してもはや試行が存
在しないことを示す場合、処理はステップ618に移行
する。
1だけインクリメントされ、プロンプト"Any more tria
ls for this process type?"が表示される。ユーザが"y
es"と応答すると、次に試行変数が1だけインクリメン
トされ、処理はステップ612にループして戻る。ま
た、ユーザがこの処理タイプに対応してもはや試行が存
在しないことを示す場合、処理はステップ618に移行
する。
【0222】ステップ618において、ユーザは再ルー
ト行先に対応する誤り時の次のステップ値を入力する。
これは表1のステップ2に対応し、値9が誤り時の次の
ステップ欄に挿入される。これによりフィールド再ルー
ト行先が、手動検査及び訂正ルーチンに相当するステッ
プ9において指定される処理となる。
ト行先に対応する誤り時の次のステップ値を入力する。
これは表1のステップ2に対応し、値9が誤り時の次の
ステップ欄に挿入される。これによりフィールド再ルー
ト行先が、手動検査及び訂正ルーチンに相当するステッ
プ9において指定される処理となる。
【0223】次に処理はステップ619に移行し、フィ
ールド再ルート行先に対応するテンプレート・ステップ
をアセンブルする。これには"再ルート"に相当する処理
タイプ、1に等しい試行、"フィールド挿入"に相当する
オペレーションが含まれ、これらは表1により検証され
る。
ールド再ルート行先に対応するテンプレート・ステップ
をアセンブルする。これには"再ルート"に相当する処理
タイプ、1に等しい試行、"フィールド挿入"に相当する
オペレーションが含まれ、これらは表1により検証され
る。
【0224】次に処理は図43のステップ625に移行
し、ステップ変数を1だけインクリメントする。ステッ
プ625において、文字認識処理シーケンス定義が開始
される。ステップ625はステップ626に遷移し、特
定のコード化データを有する関連するフィールドが存在
すれば、ユーザがこのフィールドの処理をスキップする
ことを望むかどうかの判断が開始される。ステップ62
6はMGDSから関連するフィールド・データ77を獲
得する。次にステップ627において、このフィールド
がより高位の優先順位の関連フィールドを有すると判断
されると、プロンプト"Want to skip processing this
field if related field has codeddata which is cert
ain?"が表示される。次にステップ628はユーザが"ye
s"を入力したかを判断し、入力した場合はステップ62
9に移行する。"no"を入力した場合はステップ632に
移行する。ステップ629において、ユーザはテンプレ
ート・ステップに対応する分岐値として最大認識誤りを
入力する。次にステップ630において、ユーザは関連
フィールドが特定でない場合、次のステップに対応する
誤り時の次のステップを入力する。次にステップ631
において、表3に示されるオペレーションに対応して、
テンプレート・ステップがアセンブルされる。表3のス
テップ3は"冗長時のスキップ"処理のステップを示す。
図43のステップ631は文書ID、フィールドID、
ステップ番号、及び "冗長時のスキップ"に相当する処
理タイプをアセンブルする。またこのオペレーション
を"関連フィールドが特定の場合のチェック" としてア
センブルし、分岐値及び誤り時の次のステップを追加す
る。次に処理はステップ632に遷移し、ステップ変数
を1だけインクリメントし、試行変数を1にセットす
る。
し、ステップ変数を1だけインクリメントする。ステッ
プ625において、文字認識処理シーケンス定義が開始
される。ステップ625はステップ626に遷移し、特
定のコード化データを有する関連するフィールドが存在
すれば、ユーザがこのフィールドの処理をスキップする
ことを望むかどうかの判断が開始される。ステップ62
6はMGDSから関連するフィールド・データ77を獲
得する。次にステップ627において、このフィールド
がより高位の優先順位の関連フィールドを有すると判断
されると、プロンプト"Want to skip processing this
field if related field has codeddata which is cert
ain?"が表示される。次にステップ628はユーザが"ye
s"を入力したかを判断し、入力した場合はステップ62
9に移行する。"no"を入力した場合はステップ632に
移行する。ステップ629において、ユーザはテンプレ
ート・ステップに対応する分岐値として最大認識誤りを
入力する。次にステップ630において、ユーザは関連
フィールドが特定でない場合、次のステップに対応する
誤り時の次のステップを入力する。次にステップ631
において、表3に示されるオペレーションに対応して、
テンプレート・ステップがアセンブルされる。表3のス
テップ3は"冗長時のスキップ"処理のステップを示す。
図43のステップ631は文書ID、フィールドID、
ステップ番号、及び "冗長時のスキップ"に相当する処
理タイプをアセンブルする。またこのオペレーション
を"関連フィールドが特定の場合のチェック" としてア
センブルし、分岐値及び誤り時の次のステップを追加す
る。次に処理はステップ632に遷移し、ステップ変数
を1だけインクリメントし、試行変数を1にセットす
る。
【0225】試行変数は1にセットされ、ループがステ
ップ632で各試行に対応して開始される。ステップ6
33においてユーザはオペレーション名を入力し、ステ
ップ634において分岐値を、またステップ635にお
いて誤り時の次のステップ、及びOK時の次のステップ
結果を入力する。これは表3のステップ3に対応し、ユ
ーザはオペレーション名として"ハンドプリント認識ル
ーチン"を、最大認識拒絶誤りに対応する分岐値として
1、また最大認識懐疑文字誤りに対応して1を入力す
る。ユーザは誤り時の次のステップ値として4を、また
OK時の次のステップ値として7を入力する。
ップ632で各試行に対応して開始される。ステップ6
33においてユーザはオペレーション名を入力し、ステ
ップ634において分岐値を、またステップ635にお
いて誤り時の次のステップ、及びOK時の次のステップ
結果を入力する。これは表3のステップ3に対応し、ユ
ーザはオペレーション名として"ハンドプリント認識ル
ーチン"を、最大認識拒絶誤りに対応する分岐値として
1、また最大認識懐疑文字誤りに対応して1を入力す
る。ユーザは誤り時の次のステップ値として4を、また
OK時の次のステップ値として7を入力する。
【0226】次に処理はステップ636に遷移し、現行
のステップに対応するテンプレートをアセンブリする。
表2のステップ3を参照すると、文書ID、フィールド
ID、ステップ番号、"認識"オペレーションに相当する
処理タイプ、分岐値、及び誤り時の次のステップ値、及
びOK時の次のステップ値が表2のテンプレート33の
ステップ仕様に入力されていることが理解される。
のステップに対応するテンプレートをアセンブリする。
表2のステップ3を参照すると、文書ID、フィールド
ID、ステップ番号、"認識"オペレーションに相当する
処理タイプ、分岐値、及び誤り時の次のステップ値、及
びOK時の次のステップ値が表2のテンプレート33の
ステップ仕様に入力されていることが理解される。
【0227】次に処理はステップ637に遷移し、ステ
ップ変数を1だけインクリメントし、ユーザに"Any mor
e trials for this process type?" と促す。ユーザが"
yes"と応答すると、試行変数が1だけインクリメントさ
れ、処理はステップ632に移行する。ユーザが"no"を
示す場合は、次に処理は図44のステップ638に移行
する。
ップ変数を1だけインクリメントし、ユーザに"Any mor
e trials for this process type?" と促す。ユーザが"
yes"と応答すると、試行変数が1だけインクリメントさ
れ、処理はステップ632に移行する。ユーザが"no"を
示す場合は、次に処理は図44のステップ638に移行
する。
【0228】ステップ638において、ユーザは再ルー
ト行先に対応する誤り時の次のステップ値を入力する。
これは表2のステップ6に対応し、この場合の再ルート
行先は12と指定される。次にステップ639におい
て、テンプレートがこのステップすなわちフィールド再
ルート行先に対応してアセンブルされ、プロセス・タイ
プは"再ルート"に、試行は1に、またオペレーション
は"フィールド挿入"と示される。
ト行先に対応する誤り時の次のステップ値を入力する。
これは表2のステップ6に対応し、この場合の再ルート
行先は12と指定される。次にステップ639におい
て、テンプレートがこのステップすなわちフィールド再
ルート行先に対応してアセンブルされ、プロセス・タイ
プは"再ルート"に、試行は1に、またオペレーション
は"フィールド挿入"と示される。
【0229】図44の処理は次にステップ645に移行
し、ステップ変数を1だけインクリメントし、人工知能
処理シーケンスの定義を開始する。
し、ステップ変数を1だけインクリメントし、人工知能
処理シーケンスの定義を開始する。
【0230】ステップ645はステップ646に遷移
し、ステップ651までの一連の処理を開始し、ユーザ
が"冗長時のスキップ"機能を使用することを望んでいる
かを判断する。ステップ646乃至651は前述の図4
3のステップ626乃至631と同様にオペレートす
る。ステップ651は表3のステップ8の例に対応する
テンプレート・ステップをアセンブルし、"冗長時のス
キップ"処理タイプ・ステップが挿入される。ステップ
651は次にステップ652に移行し、ステップ変数を
1だけインクリメントし、試行変数を1にセットする。
し、ステップ651までの一連の処理を開始し、ユーザ
が"冗長時のスキップ"機能を使用することを望んでいる
かを判断する。ステップ646乃至651は前述の図4
3のステップ626乃至631と同様にオペレートす
る。ステップ651は表3のステップ8の例に対応する
テンプレート・ステップをアセンブルし、"冗長時のス
キップ"処理タイプ・ステップが挿入される。ステップ
651は次にステップ652に移行し、ステップ変数を
1だけインクリメントし、試行変数を1にセットする。
【0231】処理は次にステップ652に移行し、試行
変数を1にセットし、各試行に対応してループを開始す
る。ユーザはステップ653においてオペレーション名
を、ステップ654において分岐値を、またステップ6
55において誤り時の次のステップ及びOK時の次のス
テップ値結果を入力する。これは表2のステップ7及び
8に対応する。表2のステップ7において、オペレーシ
ョン名は "英語ファースト・ネーム語彙ルーチン" であ
る。分岐値は"最小AI確率"に対応して50パーセント
である。誤り時の次のステップ値は8、またOK時の次
のステップ値は10である。
変数を1にセットし、各試行に対応してループを開始す
る。ユーザはステップ653においてオペレーション名
を、ステップ654において分岐値を、またステップ6
55において誤り時の次のステップ及びOK時の次のス
テップ値結果を入力する。これは表2のステップ7及び
8に対応する。表2のステップ7において、オペレーシ
ョン名は "英語ファースト・ネーム語彙ルーチン" であ
る。分岐値は"最小AI確率"に対応して50パーセント
である。誤り時の次のステップ値は8、またOK時の次
のステップ値は10である。
【0232】次に処理はステップ656に移行し、オペ
レーションに対応するテンプレートをアセンブルする。
表2を参照するとステップ7は文書ID、フィールドI
D、ステップ番号、"AI"オペレーションに相当する処理
タイプ、分岐値、及び誤り時の次のステップ値、及びO
K時の次のステップ値のデータを含む。
レーションに対応するテンプレートをアセンブルする。
表2を参照するとステップ7は文書ID、フィールドI
D、ステップ番号、"AI"オペレーションに相当する処理
タイプ、分岐値、及び誤り時の次のステップ値、及びO
K時の次のステップ値のデータを含む。
【0233】次に処理はステップ657に遷移し、ステ
ップ変数を1だけインクリメントし、ユーザに"Any mor
e trials for this process type?" と促す。ユーザが"
yes"と応答すると、次に試行変数が1だけインクリメン
トされ、処理はステップ652に移行する。ユーザが"n
o"と応答すると、処理は次に図46のステップ658に
移行する。
ップ変数を1だけインクリメントし、ユーザに"Any mor
e trials for this process type?" と促す。ユーザが"
yes"と応答すると、次に試行変数が1だけインクリメン
トされ、処理はステップ652に移行する。ユーザが"n
o"と応答すると、処理は次に図46のステップ658に
移行する。
【0234】ステップ658乃至661はユーザがリン
ク化知識ベース・リストを探索する処理を挿入すること
を可能とする。ステップ658はプロンプト"Want tose
arch for linked knowledge base list?"を提供する。"
yes"の場合、次に処理はステップ659に移行し、それ
以外の場合はステップ664Aに移行する。ステップ6
59において、ユーザは分岐値を入力し、ステップ66
0でユーザは誤り時の次のステップ、及びOK時の次の
ステップ結果を入力する。ステップ661は表9のステ
ップ9に対応し、そのオペレーションが "知識ベース・
リスト探索" に相当するAI処理タイプのテンプレート
・ステップをアセンブルする。次にステップ661はス
テップ664Aに遷移し、ステップ変数を1だけインク
リメントする。
ク化知識ベース・リストを探索する処理を挿入すること
を可能とする。ステップ658はプロンプト"Want tose
arch for linked knowledge base list?"を提供する。"
yes"の場合、次に処理はステップ659に移行し、それ
以外の場合はステップ664Aに移行する。ステップ6
59において、ユーザは分岐値を入力し、ステップ66
0でユーザは誤り時の次のステップ、及びOK時の次の
ステップ結果を入力する。ステップ661は表9のステ
ップ9に対応し、そのオペレーションが "知識ベース・
リスト探索" に相当するAI処理タイプのテンプレート
・ステップをアセンブルする。次にステップ661はス
テップ664Aに遷移し、ステップ変数を1だけインク
リメントする。
【0235】ステップ664A乃至665Cはユーザに
フィールドを他の関連フィールドとクロス・チェックす
るための、クロス・チェック・ステップを追加するオプ
ションを提供する。ステップ664AはMGDSから関
連するフィールド・データ77を獲得する。ステップ6
64Bはフィールドが関連フィールドを有するかどうか
を判断し、もし有する場合には、プロンプト"Want to c
ross-check fieldwith other related fields?" を表示
する。ステップ664Cにおいて、ユーザが"yes" と応
答すると、次に処理はステップ665Aに移行し、それ
以外の場合はステップ666に移行する。ステップ66
5Aにおいてユーザは分岐値を入力し、ステップ665
Bにおいてユーザは誤り時の次のステップ値、及びOK
時の次のステップ値結果を入力する。次にステップ66
5Cはテンプレート内において、処理タイプとして"ク
ロス・チェック"、オペレーションとして "フィールド
・クロス・チェック・ルーチン" を有するテンプレート
・ステップをアセンブルする。処理665Cは次に処理
666に遷移し、ステップ変数を1だけインクリメント
する。
フィールドを他の関連フィールドとクロス・チェックす
るための、クロス・チェック・ステップを追加するオプ
ションを提供する。ステップ664AはMGDSから関
連するフィールド・データ77を獲得する。ステップ6
64Bはフィールドが関連フィールドを有するかどうか
を判断し、もし有する場合には、プロンプト"Want to c
ross-check fieldwith other related fields?" を表示
する。ステップ664Cにおいて、ユーザが"yes" と応
答すると、次に処理はステップ665Aに移行し、それ
以外の場合はステップ666に移行する。ステップ66
5Aにおいてユーザは分岐値を入力し、ステップ665
Bにおいてユーザは誤り時の次のステップ値、及びOK
時の次のステップ値結果を入力する。次にステップ66
5Cはテンプレート内において、処理タイプとして"ク
ロス・チェック"、オペレーションとして "フィールド
・クロス・チェック・ルーチン" を有するテンプレート
・ステップをアセンブルする。処理665Cは次に処理
666に遷移し、ステップ変数を1だけインクリメント
する。
【0236】ステップ666において、ユーザは再ルー
ト行先に対応する誤り時の次のステップを入力する。こ
れは表2のステップ9に対応する。次にステップ667
において、フィールド再ルート行先に対応するテンプレ
ート・ステップがアセンブルされ、これは処理タイプと
して"再ルート"、試行として1、またオペレーションと
して"フィールド挿入"を有する。
ト行先に対応する誤り時の次のステップを入力する。こ
れは表2のステップ9に対応する。次にステップ667
において、フィールド再ルート行先に対応するテンプレ
ート・ステップがアセンブルされ、これは処理タイプと
して"再ルート"、試行として1、またオペレーションと
して"フィールド挿入"を有する。
【0237】ステップ667は図47のステップ668
Aに遷移し、ステップ変数を1だけインクリメントす
る。ステップ668A乃至668Dはユーザに次に処理
するフィールドの順序を変更するオプションを提供す
る。
Aに遷移し、ステップ変数を1だけインクリメントす
る。ステップ668A乃至668Dはユーザに次に処理
するフィールドの順序を変更するオプションを提供す
る。
【0238】図47の流れ図は次に図48のステップ6
70に遷移し、ステップ変数を1だけインクリメント
し、データ・ベース誤り訂正処理シーケンスの定義を開
始する。
70に遷移し、ステップ変数を1だけインクリメント
し、データ・ベース誤り訂正処理シーケンスの定義を開
始する。
【0239】処理はステップ672に遷移し、試行変数
を1にセットし、各試行に対応してループを開始する。
ステップ673において、ユーザはオペレーション名を
入力し、ステップ674において分岐値を、またステッ
プ675において誤り時の次のステップ、及びOK時の
次のステップのデータ結果を入力する。これは表2のス
テップ10に対応し、オペレーション名として "保険顧
客名データ・ベース・ルーチン" が対応する。分岐値と
しては"最小データ・ベース確率"値が100パーセント
である。誤り時の次のステップ値入力は11であり、O
K時の次のステップ値入力は12である。
を1にセットし、各試行に対応してループを開始する。
ステップ673において、ユーザはオペレーション名を
入力し、ステップ674において分岐値を、またステッ
プ675において誤り時の次のステップ、及びOK時の
次のステップのデータ結果を入力する。これは表2のス
テップ10に対応し、オペレーション名として "保険顧
客名データ・ベース・ルーチン" が対応する。分岐値と
しては"最小データ・ベース確率"値が100パーセント
である。誤り時の次のステップ値入力は11であり、O
K時の次のステップ値入力は12である。
【0240】次に処理はステップ676に遷移し、オペ
レーションに対応するテンプレート・ステップをアセン
ブルする。表2のステップ10を参照すると、文書I
D、フィールドID、ステップ番号、"データ・ベース"
オペレーションに相当する処理タイプ、分岐値、及び誤
り時の次のステップ、及びOK時の次のステップのデー
タがテンプレート33に入力される。
レーションに対応するテンプレート・ステップをアセン
ブルする。表2のステップ10を参照すると、文書I
D、フィールドID、ステップ番号、"データ・ベース"
オペレーションに相当する処理タイプ、分岐値、及び誤
り時の次のステップ、及びOK時の次のステップのデー
タがテンプレート33に入力される。
【0241】次に処理はステップ677に遷移し、ステ
ップ変数を1だけインクリメントし、オペレータに"any
more trials for this process type?"と促す。ユーザ
が"yes" と応答すると次に試行変数が1だけインクリメ
ントされ、処理はステップ672に移行する。ユーザ
が"no"と応答すると次に処理はステップ678に移行す
る。
ップ変数を1だけインクリメントし、オペレータに"any
more trials for this process type?"と促す。ユーザ
が"yes" と応答すると次に試行変数が1だけインクリメ
ントされ、処理はステップ672に移行する。ユーザ
が"no"と応答すると次に処理はステップ678に移行す
る。
【0242】ステップ678は再ルート行先に対応する
誤り時の次のステップを入力する。これは表2のステッ
プ11に対応し、値12が誤り時の次のステップとして
入力される。次に図48の処理はステップ679に移行
し、ここでフィールド再ルート行先に対応するテンプレ
ート・ステップをアセンブルし、これは処理タイプとし
て"再ルート"、試行変数として1、またオペレーション
として "フィールド挿入"を有する。
誤り時の次のステップを入力する。これは表2のステッ
プ11に対応し、値12が誤り時の次のステップとして
入力される。次に図48の処理はステップ679に移行
し、ここでフィールド再ルート行先に対応するテンプレ
ート・ステップをアセンブルし、これは処理タイプとし
て"再ルート"、試行変数として1、またオペレーション
として "フィールド挿入"を有する。
【0243】図48の処理は次に図49に遷移し、ステ
ップ変数を1だけインクリメントし、手動検査及び訂正
処理シーケンスの定義を開始する。
ップ変数を1だけインクリメントし、手動検査及び訂正
処理シーケンスの定義を開始する。
【0244】処理は次にステップ682に遷移し、試行
変数を1にセットし、各試行に対応してループを開始す
る。ステップ683はオペレーション名を入力し、ステ
ップ684においてユーザは分岐値を入力し、ステップ
685で誤り時の次のステップ、及びOK時の次のステ
ップ結果を入力する。これは表2のステップ12に対応
し、オペレーション名は"手動検査及び訂正ルーチン"、
分岐値はブランク、また誤り時の次のステップ値、及び
OK時の次のステップ値はブランクである。
変数を1にセットし、各試行に対応してループを開始す
る。ステップ683はオペレーション名を入力し、ステ
ップ684においてユーザは分岐値を入力し、ステップ
685で誤り時の次のステップ、及びOK時の次のステ
ップ結果を入力する。これは表2のステップ12に対応
し、オペレーション名は"手動検査及び訂正ルーチン"、
分岐値はブランク、また誤り時の次のステップ値、及び
OK時の次のステップ値はブランクである。
【0245】処理は次にステップ686に遷移し、オペ
レーションに対応するテンプレート・ステップをアセン
ブルする。表2のステップ12を参照すると、文書I
D、フィールドID、ステップ番号、"手動検査"オペレ
ーションに相当する処理タイプ、分岐値、誤り時の次の
ステップ、及びOK時の次のステップのデータがテンプ
レート33に入力される。
レーションに対応するテンプレート・ステップをアセン
ブルする。表2のステップ12を参照すると、文書I
D、フィールドID、ステップ番号、"手動検査"オペレ
ーションに相当する処理タイプ、分岐値、誤り時の次の
ステップ、及びOK時の次のステップのデータがテンプ
レート33に入力される。
【0246】次に処理はステップ687に遷移し、ステ
ップ変数を1だけインクリメントし、ユーザに"Any mor
e trials for this process type?" と促す。ユーザが"
yes"と応答すると、次に試行変数が1だけインクリメン
トされ、処理はステップ682に移行する。ユーザが"n
o"と応答すると、次の処理はステップ688に移行す
る。
ップ変数を1だけインクリメントし、ユーザに"Any mor
e trials for this process type?" と促す。ユーザが"
yes"と応答すると、次に試行変数が1だけインクリメン
トされ、処理はステップ682に移行する。ユーザが"n
o"と応答すると、次の処理はステップ688に移行す
る。
【0247】ステップ688において、ユーザは再ルー
ト行先に対応する誤り時の次のステップを選択的に入力
する。ステップ689において、テンプレート・ステッ
プがフィールド再ルート行先に対応してアセンブルさ
れ、処理タイプとして "再ルート" 、試行として1、ま
たオペレーションとして"フィールド挿入"が含まれる。
表2の例ではステップ12が存在せず、ユーザはステッ
プ11に続き、再ルート行先ステップを選択しないよう
にする。
ト行先に対応する誤り時の次のステップを選択的に入力
する。ステップ689において、テンプレート・ステッ
プがフィールド再ルート行先に対応してアセンブルさ
れ、処理タイプとして "再ルート" 、試行として1、ま
たオペレーションとして"フィールド挿入"が含まれる。
表2の例ではステップ12が存在せず、ユーザはステッ
プ11に続き、再ルート行先ステップを選択しないよう
にする。
【0248】図49の処理は次にステップ690に移行
し、フィールド変数を1だけインクリメントし、ユーザ
に"Any more fields for this form?"と促す。ユーザ
が"yes" と応答すると、次に処理はステップ606に戻
り、次のフィールドに対応してループを開始する。この
例の保険申請書式では6個のフィールドが存在するた
め、このループはフィールド1から6に対応して6回実
行される。
し、フィールド変数を1だけインクリメントし、ユーザ
に"Any more fields for this form?"と促す。ユーザ
が"yes" と応答すると、次に処理はステップ606に戻
り、次のフィールドに対応してループを開始する。この
例の保険申請書式では6個のフィールドが存在するた
め、このループはフィールド1から6に対応して6回実
行される。
【0249】ステップ690において、ユーザが"no"と
応答すると、次に図49の処理はステップ692で終了
し、書式処理テンプレート33が出力される。テンプレ
ート33の形式はこれを更にコンパクトにするために、
表1乃至表6に示される形式から変更可能である。
応答すると、次に図49の処理はステップ692で終了
し、書式処理テンプレート33が出力される。テンプレ
ート33の形式はこれを更にコンパクトにするために、
表1乃至表6に示される形式から変更可能である。
【0250】書式処理テンプレート33は知能的書式プ
ロセッサ25のバッファ40内に格納される。また、こ
れは図2のバッファ・サーバ40^ に格納されてもよ
い。文書書式の選択群が処理される時、ユーザはそのフ
ィールドが特定の一様の特徴を有する入力文書書式群
を、自動的に処理するために必要と思われる個別の文字
認識処理、及び個別のコード化データ誤り訂正処理の識
別、及び好適なシーケンスを指定する処理テンプレート
33を選択する。
ロセッサ25のバッファ40内に格納される。また、こ
れは図2のバッファ・サーバ40^ に格納されてもよ
い。文書書式の選択群が処理される時、ユーザはそのフ
ィールドが特定の一様の特徴を有する入力文書書式群
を、自動的に処理するために必要と思われる個別の文字
認識処理、及び個別のコード化データ誤り訂正処理の識
別、及び好適なシーケンスを指定する処理テンプレート
33を選択する。
【0251】
【表1】
【0252】
【表2】
【0253】
【表3】
【0254】
【表4】
【0255】
【表5】
【0256】
【表6】
【0257】
【表7】
【0258】
【表8】
【0259】
【表9】
【0260】
【表10】
【0261】
【発明の効果】以上説明したように、本発明によれば文
書書式からの文字認識コード化データを自動的に誤り訂
正する改善されたデータ処理システム及び方法が提供さ
れる。
書書式からの文字認識コード化データを自動的に誤り訂
正する改善されたデータ処理システム及び方法が提供さ
れる。
【図1】本発明の全体的体系図である。
【図2】本発明の全体的体系図である。
【図3】書式認識及びフィールド抽出プロセッサ24か
ら出力される機械生成データ構造(MGDS)50Aを
表す図である。
ら出力される機械生成データ構造(MGDS)50Aを
表す図である。
【図4】文字認識プロセッサ26から出力されるMGD
S 50Bを表す図である。
S 50Bを表す図である。
【図5】人工知能誤り訂正プロセッサ28から出力され
る第1の修復セグメントR1を含むMGDS 50Cを
表す図である。
る第1の修復セグメントR1を含むMGDS 50Cを
表す図である。
【図6】データ・ベース誤り訂正プロセッサ30から出
力される第2の修復セグメントR2を含むMGDS 5
0Dを表す図である。
力される第2の修復セグメントR2を含むMGDS 5
0Dを表す図である。
【図7】手動検査及び訂正プロセッサ32から出力され
る第3の修復セグメントR3を含むMGDS 50Eを
表す図である。
る第3の修復セグメントR3を含むMGDS 50Eを
表す図である。
【図8】第3のフィールド・データ・セグメント56A
を生成した後の機械生成データ構造(MGDS)50A
を表す図である。
を生成した後の機械生成データ構造(MGDS)50A
を表す図である。
【図9】第3のフィールド・データ・セグメント56B
に対応する、文字ストリング及び誤り情報を生成した後
のMGDS 50Bを表す図である。
に対応する、文字ストリング及び誤り情報を生成した後
のMGDS 50Bを表す図である。
【図10】第3のフィールド・データ・セグメント56
Cに対応する、修復セグメントR1^ を生成した後のM
GDS 50Cを表す図である。
Cに対応する、修復セグメントR1^ を生成した後のM
GDS 50Cを表す図である。
【図11】フィールド・イメージ44^^を有する第5の
フィールド・データ・セグメントを生成した後のMGD
S 50Bを表す図である。
フィールド・データ・セグメントを生成した後のMGD
S 50Bを表す図である。
【図12】文字認識プロセッサ26が書式の全6フィー
ルドにおけるオペレーション完了後のMGDS 50B
を表す図である。
ルドにおけるオペレーション完了後のMGDS 50B
を表す図である。
【図13】人工知能誤り訂正プロセッサ28が書式の全
6フィールドにおけるオペレーション完了後のMGDS
50Cを表す図である。
6フィールドにおけるオペレーション完了後のMGDS
50Cを表す図である。
【図14】データ・ベース誤り訂正プロセッサ30が書
式の全6フィールドにおけるオペレーション完了後のM
GDS 50Dを表す図である。
式の全6フィールドにおけるオペレーション完了後のM
GDS 50Dを表す図である。
【図15】手動検査及び訂正プロセッサ32が書式の全
6フィールドにおけるオペレーション完了後のMGDS
50Eを表す図である。
6フィールドにおけるオペレーション完了後のMGDS
50Eを表す図である。
【図16】マスタ書式10Fを表す図である。
【図17】図16のマスタ書式10Fに対応するマスタ
MGDS 50Mを表す図である。
MGDS 50Mを表す図である。
【図18】文書書式の走査書式イメージ10^ を表す図
である。
である。
【図19】図18の走査書式イメージ10^ からの抽出
された、フィールド・イメージ10^^を表す図である。
された、フィールド・イメージ10^^を表す図である。
【図20】図18に示される文書書式イメージ10^内
のフィールド16^に対する処理ステップのシーケンス
を表す図である。
のフィールド16^に対する処理ステップのシーケンス
を表す図である。
【図21】書式認識処理24A及びフィールド抽出処理
24Bに対応する、オペレーション・ステップのシーケ
ンスの流れ図である。
24Bに対応する、オペレーション・ステップのシーケ
ンスの流れ図である。
【図22】書式認識処理24A及びフィールド抽出処理
24Bに対応する、オペレーション・ステップのシーケ
ンスの流れ図である。
24Bに対応する、オペレーション・ステップのシーケ
ンスの流れ図である。
【図23】文字認識処理26Aに対応するオペレーショ
ン・ステップのシーケンスの流れ図である。
ン・ステップのシーケンスの流れ図である。
【図24】文字認識処理26Aに対応するオペレーショ
ン・ステップのシーケンスの流れ図である。
ン・ステップのシーケンスの流れ図である。
【図25】文字認識処理26Aに対応するオペレーショ
ン・ステップのシーケンスの流れ図である。
ン・ステップのシーケンスの流れ図である。
【図26】人工知能誤り訂正プロセッサ28Aにおける
オペレーション・ステップのシーケンスを示す図であ
る。
オペレーション・ステップのシーケンスを示す図であ
る。
【図27】人工知能誤り訂正プロセッサ28Aにおける
オペレーション・ステップのシーケンスを示す図であ
る。
オペレーション・ステップのシーケンスを示す図であ
る。
【図28】人工知能誤り訂正プロセッサ28Aにおける
オペレーション・ステップのシーケンスを示す図であ
る。
オペレーション・ステップのシーケンスを示す図であ
る。
【図29】データ・ベース誤り訂正処理30Aに対応す
るオペレーション・ステップのシーケンスを示す図であ
る。
るオペレーション・ステップのシーケンスを示す図であ
る。
【図30】データ・ベース誤り訂正処理30Aに対応す
るオペレーション・ステップのシーケンスを示す図であ
る。
るオペレーション・ステップのシーケンスを示す図であ
る。
【図31】手動確認及び訂正処理32Aに対応するオペ
レーション・ステップのシーケンスを示す図である。
レーション・ステップのシーケンスを示す図である。
【図32】手動確認及び訂正処理32Aに対応するオペ
レーション・ステップのシーケンスを示す図である。
レーション・ステップのシーケンスを示す図である。
【図33】知能的書式プロセッサ25の詳細体系図を表
す図である。
す図である。
【図34】手動確認及び訂正プロセッサ32の詳細体系
図を表す図である。
図を表す図である。
【図35】データ・ベース誤り訂正プロセッサ30の詳
細体系図を表す図である。
細体系図を表す図である。
【図36】機械生成データ構造(MGDS)パラメータ
間の関係を表す図である。
間の関係を表す図である。
【図37】MGDSの書式情報部分(FI)を表す図で
ある。
ある。
【図38】MGDSのページ情報部分(PI)を表す図
である。
である。
【図39】MGDSのフィールド情報形式54Aを表す
図である。
図である。
【図40】MGDSのコード化データ情報部分75を表
す図である。
す図である。
【図41】MGDSの拒絶情報部分S或いはRを表す図
である。
である。
【図42】書式処理テンプレートを生成するための定義
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
【図43】書式処理テンプレートを生成するための定義
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
【図44】書式処理テンプレートを生成するための定義
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
【図45】書式処理テンプレートを生成するための定義
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
【図46】書式処理テンプレートを生成するための定義
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
【図47】書式処理テンプレートを生成するための定義
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
【図48】書式処理テンプレートを生成するための定義
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
【図49】書式処理テンプレートを生成するための定義
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
処理57Aのオペレーション・ステップのシーケンスの
流れ図である。
【図50】人工知能訂正処理28Bのオペレーション・
ステップのシーケンスを表す図である。
ステップのシーケンスを表す図である。
【図51】人工知能訂正処理28Bのオペレーション・
ステップのシーケンスを表す図である。
ステップのシーケンスを表す図である。
【図52】サンプル処理テンプレート33の構造を表す
図である。
図である。
【図53】図1及び図2の結合状態を示す図である。
20 ローカル・エリア・ネットワーク(LAN) 24 書式確認及び訂正プロセッサ 25 知能的書式プロセッサ 26 文字確認プロセッサ 28 人工知能誤り訂正プロセッサ 30 データ・ベース誤り訂正プロセッサ 32 手動検査及び訂正プロセッサ 36 文書イメージ記憶装置 37 データ修復部分 38 修復履歴記憶装置 34 ホスト・コンピュータ 42 コード化データ 48 クラスタ・データ及び/或いは代替選択 57 書式処理テンプレート定義プロセッサ 58 強調表示領域 60 文書イメージ・ファイル・ポインタ 62 スキュー及びオフセット値 64 フィールド座標 65 固定書式データ 66 書式名 67 固定フィールド・データ 68 フィールド名 70 フィールド・タイプ 72 書式返却フィールド(FR) 76 MGDS部分 77 関連するフィールド・データ 80 フィールド処理定義部分
───────────────────────────────────────────────────── フロントページの続き (72)発明者 バレリー・エム・キャラス アメリカ合衆国20895、メリーランド州ケ ンシントン、ナンバー310、ユニバーシテ ィ・ブールバード 3333 (72)発明者 ルイス・ビー・ネフト アメリカ合衆国20832、メリーランド州オ ルニー、ジョン・キャロル・ドライブ 3801
Claims (15)
- 【請求項1】データ処理システムにおける文書書式のデ
ジタル・イメージの文字認識誤りを修復するためのデー
タ処理方法であって、 第1の複数の文字認識処理に対応する第1のシーケンス
仕様、及び第2の複数のコード化データ修復処理に対応
する第2のシーケンス仕様を含む文書書式処理テンプレ
ートを入力し、 文書書式のデジタル文書イメージを入力し、前記文書イ
メージからフィールド・イメージを抽出し、対応する抽
出フィールド・イメージを形成し、 前記テンプレート内に指定される前記第1の複数の文字
認識処理からある文字認識処理を選択し、前記抽出フィ
ールド・イメージから認識コード化データを生成し、前
記選択文字認識処理を使用することにより、認識誤りデ
ータを生成し、 前記テンプレート内に指定される前記第2の複数のコー
ド化データ修復処理からあるコード化データ修復処理を
選択し、前記認識コード化データ及び前記認識誤りデー
タに作用し、前記選択コード化データ修復処理を使用す
ることにより修復コード化データを生成する、 ことを特徴とするデータ処理方法。 - 【請求項2】前記書式処理テンプレートは前記文書書式
上の第1のフィールドの第1の文字認識処理に対応する
第1の処理ステップ定義、及び第2のフィールドの第2
の文字認識処理に対応する第2の処理ステップ定義を含
み、 前記書式処理テンプレートは前記第2のフィールドが前
記第1のフィールドに関連するか、及び前記第2のフィ
ールドの文字認識が省略されるべきかを判断する第3の
処理ステップ定義を含み、 前記第3のよりステップ定義に応答して、前記第2のフ
ィールドの文字認識処理を省略する、 ことを特徴とする請求項1記載のデータ処理方法。 - 【請求項3】前記書式処理テンプレートは前記文書書式
上の第1のフィールドの第1の文字認識処理に対応する
第1の処理ステップ定義、及び第2のフィールドの第2
の文字認識処理に対応する第2の処理ステップ定義を含
み、 前記書式処理テンプレートは前記第2のフィールドが前
記第1のフィールドに関連するか、及び前記第2のフィ
ールドの文字認識が省略されるべきかを判断する第3の
処理ステップ定義を含み、 前記第1のフィールドの前記第1の文字認識処理を実行
し、第1の認識コード化データを生成し、 前記第1の認識コード化データが第1の確率値を有する
ことを判断し、 前記第3の処理ステップ定義、及び前記第1の確率値に
応答して、前記第2のフィールドの文字認識処理を省略
する、 ことを特徴とする請求項1記載のデータ処理方法。 - 【請求項4】前記書式処理テンプレートは前記文書書式
上の第1のフィールドの第1のコード化データ修復処理
に対応する第1の処理ステップ定義、及び第2のフィー
ルドの第2のコード化データ修復処理に対応する第2の
処理ステップ定義を含み、 前記書式処理テンプレートは前記第2のフィールドが前
記第1のフィールドに関連するか、及び前記第2のフィ
ールドのコード化データの修復が省略されるべきかを判
断する第3の処理ステップ定義を含み、 前記第3の処理ステップ定義に応答して、前記第2のフ
ィールドのコード化データ修復処理を省略する、 ことを特徴とする請求項1記載のデータ処理方法。 - 【請求項5】前記書式処理テンプレートは前記文書書式
上の第1のフィールドの第1のコード化データ修復処理
に対応する第1の処理ステップ定義、及び第2のフィー
ルドの第2のコード化データ修復処理に対応する第2の
処理ステップ定義を含み、 前記書式処理テンプレートは前記第2のフィールドが前
記第1のフィールドに関連するか、及び前記第2のフィ
ールドのコード化データの修復が省略されるべきかを判
断する第3の処理ステップ定義を含み、 前記第1のフィールドの第1のコード化データ修復処理
を実行し、第1の修復コード化データを生成し、 前記第1の修復コード化データが第1の確率値を有する
ことを判断し、 前記第3の処理ステップ定義、及び前記第1の確率値に
応答して、前記第2のフィールドのコード化データ修復
処理を省略する、 ことを特徴とする請求項1記載のデータ処理方法。 - 【請求項6】前記書式処理テンプレートは前記選択文字
認識処理に関連するコード化データ修復処理を探索する
ための第1の処理ステップ定義を含み、 コード化データ修復処理を選択する前記ステップは、前
記第1の処理ステップ定義を読出し、それに応答して前
記選択コード化データ修復処理が前記選択文字認識処理
に関連すると識別し、前記認識コード化データに対し作
用する前記ステップを前記選択コード化データ修復処理
と共に実行する、 ことを特徴とする請求項1記載のデータ処理方法。 - 【請求項7】前記書式処理テンプレートは前記文書書式
上の第1のフィールドの第1のコード化データ修復処理
に対応する第1の処理ステップ定義、及び第2のフィー
ルドの第2のコード化データ修復処理に対応する第2の
処理ステップ定義を含み、 前記書式処理テンプレートは前記第2のフィールドが前
記第1のフィールドに関連するか、及び前記第1のフィ
ールドの修復コード化データが前記第2のフィールドの
修復コード化データとクロス・チェックされるべきかを
判断する第3の処理ステップ定義を含み、 前記第3の処理ステップ定義に応答して、前記第1のフ
ィールドの修復コード化データを、前記第2のフィール
ドの修復コード化データとクロス・チェックする、 ことを特徴とする請求項1記載のデータ処理方法。 - 【請求項8】前記書式処理テンプレートは前記第2のシ
ーケンス仕様における第1のコード化データ修復処理に
対応する第1の処理ステップ定義、及び前記第2のシー
ケンス仕様における第2のコード化データ修復処理に対
応する第2の処理ステップ定義を含み、 前記書式処理テンプレートは前記第1のコード化データ
修復処理及び前記第2のコード化データ修復処理の実行
順序を選択的に変更するための第3の処理ステップ定義
を含み、 前記第3の処理ステップ定義に応答して、前記第1のコ
ード化データ修復処理及び前記第2のコード化データ修
復処理の実行順序を変更する、 ことを特徴とする請求項1記載のデータ処理方法。 - 【請求項9】前記書式処理テンプレートの前記第1のシ
ーケンス仕様は、前記文書書式上の第1のフィールドの
第1の文字認識処理に対応する第1の処理ステップ定
義、及び第2のフィールドの第2の文字認識処理に対応
する第2の処理ステップ定義を含み、 前記書式処理テンプレートは前記第1のフィールド上に
おける前記第1の文字認識処理、及び前記第2のフィー
ルド上における前記第2の文字認識処理の実行順序を選
択的に変更するための第3の処理ステップ定義を含み、 前記第3の処理ステップ定義に応答して、前記第1のフ
ィールド上における前記第1の文字認識処理、及び前記
第2のフィールド上における前記第2の文字認識処理の
実行順序を未決にする、 ことを特徴とする請求項1記載のデータ処理方法。 - 【請求項10】データ処理システムにおいて、文書イメ
ージを訂正コード化データに変換するための処理シーケ
ンスを定義する文書書式テンプレートをアセンブルする
データ処理方法であって、 文書書式上の複数のフィールドを指定する文書書式デー
タを入力し、 前記文書書式データを使用することにより第1の文字認
識処理シーケンスを定義し、前記複数のフィールドの第
1のフィールドに対応する第1の認識コード化データを
生成する第1の複数の文字認識処理を指定し、 前記文書書式データを使用することにより第1のコード
化データ修復処理シーケンスを定義し、第2の複数のコ
ード化データ修復処理を指定し、前記第1のフィールド
に対応する前記第1の認識コード化データの文字認識誤
りを修復し、前記第1のフィールドに対応する第1の訂
正コード化データを生成する、 ことを特徴とするデータ処理方法。 - 【請求項11】前記文書書式データを使用することによ
り第2の文字認識処理シーケンスを定義し、前記複数の
フィールドの第2のフィールドに対応する第2の認識コ
ード化データを生成するための第3の複数の文字認識処
理を指定し、 前記文書書式データを使用することにより第2のコード
化データ修復処理シーケンスを定義し、第4の複数のコ
ード化データ修復処理を指定し、前記第2のフィールド
に対応する前記第2の認識コード化データの文字認識誤
りを修復し、前記第2のフィールドに対応する第2の訂
正コード化データを生成し、 前記第2の文字認識処理シーケンスは、前記第2のフィ
ールドが前記第1のフィールドに関連するか、及び前記
第2のフィールドの文字認識が省略されるべきであるか
を判断する処理ステップ定義を、 含むことを特徴とする請求項10記載のデータ処理方
法。 - 【請求項12】前記文書書式データを使用することによ
り第2の文字認識処理シーケンスを定義し、前記複数の
フィールドの第2のフィールドに対応する第2の認識コ
ード化データを生成するための第3の複数の文字認識処
理を指定し、 前記文書書式データを使用することにより第2のコード
化データ修復処理シーケンスを定義し、第4の複数のコ
ード化データ修復処理を指定し、前記第2のフィールド
に対応する前記第2の認識コード化データの文字認識誤
りを修復し、前記第2のフィールドに対応する第2の訂
正コード化データを生成し、 前記第2のコード化データ修復処理シーケンスは、前記
第2のフィールドが前記第1のフィールドに関連する
か、及び前記第2のフィールドのコード化データが省略
されるべきであるかを判断する処理ステップ定義を、 含むことを特徴とする請求項10記載のデータ処理方
法。 - 【請求項13】前記文書書式データを使用することによ
り第2の文字認識処理シーケンスを定義し、前記複数の
フィールドの第2のフィールドに対応する第2の認識コ
ード化データを生成するための第3の複数の文字認識処
理を指定し、 前記文書書式データを使用することにより第2のコード
化データ修復処理シーケンスを定義し、第4の複数のコ
ード化データ修復処理を指定し、前記第2のフィールド
に対応する前記第2の認識コード化データの文字認識誤
りを修復し、前記第2のフィールドに対応する第2の訂
正コード化データを生成し、 前記第2のコード化データ修復処理シーケンスは、前記
第2のフィールドが前記第1のフィールドに関連する
か、及び前記第1のフィールドの修復コード化データが
前記第2のフィールドの修復コード化データとクロス・
チェックされるべきであるかを判断する処理ステップ定
義を、 含むことを特徴とする請求項10記載のデータ処理方
法。 - 【請求項14】文書書式のデジタル・イメージにおける
文字認識誤りを修復するためのデータ処理システムであ
って、 第1の複数の文字認識処理に対応する第1のシーケンス
仕様、及び第2の複数のコード化データ修復処理に対応
する第2のシーケンス仕様を含む文書書式処理テンプレ
ートを入力する第1の入力手段と、 文書書式のデジタル文書イメージを入力し、前記文書イ
メージからフィールド・イメージを抽出し、対応する抽
出フィールド・イメージを形成する第2の入力手段と、 前記テンプレート内に指定される前記第1の複数の文字
認識処理から文字認識処理を選択する、前記第1の入力
手段に結合される選択手段と、 前記抽出フィールド・イメージから認識コード化データ
を生成し、前記選択文字認識処理を使用することにより
認識誤りデータを生成する、前記選択手段及び前記第2
の入力手段に結合される認識手段と、 前記テンプレート内に指定される前記第2の複数のコー
ド化データ修復処理からコード化データ修復処理を選択
する前記選択手段と、 前記認識コード化データ及び前記認識誤りデータに作用
し、前記選択コード化データ修復処理を使用することに
より修復コード化データを生成する、選択手段及び前記
認識手段に結合される修復手段と、 を備えることを特徴とするデータ処理システム。 - 【請求項15】文書イメージを訂正コード化データに変
換するための処理シーケンスを定義する文書書式テンプ
レートをアセンブルするデータ処理システムであって、 文書書式上の複数のフィールドを指定する文書書式デー
タを入力する入力手段と、 前記入力手段に結合され、前記文書書式データを使用す
ることにより第1の文字認識処理シーケンスを定義し、
前記複数のフィールドの第1のフィールドに対応する第
1の認識コード化データを生成する第1の複数の文字認
識処理を指定するプロセッサ手段とを備え、 前記プロセッサ手段は前記文書書式データを使用するこ
とにより、第1のコード化データ修復処理シーケンスを
定義し、第2の複数のコード化データ修復処理を指定
し、前記第1のフィールドに対応する前記第1の認識コ
ード化データの文字認識誤りを修復し、前記第1のフィ
ールドに対応する第1の訂正コード化データを生成し、 前記プロセッサ手段は前記文書書式データを使用するこ
とにより、第2の文字認識処理シーケンスを定義し、前
記複数のフィールドの第2のフィールドに対応する第2
の認識コード化データを生成するための、第3の複数の
文字認識処理を指定し、 前記プロセッサ手段は前記文書書式データを使用するこ
とにより、第2のコード化データ修復処理シーケンスを
定義し、第4の複数のコード化データ修復処理を指定
し、前記第2のフィールドに対応する前記第2の認識コ
ード化データの文字認識誤りを修復し、前記第2のフィ
ールドに対応する第2の訂正コード化データを生成し、 前記第2の文字認識処理シーケンスは、前記第2のフィ
ールドが前記第1のフィールドに関連するか、及び前記
第2のフィールドの文字認識が省略されるべきであるか
を判断する処理ステップ定義を、 含むことを特徴とするデータ処理システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/870,507 US5305396A (en) | 1992-04-17 | 1992-04-17 | Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms |
US870507 | 1992-04-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0668298A true JPH0668298A (ja) | 1994-03-11 |
Family
ID=25355532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5080398A Pending JPH0668298A (ja) | 1992-04-17 | 1993-04-07 | 文書書式の文字認識及びデータ修復処理のためのデータ処理システム及び方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5305396A (ja) |
EP (1) | EP0565912A3 (ja) |
JP (1) | JPH0668298A (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5555325A (en) * | 1993-10-22 | 1996-09-10 | Lockheed Martin Federal Systems, Inc. | Data capture variable priority method and system for managing varying processing capacities |
EP0667594A3 (en) * | 1994-02-14 | 1995-08-23 | International Business Machines Corporation | Image quality analysis method and apparatus |
US5748780A (en) * | 1994-04-07 | 1998-05-05 | Stolfo; Salvatore J. | Method and apparatus for imaging, image processing and data compression |
JP3492068B2 (ja) * | 1995-02-16 | 2004-02-03 | キヤノン株式会社 | 印刷制御方法及びその装置 |
US5729741A (en) * | 1995-04-10 | 1998-03-17 | Golden Enterprises, Inc. | System for storage and retrieval of diverse types of information obtained from different media sources which includes video, audio, and text transcriptions |
US5923792A (en) * | 1996-02-07 | 1999-07-13 | Industrial Technology Research Institute | Screen display methods for computer-aided data entry |
US5771395A (en) * | 1996-04-22 | 1998-06-23 | Lockheed Martin Corporation | System for processing information from scanned documents using event driven interface with patterns loaded in RAM and with address generator for addressing bit patterns |
US6028970A (en) * | 1997-10-14 | 2000-02-22 | At&T Corp | Method and apparatus for enhancing optical character recognition |
JPH11143986A (ja) * | 1997-10-17 | 1999-05-28 | Internatl Business Mach Corp <Ibm> | ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体 |
JPH11328304A (ja) * | 1998-05-13 | 1999-11-30 | Oki Electric Ind Co Ltd | 文字読取システム |
JP4073120B2 (ja) * | 1999-06-03 | 2008-04-09 | 富士通株式会社 | 情報処理装置 |
AU764649B2 (en) * | 1999-10-25 | 2003-08-28 | Silverbrook Research Pty Ltd | Method and system for providing insurance services |
US6968308B1 (en) | 1999-11-17 | 2005-11-22 | Microsoft Corporation | Method for segmenting non-segmented text using syntactic parse |
US6731802B1 (en) * | 2000-01-14 | 2004-05-04 | Microsoft Corporation | Lattice and method for identifying and normalizing orthographic variations in Japanese text |
DE50009493D1 (de) * | 2000-10-26 | 2005-03-17 | Mathias Wettstein | Verfahren zur Erfassung des vollständigen Datensatzes mit Schriftzeichen versehener Formulare |
US20020180736A1 (en) * | 2001-05-31 | 2002-12-05 | Millmore Martin John | Data entry control system |
US7013045B2 (en) * | 2001-07-24 | 2006-03-14 | International Business Machines Corporation | Using multiple documents to improve OCR accuracy |
RU2251738C2 (ru) * | 2003-01-28 | 2005-05-10 | "Аби Софтвер Лтд." | Способ приведения в соответствие заполненной машиночитаемой формы и ее шаблона при наличии искажений (варианты) |
RU2003108433A (ru) * | 2003-03-28 | 2004-09-27 | Аби Софтвер Лтд. (Cy) | Способ предварительной обработки изображения машиночитаемой формы |
US20110188759A1 (en) * | 2003-06-26 | 2011-08-04 | Irina Filimonova | Method and System of Pre-Analysis and Automated Classification of Documents |
WO2004095195A2 (en) * | 2003-04-21 | 2004-11-04 | Document Images, Llc | System and method for managing imaged freight documents |
US20070055670A1 (en) * | 2005-09-02 | 2007-03-08 | Maycotte Higinio O | System and method of extracting knowledge from documents |
US20070055653A1 (en) * | 2005-09-02 | 2007-03-08 | Guerra Currie Anne-Marie P | System and method of generating automated document analysis tools |
US20070055696A1 (en) * | 2005-09-02 | 2007-03-08 | Currie Anne-Marie P G | System and method of extracting and managing knowledge from medical documents |
US7711191B2 (en) * | 2006-12-21 | 2010-05-04 | Michael John Kosek | Electronic transaction processing server with automated transaction evaluation |
US20090097769A1 (en) * | 2007-10-16 | 2009-04-16 | Sytech Solutions, Inc. | Systems and methods for securely processing form data |
US8788930B2 (en) * | 2012-03-07 | 2014-07-22 | Ricoh Co., Ltd. | Automatic identification of fields and labels in forms |
WO2014153156A1 (en) * | 2013-03-14 | 2014-09-25 | Craven Jason | System and method for converting paper forms to an electronic format |
US10049096B2 (en) | 2015-06-19 | 2018-08-14 | Infosys Limited | System and method of template creation for a data extraction tool |
US10192127B1 (en) | 2017-07-24 | 2019-01-29 | Bank Of America Corporation | System for dynamic optical character recognition tuning |
US10346702B2 (en) | 2017-07-24 | 2019-07-09 | Bank Of America Corporation | Image data capture and conversion |
JP7298330B2 (ja) * | 2019-06-24 | 2023-06-27 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
CN118823809A (zh) * | 2023-04-21 | 2024-10-22 | 荣耀终端有限公司 | 一种表格提取方法、电子设备及介质 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3113555A1 (de) * | 1981-04-03 | 1982-10-21 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen |
JPS5887652A (ja) * | 1981-11-19 | 1983-05-25 | Ricoh Co Ltd | 画像処理装置 |
US4741045A (en) * | 1983-09-23 | 1988-04-26 | Dest Corporation | Optical character isolation system, apparatus and method |
US4589142A (en) * | 1983-12-28 | 1986-05-13 | International Business Machines Corp. (Ibm) | Method and apparatus for character recognition based upon the frequency of occurrence of said characters |
JPH07107694B2 (ja) * | 1984-08-31 | 1995-11-15 | 株式会社日立製作所 | 文書処理装置 |
JPH0750483B2 (ja) * | 1985-05-22 | 1995-05-31 | 株式会社日立製作所 | 文書画像追加情報の蓄積方法 |
US4616854A (en) * | 1985-07-16 | 1986-10-14 | Landrum Van O | Insurance form indicia system |
JPS6274181A (ja) * | 1985-09-27 | 1987-04-04 | Sony Corp | 文字認識装置 |
US4813077A (en) * | 1986-07-30 | 1989-03-14 | Scan-Optics, Inc. | Sales transaction record processing system and method |
US5050218A (en) * | 1986-08-26 | 1991-09-17 | Nec Corporation | Apparatus for recognizing address appearing on mail article |
JPS63155386A (ja) * | 1986-12-19 | 1988-06-28 | Ricoh Co Ltd | 帳票デ−タ読取装置 |
JPH01155484A (ja) * | 1987-12-11 | 1989-06-19 | Toshiba Corp | 文字読取装置 |
EP0325233B1 (en) * | 1988-01-18 | 1994-07-27 | Kabushiki Kaisha Toshiba | Character string recognition system |
US4876731A (en) * | 1988-02-19 | 1989-10-24 | Nynex Corporation | Neural network model in pattern recognition using probabilistic contextual information |
US4949392A (en) * | 1988-05-20 | 1990-08-14 | Eastman Kodak Company | Document recognition and automatic indexing for optical character recognition |
US5010580A (en) * | 1989-08-25 | 1991-04-23 | Hewlett-Packard Company | Method and apparatus for extracting information from forms |
JP2713622B2 (ja) * | 1989-11-20 | 1998-02-16 | 富士通株式会社 | 表形式文書読取装置 |
-
1992
- 1992-04-17 US US07/870,507 patent/US5305396A/en not_active Expired - Fee Related
-
1993
- 1993-03-23 EP EP9393104767A patent/EP0565912A3/en not_active Withdrawn
- 1993-04-07 JP JP5080398A patent/JPH0668298A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US5305396A (en) | 1994-04-19 |
EP0565912A2 (en) | 1993-10-20 |
EP0565912A3 (en) | 1994-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0668298A (ja) | 文書書式の文字認識及びデータ修復処理のためのデータ処理システム及び方法 | |
US5251273A (en) | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms | |
US5159667A (en) | Document identification by characteristics matching | |
US5235654A (en) | Advanced data capture architecture data processing system and method for scanned images of document forms | |
US6466694B2 (en) | Document image processing device and method thereof | |
US6501864B1 (en) | Data medium handling apparatus and data medium handling method | |
US8270721B2 (en) | Method and system for acquiring data from machine-readable documents | |
US6310971B1 (en) | Information processing method and apparatus, and storage medium storing medium storing program for practicing this method | |
US5416849A (en) | Data processing system and method for field extraction of scanned images of document forms | |
US5359673A (en) | Method and apparatus for converting bitmap image documents to editable coded data using a standard notation to record document recognition ambiguities | |
US7668372B2 (en) | Method and system for collecting data from a plurality of machine readable documents | |
WO2006002009A2 (en) | Document management system with enhanced intelligent document recognition capabilities | |
US5905811A (en) | System for indexing document images | |
JP3394694B2 (ja) | フォーマット情報登録方法及びocrシステム | |
JP2568180B2 (ja) | 画像処理方法 | |
JPH0696288A (ja) | 文字認識装置及び機械翻訳装置 | |
JPH113401A (ja) | 情報処理装置及びその方法 | |
JPH1063813A (ja) | イメージ文書管理方法及びその装置 | |
JPH08115330A (ja) | 類似文書検索方法および装置 | |
JPH04302070A (ja) | 文字認識装置及び方法 | |
JP2829186B2 (ja) | 光学的文字読取装置 | |
JPH0749924A (ja) | 手書き文字認識装置 | |
JP2990734B2 (ja) | 文字認識装置の認識候補文字出力制御方法 | |
JP2874815B2 (ja) | 日本語文字読取装置 | |
JPH0863487A (ja) | 文書検索方法及び文書検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment |
Free format text: PAYMENT UNTIL: 20080214 Year of fee payment: 5 |
|
FPAY | Renewal fee payment |
Free format text: PAYMENT UNTIL: 20090214 Year of fee payment: 6 |
|
FPAY | Renewal fee payment |
Year of fee payment: 7 Free format text: PAYMENT UNTIL: 20100214 |
|
LAPS | Cancellation because of no payment of annual fees |