JPH06348900A - 文字認識方法及び装置 - Google Patents

文字認識方法及び装置

Info

Publication number
JPH06348900A
JPH06348900A JP6078561A JP7856194A JPH06348900A JP H06348900 A JPH06348900 A JP H06348900A JP 6078561 A JP6078561 A JP 6078561A JP 7856194 A JP7856194 A JP 7856194A JP H06348900 A JPH06348900 A JP H06348900A
Authority
JP
Japan
Prior art keywords
character
character recognition
recognition means
data processing
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6078561A
Other languages
English (en)
Other versions
JP2637915B2 (ja
Inventor
Martin P T Bradley
マーティン・ピー・ティー・ブラッドリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH06348900A publication Critical patent/JPH06348900A/ja
Application granted granted Critical
Publication of JP2637915B2 publication Critical patent/JP2637915B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 複数の文字認識プログラムのうちで、文書フ
ォームの画像のフィールド内の文字を認識する際の精度
を最適化するのに使用すべきものを選択するためのデー
タ処理システムおよび方法を提供すること。 【構成】 特定の文字の文字形状とフィールド・タイプ
を考慮に入れ、適用できる複数の候補文字認識プログラ
ムのうちから、リアルタイム・ベースで最適選択を行
う。その結果得られる文字認識動作は、事前に印刷され
たフォーム内のさまざまな文字形状とフィールド・タイ
プの読取に関するその精度が最大になる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、全般的にデータ処理シ
ステムに関し、より具体的にはテキストの画像の文字認
識に関する。
【0002】
【従来の技術】本特許出願は、インターナショナル・ビ
ジネス・マシーンズ・コーポレイション(IBM)に譲
渡され、参照によって本明細書に組み込まれる同時係属
の米国特許出願第07/870129号明細書に関連す
る。
【0003】本特許出願は、IBMに譲渡され、参照に
よって本明細書に組み込まれる同時係属の米国特許出願
第07/870507号明細書に関連する。
【0004】本特許出願は、IBMに譲渡され、参照に
よって本明細書に組み込まれる同時係属の米国特許出願
第07/305828号明細書に関連する。
【0005】テキストの画像の文字認識は、データ処理
の分野で費用をかけて開発されてきた技術である。英数
字テキストを受け取り、英数字コード化データ文字の列
に変換する、文字認識コンピュータ・プログラムと文字
認識装置が多数市販されている。市販の文字認識製品は
それぞれ、通常は、その製造者によって、ある分野に特
に強みを持つと特徴付けられる。文字認識プログラムに
は、衝撃式印刷の画像をコード化データ文字列に変換す
るには優れているが、ドット・マトリックス文字の変換
はうまくいかないものがある。また、長方形の箱形の輪
郭内に制約された手書き文字または制約なしの手書き文
字を変換するように設計されており、他の種類の文字形
状ではうまくいかないものもある。衝撃式印刷、ドット
・マトリックス印刷、制約付き手書き、制約なし手書き
などの文字形状の範疇は、文字形状のバリエーションと
考えられる。文字認識プログラムによって精度に差が出
るテキストのバリエーションのもう1つの範疇が、フィ
ールド・タイプという範疇である。フィールド・タイプ
とは、たとえば、数字だけのフィールド、すべて大文字
の英字だけのフィールド、または小文字の英字だけのフ
ィールドであり、さらに別のタイプとして、いくつかの
大文字と幾つかの小文字からなる混合英字フィールドな
どがある。文字認識プログラムによっては、英字フィー
ルドまたは混合フィールドの文字の変換よりも、数字フ
ィールドの正確な変換にはるかに強いものがある。広範
囲の文字形状およびフィールド・タイプに対して文字認
識プログラムが良好に動作する能力が限られている理由
は、文字認識プログラムが、通常は、パターン認識、ニ
ューラル・ネット、文字特徴、または他の文字認識アル
ゴリズムなど、単一のまたは限られた数の文字認識アル
ゴリズムに基づいていることである。
【0006】既存の文字認識プログラムが有用となる文
字形状およびフィールド・タイプの種類がこのように制
限されていることが、さまざまなテキスト形状を分析し
なければならない時に問題となる。単一の文字認識製品
の弱点を克服して、広範囲の文字形状およびフィールド
・タイプを分析しなければならないシステムの全体的性
能を強化する方法が必要である。
【0007】
【発明が解決しようとする課題】本発明の目的は、広範
囲の文字形状およびフィールド・タイプを有するテキス
トを正確に文字認識するための改善された方法を提供す
ることである。
【0008】本発明のもう1つの目的は、単一の文字認
識プログラム製品の弱点を克服して、広範囲の文字形状
およびフィールド・タイプから文字を認識しなければな
らないシステムの性能を改善することである。
【0009】
【課題を解決するための手段】上記その他の目的、特徴
および長所は、適応確率重み付けによって文字認識精度
を改善するシステムおよび方法によって達成される。ス
キャナなどの文書画像入力装置、フォーム認識プログラ
ム、フィールド抽出プログラムおよび複数の文字認識プ
ログラムを含む、データ処理システムおよびデータ処理
方法を開示する。本発明は、文書フォームの画像の1フ
ィールド内の文字に対して複数の文字認識プログラムの
うちのどれを使用するかを選択するためのシステムおよ
び方法である。
【0010】各文字認識プログラムはそれぞれ、衝撃式
印刷、ドット・マトリックス印刷、制約付き手書き、制
約なし手書きなどの文字形状を認識する上で、特定の強
味と弱味を有する。これらの強味と弱味の特徴を、複数
の文字認識プログラムのそれぞれについて、データ処理
システムに入力される文字形状信頼係数のテーブルで表
現する。
【0011】同様に、各文字認識プログラムはそれぞ
れ、数字、英字(大文字だけ、小文字だけまたは混
合)、英数字混合などのフィールド・タイプを認識する
上で、特定の強味と弱味を有する。これらの強味と弱味
の特徴を、複数の文字認識プログラムのそれぞれについ
て、データ処理システムに入力されるフィールド・タイ
プ信頼係数のテーブルで表現する。
【0012】特定の文字認識プログラムの強味と弱味の
元来の評価が正確でない可能性があるので、本発明で
は、複数の文字認識プログラムのそれぞれに適応確率重
み付け係数を使用することによって、これらの強味の指
定値を修正する方法を提供する。適応確率重み付け係数
を用いると、複数の文字認識プログラムを文字形状とフ
ィールド・タイプの特定の組み合わせに適用する時に、
最適の文字認識プログラムをより正確に選択できるよう
になる。この組み合わせは、フォーム上のフィールドご
とに変化する可能性があるので、本発明では、1つのフ
ォーム上で連続するフィールドを分析する際に、異なる
適応確率重み付け係数を迅速に適用する。
【0013】各文字認識プログラムはそれぞれ、データ
処理システム内で、第1推測文字と第1信頼値ならびに
第2推測文字と第2信頼値を生成する。
【0014】その後、データ処理システムは、文字形状
信頼係数とフィールド・タイプ信頼係数と適応確率重み
付け係数の積に、第1信頼値と第2信頼値の差をかけた
値として、OCRエンジン選択信頼係数を計算する。こ
れは、分析中の特定のフィールドについて考慮しなが
ら、各文字認識プログラムごとに行われる。
【0015】その後、データ処理システムは、複数の文
字認識プログラムのうちで、最大のOCRエンジン選択
信頼係数を有するものを選択する。その後、そのフィー
ルド内の文字の最適の推測を選択し、認識結果データ・
パケットにそれを挿入して、分析されるフィールドの画
像内での情報のコード化データ表現として使用する。
【0016】データ処理システムは、認識結果データ・
パケットをサンプリングする監視訂正ステーションも含
む。これは、パケットからのコード化データと書き込ま
れたフォームの原画像の両方を見ている操作員によっ
て、手動ステーションで行うことができる。その代わり
に、郵便番号簿で相互検査できる州名と郵便番号の組み
合わせなど、特定のタイプのフィールドには、自動エラ
ー検出プログラムでこれを行うこともできる。エラーが
識別されると、そのエラーを生じた文字認識プログラム
の識別が記録され、文字形状とフィールド・タイプのそ
の特定の組み合わせに関して、エラーを生じた文字認識
プログラムの移動カウントが維持される。このエラー・
カウントは、エラー・カウント・テーブルに保存され
る。
【0017】たとえば、ある日の最後に、データ処理シ
ステムは、エラー・カウントから導出された値を用いて
既存の適応確率重み付け係数を修正することによって、
複数の文字認識プログラムのそれぞれの適応確率重み付
け係数の新しい値を計算し、これによって適応確率重み
付け係数を更新する。これは、文字形状とフィールド・
タイプの組合せごとに行われる。
【0018】このようにして、本発明は、複数の文字認
識プログラムのそれぞれの適応確率重み付け係数を使用
することにより、それぞれの文字認識プログラムの強味
の推定値を修正する方法を提供する。
【0019】
【実施例】図1は、図4の認識ステーション・プロセッ
サ300によって実行される動作ステップのシーケンス
の全般的な流れ図であり、図2および図3は、その詳細
な流れ図である。認識ステーション・プロセッサ300
は、図5に示すようにローカル・エリア・ネットワーク
(LAN)400に接続され、文書の走査によって生成
された文書画像から、認識結果データ・パケット260
とフォーム画像100'を生成する。認識ステーション
・プロセッサ300で走査される典型的な文書は、定義
済み位置に置かれ定義済みフィールド・タイプを有する
定義済みフィールドを有するフォームであり、そのすべ
てが、フォーム定義データ・セットによって指定され
る。図5のローカル・エリア・ネットワーク400は、
認識結果データ・パケット260とフォーム画像10
0'を、手動拒絶監視訂正ステーション・プロセッサ5
00または自動拒絶監視訂正ステーション・プロセッサ
600のどちらかに転送する。監視訂正ステーション・
プロセッサは、認識ステーション・プロセッサ300で
実行される文字認識動作で発生したエラーを累計し、新
適応確率重み付けテーブル810を作成する。テーブル
810は、ローカル・エリア・ネットワーク400を介
して認識ステーション・プロセッサ300に転送され
る。図6は、文字認識でのエラーを監視し、認識ステー
ション・プロセッサ用の更新された重み付けテーブルを
作る手動拒絶監視訂正ステーション・プロセッサ500
を示す。
【0020】図1に戻って、スキャナ102で文書10
0を走査して、文書100のディジタル化画像を生成す
る。文書100は、フィールド#1およびフィールド#
2として示した少なくとも2つのフィールドを有する定
義済みフォームである。フィールド#1の画像104
は、図1に示すように、文字列"abcd"である。最初
の文字"a"の入力文字画像106は、図1では、3つの
OCRまたは文字認識装置110、すなわちOCR1、
OCR2、OCR3の入力に印加される。これら3つの
文字認識装置はそれぞれ、入力文字画像106に対して
その文字認識動作を実行し、第1推測文字114とこれ
に対応する信頼値116を生成し、また第2推測文字1
18とこれに対応する信頼値120を生成する。本明細
書で選択した用語法では、OCR1の第1推測文字をG
11で表し、それに対応する信頼値をC11、OCR1
の第2推測文字をG21、それに対応する信頼値をC2
1で表す。OCR2とOCR3の第1推測文字と信頼
値、第2推測文字と信頼値も、図1に示されている。
【0021】図1のステップ122で、3つの文字認識
装置110のそれぞれの第1推測が同一の推測であるか
どうか、たとえば、OCR1、OCR2、OCR3がす
べて、"a"の入力文字画像106を実際に"a"として推
測する第1推測文字114を作成したかどうかを判定す
る。そうである場合、ステップ122から認識結果デー
タ・パケット260の形成に進む。図1に示した認識結
果データ・パケット260は、認識ステーション・プロ
セッサ300によって構築されるデータの封筒である。
認識結果データ・パケット260には、画像アドレス1
36、文書100であるフォームの識別138、符号1
40のフィールド#1、および通常は1つまたは複数の
文字認識装置110によって決定されフィールド141
に挿入される文字形状#1が含まれる。フィールド14
2には、推測された文字とその特定の推測を生成した各
文字認識装置110の識別とを含む、第1文字の推測が
含まれる。たとえば、図1では、フィールド142に、
OCR1の推測Ga11と、3つの文字認識装置110
のすべて、すなわちOCR1、OCR2およびOCR3
が"a"という同一の文字を推測したことが含まれてい
る。フィールド144には、フィールド#1の画像10
4の第2文字"b"に関する推測が含まれる。第2文字に
関する推測はGb11であり、この例では、第1と第2
の文字認識装置110、すなわちOCR1とOCR2が
共に、その文字が"b"であると推測した。第3のエンジ
ンまたはOCR3は、同一の文字を推測せず、第2文字
の表現には選択されていない。図1の認識結果データ・
パケット260を検査すると、OCR2だけがフィール
ド146の第3推測を生成したこと、および認識装置の
うちの2つ、OCR2とOCR3が、第4文字に対応す
るフィールド148の文字を推測したことがわかる。こ
れによって、認識結果データ・パケット260の部分で
あるフィールド#1 154が構成される。第2のフィ
ールド#2 156には、フィールド#2 150と、
文字形状#2 152の情報が含まれる。文字形状情報
は、通常は文字認識装置110が生成する。
【0022】ステップ122で、文字認識装置110間
で第1推測文字114に関して判断が一致しない場合に
は、OCRエンジン選択信頼係数F1、F2、F3を計
算するステップ124、126、128に進む。エンジ
ン選択信頼係数を用いると、文字認識装置の間で判断が
一致しない時に、どの1つまたは複数の文字認識装置が
文字の最良の推測を有するものとして選択されるかをシ
ステムが選べるようになる。エンジン選択信頼係数の計
算は、文字形状信頼係数Fcfに基づいて行われる。こ
の文字形状分類係数は、特定の各文字認識装置がそれぞ
れ特定の各文字形状CFに関して文字を正確に認識でき
る能力を特徴付けるものである。文字形状信頼係数テー
ブル900の1例を、図13に示す。エンジン選択信頼
係数の計算は、フィールド・タイプ信頼係数Fftにも
基づいて行われる。このフィールド・タイプ信頼係数F
ftは、各認識装置が特定の各フィールド・タイプを正
確に認識する能力を特徴付ける係数である。フィールド
・タイプ信頼係数テーブル902の1例を、図14に示
す。たとえば、3つの市販の文字認識プログラムの衝撃
式印刷に関する文字形状信頼係数は、99%、95%、
99%である。ドット・マトリックス文字に関する文字
形状信頼係数は、それぞれ70%、90%、90%であ
る。制約付き手書き文字に関する文字形状信頼係数は、
それぞれ30%、95%および99%である。制約なし
手書き文字に関する文字形状信頼係数は、それぞれ20
%、85%、90%である。同じ3つの文字認識プログ
ラムの数値文字に関するフィールド・タイプ信頼係数
は、それぞれ100%、100%、100%である。す
べて大文字の英字に関するフィールド・タイプ信頼係数
は、それぞれ98%、98%、80%である。大文字の
英字と数字が混在する場合のフィールド・タイプ信頼係
数は、それぞれ90%、97%、50%である。
【0023】図1で計算されるエンジン選択信頼係数
は、第1推測文字が第2推測文字に置換される確率にも
基づいている。これは、特定の文字画像を認識する特定
の文字認識エンジンの出力について、第2推測文字の信
頼値と第1推測文字の信頼値の差をとることによって確
立される。
【0024】エンジン選択信頼係数は、文字形状信頼係
数と、フィールド・タイプ信頼係数と、特定の推測に関
する第1信頼値および第2信頼値の差の積として計算さ
れる。その後、この積に適応確率重み付け係数をかけ
る。
【0025】適応確率重み付け係数Wpは、特定の文字
形状とフィールド・タイプの正確な認識をもたらす長期
的な能力に基づいて、システム内の他の文字認識プロセ
ッサに関してある期間にわたって特定の文字認識プロセ
ッサの選択を調節するための方法として使用される。適
応確率重み付け係数の初期値は、1にセットされ、ある
時間にわたって、各文字認識装置の挙動を監視しなが
ら、文字形状とフィールド・タイプの特定の組み合わせ
に最適な文字認識プログラムが選択できるように適応確
率重み付け係数の値が調節される。
【0026】図1では、文字認識エンジンOCR1、O
CR2、OCR3のそれぞれについてステップ124、
126、128でエンジン選択信頼係数F1、F2、F
3を計算した後に、ステップ232に進む。ステップ2
32では、OCR1とOCR2の第1推測が同一である
が、OCR3の推測と異なるかどうかを判定する。そう
である場合には、エンジン選択信頼係数F1またはF2
がF3より大きいならば、推測GをOCR1またはOC
R2のどちらかの推測G11(1、2)に設定する。F
3がF1とF2のどちらよりも大きい場合、OCR3が
この文字に関する最適の選択であるに違いなく、したが
って、GをG13(3)に設定する。その後、このプロ
グラムは、認識結果データ・パケット260の形成に進
み、最適の推測を部分154の適当なフィールドに挿入
する。
【0027】ステップ232の条件が満たされない場
合、ステップ234に進んで、OCR2の第1推測がO
CR3の第1推測と等しく、かつOCR1の第1推測と
異なっているかどうかを判定する。そうである場合に
は、エンジン選択信頼係数F2またはF3が、F1より
大きいかどうかを判定し、そうであるならば、推測Gを
OCR2またはOCR3の第1推測であるG12(2、
3)に設定する。F1がF2とF3のどちらよりも大き
いならば、GをOCR1の出力であるG11(1)に設
定する。その後、このプログラムは、認識結果データ・
パケット260の形成に進む。
【0028】ステップ234の条件が満たされない場
合、ステップ236に進んで、OCR1の第1推測文字
114がOCR3の第1推測と同一であり、かつOCR
2の第1推測と異なるかどうかを判定する。そうである
場合には、ステップ236で、エンジン選択信頼係数F
1またはF3がF2より大きいかどうかを判定し、そう
であるならば、最適推測Gを、OCR1の出力またはO
CR3の出力であるG11(1、3)に設定する。そう
でない場合、すなわちF2がF1とF3のどちらよりも
大きい場合には、GをOCR2の出力であるG12
(2)に設定する。その後、ステップ236から、認識
結果データ・パケット260の形成に進む。
【0029】図2と図3に、認識ステーション・プログ
ラム200の動作ステップのシーケンスの詳細な流れ図
を示す。ステップ202で、書き込まれたフォームの画
像中を走査して取り込む。ステップ204で、フォーム
認識を行ってフォームIDを得る。ステップ206で、
フォームIDを使用してフォーム定義データ・セットに
アクセスして、フォーム・タイプ、フィールドID、お
よび特定の各フィールドのフィールド座標とフィールド
・タイプを得る。さらに、あるフィールドが制約付き区
域または制約なし区域のどちらであるかに関する情報が
フォーム定義データ・セットに含まれることもある。そ
の後、ステップ208で、フィールド・タイプを取り、
フィールド・タイプが数字であるか英字であるか、英字
の場合には、すべて大文字か大文字と小文字の混合か、
あるいはそのフィールドが英字と数字の混合フィールド
であるか判定する。フォーム定義データ・セットによっ
て提供されるフィールド・タイプ情報に、フィールドが
制約付き区域であるかどうか、その場合には、そのフィ
ールドに手書き文字が見つかるかどうか、そうであるな
らば、それらが制約付き手書き文字と制約なし手書き文
字のどちらであるかなどの文字形状情報が含まれること
がある。この制約付き手書きと制約なし手書きは、どち
らも文字形状属性である。
【0030】その後、図2の方法は、ステップ210に
進んで、それぞれの文字認識プログラム110に、文字
の第1推測G11、G12、G13とそれに対応する信
頼係数C11、C12、C13を生成させる。その後、
ステップ212で、それぞれの文字認識プログラム11
0に、文字の第2推測G21、G22、G23とそれに
対応する信頼係数C21、C22、C23を生成させ
る。
【0031】図2のステップ214では、G11とG1
2とG13が互いに等しいかどうかを判定する。等しく
なるのは、3つの文字認識プログラムOCR1、OCR
2、OCR3のすべての第1推測が同一の場合である。
そうである場合には、ステップ238に進む。しかし、
そうでない場合には、ステップ216に進んで、この特
定の分析中の文字についてどの文字認識エンジンを受け
入れるかを選択する処理を開始する。ステップ218
で、各文字認識エンジンに分析を実行させ、副産物とし
て文字形状の推測を出力させる。これは、その文字形状
がドット・マトリックス、連続機械印字または手書きの
どれであるかに関する推測であり得る。市販の文字認識
プログラムは通常、この種の出力を提供するが、これ
は、通常の文字認識アルゴリズムによってかなり簡単に
決定される。たとえば、ドット・マトリックス文字形状
は、連続機械印字文字形状と非常に異なる画素編成を有
する。この情報は、値CFとして出力され、通常は、シ
ステム内のすべての文字認識プログラムで一致する。分
析中の特定の文字の文字形状CFに関して文字認識エン
ジンの間に不一致がある場合には、投票を行うことがで
き、多数の文字認識エンジンが出力する文字形状CF
が、図2および図3のプログラムで使用するCFの値と
して選択される。
【0032】図2のプログラムは、その後、図3に進
み、ステップ219で、ステップ219とステップ23
0の間をまわるループを開始して、i番目の文字認識装
置(OCD)または文字認識プログラム110のエンジ
ン選択信頼係数Fiを計算する。ステップ220で、文
字形状CFとフィールド・タイプFTを使用して、図1
1に示した、i番目のOCRエンジン(i番目の文字認
識プログラム110)の適応確率重み付け係数(Wp)
テーブルにアクセスする。その後、ステップ222で、
文字形状CFを使用して、図13に示した、i番目のO
CRエンジンまたはi番目の文字認識プログラム110
の文字形状信頼係数(Fcf)テーブル900にアクセ
スする。その後、ステップ224で、FTを使用してF
ftテーブルにアクセスして、i番目のOCRエンジン
のフィールド・タイプ信頼係数Fft(FT,i)を得
る。その後、ステップ226とステップ228で、i番
目の文字認識プログラム110のエンジン選択信頼係数
Fiを計算する。ステップ228では、適応確率重み付
け係数Wpと文字形状信頼係数Fcfとフィールド・タ
イプ信頼係数Fftの積に、第1推測の信頼係数と第2
推測の信頼係数の差(最初のOCR1の場合にはC11
−C21)をかけることによってエンジン選択信頼係数
Fiを計算する。その後、ステップ230で、エンジン
選択信頼係数を計算しなければならない文字認識プログ
ラムが、そのシステムにまだあるかどうかを判定する。
ある場合は、インデックス値"i"を1つだけ増分し、ス
テップ219に進む。そうでない場合は、ステップ23
2に進む。
【0033】ステップ232、234、236は、前に
説明したのと同じ形で動作し、3つの文字認識プログラ
ムOCR1、OCR2、OCR3の3つの第1推測出力
のうちで最適の推測に対応する特定の値Gが識別され
る。その後、ステップ232、234、236の条件が
満たされる場合は、ステップ238に進んで、文字推測
Gを認識結果データ・パケット260に挿入する。
【0034】分析中のフィールドにまだ文字がある場
合、このプログラムはステップ210に進む。分析中の
フォームにまだフィールドがある場合、このプログラム
はステップ206に進む。分析中のフォーム内のすべて
のフィールドをこのようにして処理した後、認識結果デ
ータ・パケット260にそのフォームの各フィールドの
各文字の最適推測が含まれるようになる。その後、認識
ステーション・プロセッサ300によって認識結果デー
タ・パケット260が出力される。これをデータ処理シ
ステムが、英字コード化データ文字列を操作してプログ
ラム対象アプリケーションを実行するために利用する。
【0035】図4は、認識ステーション・プロセッサ3
00を示す図である。プロセッサ300は、バス305
によってCPU304に接続されたメモリ302を含
む。バス305にはまた、ディスク・ファイル306
と、ローカル・エリア・ネットワーク400に接続され
たLANアダプタ308も接続される。バス305に
は、文書100などのハード・コピー文書をその文書フ
ォームのディジタル化されたフォーム画像100'に変
換する走査装置に接続された、スキャナ・アダプタ31
0も接続される。キーボード312もバス305に接続
され、表示装置314とマウス・アダプタ316も同様
である。
【0036】メモリ302には、認識ステーション・プ
ログラム200、フォーム認識プログラム320、フォ
ーム定義データ・セット区画322、文字認識プログラ
ムOCR1の区画326、文字認識プログラムOCR2
の区画328、および文字認識プログラムOCR3の区
画330が含まれる。区画332は、OCR1の第1推
測G11と信頼係数C11、OCR2の第1推測G12
と信頼係数C12、OCR3の第1推測G13と信頼係
数C13用の記憶域を提供する。区画334は、OCR
1、OCR2、OCR3の第2推測とそれに対応する信
頼係数用の同様の記憶域を提供する。
【0037】メモリ302にはまた、文字形状CF用の
区画336とフィールド・タイプFT用の区画324も
含まれる。新適応確率重み付けテーブル810が、文字
形状信頼係数テーブル900およびフィールド・タイプ
信頼係数テーブル902と共に、メモリ302に記憶さ
れる。区画344は、OCRエンジン選択信頼係数F
1、F2、F3用の作業場所と記憶位置を提供する。区
画350は、認識結果データ・パケット260用の組立
場所と記憶位置を提供する。
【0038】オペレーティング・システム352も、メ
モリ302に記憶される。メモリ302に記憶された各
プログラムは、所期の機能と動作を実行するためにCP
U304内で実行できる、対応する動作ステップのシー
ケンスを表す実行可能命令のシーケンスである。その結
果、認識ステーション・プロセッサ300は、システム
内の他のプロセッサによる利用のため、ローカル・エリ
ア・ネットワーク400に認識結果データ・パケット2
60を出力する。
【0039】図5は、図4に示した認識ステーション・
プロセッサ300を図6に示した手動拒絶監視訂正ステ
ーション・プロセッサ500に相互接続するローカル・
エリア・ネットワーク400を示す図である。認識結果
データ・パケット260とフォーム画像100'が、認
識ステーション・プロセッサ300から手動拒絶監視訂
正ステーション・プロセッサ500に転送される。
【0040】図6は、バス505を介してCPU504
に接続されたメモリ502を含む手動拒絶監視訂正ステ
ーション・プロセッサ500を示す図である。バス50
5にはまた、ディスク・ファイル506と、ローカル・
エリア・ネットワーク400に接続されたLANアダプ
タ508も接続される。バス505にはまた、プリンタ
・アダプタ510、キーボード512、表示装置514
およびマウス・アダプタ516も接続される。
【0041】メモリ502には、監視訂正ステーション
・プログラム700と適応確率重み付け係数更新プログ
ラム750が記憶されている。区画522には、フォー
ム定義データ・セットが記憶され、区画550には、認
識ステーション・プロセッサ300からローカル・エリ
ア・ネットワーク400を介して受け取る認識結果デー
タ・パケット260が記憶される。メモリ502にはま
た、図9のサンプル・パケットのエラー・カウント・テ
ーブル800、図10のこれまでにサンプリングされた
全文字のテーブル802、図11の既存の適応確率重み
テーブル804、および図12の新適応確率重み付けテ
ーブル810を記憶するための諸区画も含まれる。さら
に、フォーム画像表示バッファ560は、フォームXY
Zを記憶し、図では、その画像が示されているが、この
フォームXYZには、NAME(氏名)フィールド、S
TATE(州)フィールド、ZIP CODE(郵便番
号)フィールド、LICENCE #(ライセンス番
号)フィールドが含まれる。メモリ502にはまた、認
識結果データ・パケット260から抽出されたコード化
データ文字列を含むコード化データ表示バッファ570
も含まれる。その諸フィールドは、フォーム画像表示バ
ッファ560に記憶された画像中に現れるフィールドに
対応する。メモリ502にはまた、オペレーティング・
システム580も含まれる。メモリ502に記憶された
プログラムは、行うべき所期の機能を実行するためにC
PU504によって実行される、動作ステップのシーケ
ンスを表す実行可能命令のシーケンスである。
【0042】図7は、監視訂正ステーション・プログラ
ム700の動作ステップのシーケンスの流れ図である。
ステップ702で、認識結果データ・パケット260を
受け取る。ステップ704で、図10のテーブル802
に示される合計CNTである、これまでにサンプリング
された全文字を増分する。ステップ706で、分析中の
特定のフォームに関するフォーム定義データ・セットか
ら、すべてのフィールド座標を得る。ステップ708
で、図6のコード化データ表示バッファ570のフィー
ルド書式位置のコード化データ文字として、データ・パ
ケットからのすべての文字認識推測を表示する。ステッ
プ710で、走査して取り込まれたフォームのフォーム
画像100'を得、図6のフォーム画像表示バッファ5
60に表示する。
【0043】図7のステップ712で、図6のコード化
データ表示バッファ570のコード化データ文字に表示
された誤った文字の指定を操作員から受け取る。ステッ
プ714で、指定された文字に対応する認識文字推測G
(i,i'...)を、図6の区画550の認識結果デ
ータ・パケット260から得る。ステップ716で、そ
の認識文字推測を生成した文字認識プログラムの識別"
i"を、認識結果データ・パケット260から得る。ス
テップ718で、そのフィールドの文字形状CFを、認
識結果データ・パケット260から得る。ステップ72
0で、フォーム定義データ・セットからフィールド・タ
イプFTを得る。ステップ722で、キーボードから正
しい文字を受け取る。この時、操作員は、フォーム画像
表示バッファ560に記憶された表示される画像を見
て、誤った文字を正しく解釈している。ステップ724
で、正しい文字を認識結果データ・パケット260に挿
入する。その後、ステップ726で、そのエラーを生じ
たOCRエンジンのエラー・カウントECを増分し、図
9のエラー・カウント・テーブル800のエラー・カウ
ントへの入力を行う。その後、図7のプログラムは、ス
テップ728に進み、主プログラムに戻る。
【0044】図8は、適応確率重み付け係数更新プログ
ラム750の動作ステップのシーケンスの流れ図であ
る。ステップ752で、文字形状CF、フィールド・タ
イプFTおよび文字認識プログラム"i"(またはOCR
i)のそれぞれについてのループを開始する。このプロ
グラムは、1日の終わり、またはエラー統計を累計し図
9のエラー・カウント・テーブル800に登録した後の
適当な期間の終わりに、手動拒絶監視訂正ステーション
・プロセッサ500内で実行できる。このプログラム
は、ステップ754に進んで、特定の文字形状CFとフ
ィールド・タイプFTのそれぞれを処理する特定の文字
認識プログラムのそれぞれに関する更新された適応確率
重み付け係数Wpの計算を実行する。適応確率重み付け
係数の更新は、この例では、図11の既存の適応確率重
みテーブル804の既存の適応確率重みを取り出し、そ
の重みのそれぞれについて、それに調節値をかけること
によって行われる。この例では、調節値は、エラー・カ
ウントECに、この特定の文字認識プログラムとこの特
定の文字形状CFおよびフィールド・タイプFTの組み
合わせとに関する、図10のテーブル802に記憶され
たこれまでにサンプリングされた全文字のエラー・カウ
ントの合計をかけた値である。次にこの値を、すべての
認識結果データ・パケット260でサンプリングされた
すべての文字数の合計で割る。これによって、エラー・
カウントの短期間変化が平滑化される傾向があり、その
結果、短期間の変化が、長期間にわたって累計される適
応確率重み付け係数の累計値に過度に影響しなくなる。
その後、各文字形状CFと各フィールド・タイプFTと
各文字認識プログラム"i"についてループが完了するよ
うに、ステップ754からステップ752へループ・バ
ックする。その結果、図11の既存の適応確率重みテー
ブル804の既存の適応確率重みWP1が、図12の新
適応確率重み付けテーブル810の新適応確率重みWP
2に変換される。その後、図8のステップ756で、新
適応確率重み付けテーブル810の新適応確率重みWP
2を認識ステーション・プロセッサ300に送る。その
後、図8のプログラムは、ステップ758に進み、主プ
ログラムに戻る。
【0045】その結果、図9のエラー・カウント・テー
ブル800によって表される累計エラー統計を使用し
て、適応確率重みWPを調節し、その結果、累計誤りを
監視する際に、多数の分析中の書き込まれたフォームに
文字認識プログラムを適用することから得られた知識を
活用する、新適応確率重み付けテーブル810を作成す
ることができるようになる。
【0046】通常、文字認識されるフォームの10%の
サンプリングによって、特定の文字形状とフィールド・
タイプの組み合わせに適用するための最も正確な文字認
識プログラムの選択が最適化されるように新適応確率重
み付けテーブル810を更新できるようにするのに十分
な、エラー・カウント統計の本体が作られる。
【0047】上記の例では、特定の文字形状とフィール
ド・タイプに関して最適の文字認識エンジンを選択する
のに3つの文字認識エンジンを使用してきたが、他の数
の文字認識エンジンを使用することもでき、その場合も
上の方法が適用できる。
【0048】手動拒絶監視訂正ステーション・プロセッ
サ500に、図5に示した自動拒絶監視訂正ステーショ
ン・プロセッサ600を含めることも可能である。自動
拒絶監視訂正ステーション・プロセッサ600は、第1
推測文字の誤りを自動的に検出し、正しい文字を生成し
て第1推測文字と置換する。これは、たとえば、郵便番
号フィールドと州フィールドの組み合わせなどのフィー
ルドで実行できる。州フィールドで誤りが検出される場
合、同じフォームの別のフィールドに現れる郵便番号を
使用して、たとえば郵便番号簿にアクセスして、正しい
州の名前を決定することができる。その後、州フィール
ドの誤った文字を訂正し、それに応じてエラー・カウン
ト・テーブル800を増分することができる。
【発明の効果】本発明によれば、広範囲の文字形状およ
びフィールドタイプを有するテキストを正確に文字認識
することができるようになる。
【図面の簡単な説明】
【図1】本発明の一般化した論理流れ図である。
【図2】認識ステーション・プログラム200の詳細な
流れの一部分を示す流れ図である。
【図3】認識ステーション・プログラム200の詳細な
流れの残りの部分を示す流れ図である。
【図4】認識ステーション・プロセッサ300のアーキ
テクチャ図である。
【図5】認識ステーション・プロセッサ300と手動拒
絶監視訂正ステーション・プロセッサ500を含むロー
カル・エリア・ネットワーク400のアーキテクチャ図
である。
【図6】手動拒絶監視訂正ステーション・プロセッサ5
00のアーキテクチャ図である。
【図7】監視訂正ステーション・プログラムの流れ図で
ある。
【図8】適応確率重み付け係数更新プログラムの流れ図
である。
【図9】サンプル・パケットのエラー・カウント・テー
ブル800を示す図である。
【図10】これまでにサンプリングされたすべての文字
のテーブルを示す図である。
【図11】既存の適応確率重みのテーブルを示す図であ
る。
【図12】新しい適応確率重みのテーブルを示す図であ
る。
【図13】文字形状信頼係数のテーブルを示す図であ
る。
【図14】フィールド・タイプ信頼係数のテーブルを示
す図である。
【符号の説明】
200 認識ステーション・プログラム 260 認識結果データ・パケット 300 認識ステーション・プロセッサ 320 フォーム認識プログラム 322 フォーム定義データ・セット区画 500 手動拒絶監視訂正ステーション・プロセッサ 560 フォーム画像表示バッファ 570 コード化データ表示バッファ 600 自動拒絶監視訂正ステーション・プロセッサ 700 監視訂正ステーション・プログラム 750 適応確率重み付け係数更新プログラム 800 サンプル・パケットのエラー・カウント・テー
ブル 802 これまでにサンプリングされた全文字のテーブ
ル 804 既存の適応確率重みテーブル 810 新適応確率重み付けテーブル 900 文字形状信頼係数テーブル 902 フィールド・タイプ信頼係数テーブル

Claims (25)

    【特許請求の範囲】
  1. 【請求項1】複数の文字認識手段を含むデータ処理シス
    テムにおいて、 前記データ処理システムに、前記複数の文字認識手段の
    うちの少なくとも1つに関する文字形状信頼係数を入力
    するステップと、 前記データ処理システムに、前記複数の文字認識手段の
    うちの少なくとも1つに関するフィールド・タイプ信頼
    係数を入力するステップと、 前記データ処理システムに、前記複数の文字認識手段の
    うちの少なくとも1つに関する適応確率重み付け係数を
    入力するステップと、 前記複数の文字認識手段のうちの少なくとも1つを用い
    て、前記データ処理システム内で第1推測文字および第
    1信頼値ならびに第2推測文字および第2信頼値を生成
    するステップと、 前記データ処理システム内で、前記文字形状信頼係数と
    前記フィールド・タイプ信頼係数と前記適応確率重み付
    け係数の積に、前記第1信頼値と前記第2信頼値の差を
    かけた値として、認識手段選択信頼係数を計算するステ
    ップと、 前記データ処理システム内で、前記複数の文字認識手段
    のうち最大の値の前記認識手段選択信頼係数を有するも
    のを選択するステップとを含む、文書画像のフィールド
    内の文字の認識に使用するために前記複数の文字認識手
    段のうちの1つを選択する文字認識方法。
  2. 【請求項2】さらに、前記データ処理システム内の前記
    複数の文字認識手段のうちの1つのエラー・カウントを
    累計するステップと、 前記エラー・カウントから導出される値を用いて前記適
    応確率重み付け係数を修正することにより、前記データ
    処理システム内で、前記複数の文字認識手段のうちの少
    なくとも1つに関する前記適応確率重み付け係数の新し
    い値を計算するステップとを含む、請求項1の方法。
  3. 【請求項3】さらに、前記データ処理システム内で、前
    記文字形状信頼係数と前記フィールド・タイプ信頼係数
    と前記適応確率重み付け係数の前記新しい値の積に前記
    第1信頼値と前記第2信頼値の差をかけた値として、認
    識手段選択信頼係数を計算するステップを含む、請求項
    2の方法。
  4. 【請求項4】さらに、前記データ処理システム内の手動
    訂正ステーションで、前記第1推測文字を監視し訂正す
    るステップと、 前記データ処理システム内の前記複数の文字認識手段の
    1つのエラー・カウントを累計するステップと、 前記エラー・カウントから導出される値を用いて前記適
    応確率重み付け係数を修正することにより、前記データ
    処理システム内で、前記複数の文字認識手段のうちの少
    なくとも1つに関する前記適応確率重み付け係数の新し
    い値を計算するステップとを含む、請求項1の方法。
  5. 【請求項5】さらに、前記データ処理システム内の自動
    訂正ステーションで、前記第1推測文字を監視し訂正す
    るステップと、 前記データ処理システム内の前記複数の文字認識手段の
    1つのエラー・カウントを累計するステップと、 前記エラー・カウントから導出される値を用いて前記適
    応確率重み付け係数を修正することにより、前記データ
    処理システム内で、前記複数の文字認識手段のうちの少
    なくとも1つに関する前記適応確率重み付け係数の新し
    い値を計算するステップとを含む、請求項1の方法。
  6. 【請求項6】複数の文字認識手段を含むデータ処理シス
    テムにおいて、 前記複数の文字認識手段のうちの少なくとも1つを用い
    て、前記データ処理システム内で第1推測文字および第
    1信頼値ならびに第2推測文字および第2信頼値を生成
    するステップと、 前記データ処理システム内で、前記第1信頼値と前記第
    2信頼値の差の関数として、認識手段選択信頼係数を計
    算するステップと、 前記データ処理システム内で、前記複数の文字認識手段
    のうち最大の値の前記認識手段選択信頼係数を有する1
    つを選択するステップとを含む、文書画像のフィールド
    内の文字の認識に使用するために前記複数の文字認識手
    段のうちの1つを選択する文字認識方法。
  7. 【請求項7】複数の文字認識手段を含むデータ処理シス
    テムにおいて、 前記データ処理システムに、前記複数の文字認識手段の
    うちの少なくとも1つに関する文字形状信頼係数を入力
    するステップと、 前記データ処理システムに、前記複数の文字認識手段の
    うちの少なくとも1つに関するフィールド・タイプ信頼
    係数を入力するステップと、 前記複数の文字認識手段のうちの少なくとも1つを用い
    て、前記データ処理システム内で第1推測文字および第
    1信頼値ならびに第2推測文字および第2信頼値を生成
    するステップと、 前記データ処理システム内で、前記文字形状信頼係数お
    よび前記フィールド・タイプ信頼係数の積に、前記第1
    信頼値と前記第2信頼値との間の差をかけた値として、
    認識手段選択信頼係数を計算するステップと、 前記データ処理システム内で、前記複数の文字認識手段
    のうち最大の値の前記認識手段選択信頼係数を有するも
    のを選択するステップとを含む、文書画像のフィールド
    内の文字の認識に使用するために前記複数の文字認識手
    段のうちの1つを選択する文字認識方法。
  8. 【請求項8】複数の文字認識手段を含むデータ処理シス
    テムにおいて、 前記データ処理システムに、前記複数の文字認識手段の
    うちの少なくとも1つに関する適応確率重み付け係数を
    入力するステップと、 前記複数の文字認識手段のうちの少なくとも1つを用い
    て、前記データ処理システム内で、第1推測文字および
    第1信頼値ならびに第2推測文字および第2信頼値を生
    成するステップと、 前記データ処理システム内で、前記適応確率重み付け係
    数に、前記第1信頼値と前記第2信頼値の差をかけた値
    として、認識手段選択信頼係数を計算するステップと、 前記データ処理システム内で、前記複数の文字認識手段
    のうち最大の値の前記認識手段選択信頼係数を有する1
    つを選択するステップとを含む、文書画像のフィールド
    内の文字の認識に使用するために前記複数の文字認識手
    段のうちの1つを選択する文字認識方法。
  9. 【請求項9】さらに、前記データ処理システム内の前記
    複数の文字認識手段のうちの1つのエラー・カウントを
    累計するステップと、 前記エラー・カウントから導出される値を用いて前記適
    応確率重み付け係数を修正することにより、前記データ
    処理システム内で、前記複数の文字認識手段のうちの少
    なくとも1つに関する前記適応確率重み付け係数の新し
    い値を計算するステップとを含む、請求項8の方法。
  10. 【請求項10】さらに、前記データ処理システム内で、
    前記適応確率重み付け係数の前記新しい値に前記第1信
    頼値と前記第2信頼値の差をかけた値として、認識手段
    選択信頼係数を計算するステップを含む、請求項9の方
    法。
  11. 【請求項11】さらに、前記データ処理システム内の手
    動訂正ステーションで、前記第1推測文字を監視し訂正
    するステップと、 前記データ処理システム内の前記複数の文字認識手段の
    1つのエラー・カウントを累計するステップと、 前記エラー・カウントから導出される値を用いて前記適
    応確率重み付け係数を修正することにより、前記データ
    処理システム内で、前記複数の文字認識手段のうちの少
    なくとも1つに関する前記適応確率重み付け係数の新し
    い値を計算するステップとを含む、請求項8の方法。
  12. 【請求項12】さらに、前記データ処理システム内の自
    動訂正ステーションで、前記第1推測文字を監視し訂正
    するステップと、 前記データ処理システム内の前記複数の文字認識手段の
    1つのエラー・カウントを累計するステップと、 前記エラー・カウントから導出される値を用いて前記適
    応確率重み付け係数を修正することにより、前記データ
    処理システム内で、前記複数の文字認識手段のうちの少
    なくとも1つに関する前記適応確率重み付け係数の新し
    い値を計算するステップとを含む、請求項8の方法。
  13. 【請求項13】文書画像入力手段、フォーム認識手段、
    フィールド抽出手段および複数の文字認識手段を含むデ
    ータ処理システムにおいて、 前記データ処理システムに、前記複数の文字認識手段の
    うちの少なくとも1つに関する文字形状信頼係数を入力
    するステップと、 前記データ処理システムに、前記複数の文字認識手段の
    うちの少なくとも1つに関するフィールド・タイプ信頼
    係数を入力するステップと、 前記データ処理システムに、前記複数の文字認識手段の
    うちの少なくとも1つに関する適応確率重み付け係数を
    入力するステップと、 前記複数の文字認識手段のうちの少なくとも1つを用い
    て、前記データ処理システム内で第1推測文字および第
    1信頼値ならびに第2推測文字および第2信頼値を生成
    するステップと、 前記データ処理システム内で、前記文字形状信頼係数と
    前記フィールド・タイプ信頼係数と前記適応確率重み付
    け係数の積に、前記第1信頼値と前記第2信頼値の差を
    かけた値として、OCRエンジン選択信頼係数を計算す
    るステップと、 前記データ処理システム内で、前記複数の文字認識手段
    のうち最大の値の前記OCRエンジン選択信頼係数を有
    するものを選択するステップと前記データ処理システム
    内の前記複数の文字認識手段のうちの1つのエラー・カ
    ウントを累計するステップと、 前記エラー・カウントから導出される値を用いて前記適
    応確率重み付け係数を修正することにより、前記データ
    処理システム内で、前記複数の文字認識手段のうちの少
    なくとも1つに関する前記適応確率重み付け係数の新し
    い値を計算するステップとを含む、文書画像のフィール
    ド内の文字に使用するために前記複数の文字認識手段の
    うちの1つを選択する文字認識方法。
  14. 【請求項14】複数の文字認識手段を含むデータ処理シ
    ステムにおいて、 前記複数の文字認識手段のうちの少なくとも1つに関す
    る文字形状信頼係数を記憶するためのメモリを含み、 前記メモリが、前記複数の文字認識手段のうちの少なく
    とも1つに関するフィールド・タイプ信頼係数を記憶
    し、 前記メモリが、前記複数の文字認識手段のうちの少なく
    とも1つに関する適応確率重み付け係数を記憶し、 前記複数の文字認識手段のうちの少なくとも1つが、第
    1推測文字および第1信頼値ならびに第2推測文字およ
    び第2信頼値を生成し、 さらに、前記メモリと前記複数の文字認識手段のうちの
    少なくとも1つとに結合された、前記文字形状信頼係数
    と前記フィールド・タイプ信頼係数と前記適応確率重み
    付け係数の積に、前記第1信頼値と前記第2信頼値の差
    をかけた値として、認識手段選択信頼係数を計算するた
    めの第1プロセッサ手段と、 前記第1プロセッサ手段に結合された、前記データ処理
    システム内の前記複数の文字認識手段のうち最大の値の
    前記認識手段選択信頼係数を有するものを選択するため
    の選択手段とを含む、 文書画像のフィールド内の文字に使用するために前記複
    数の文字認識手段のうちの1つを選択する文字認識装
    置。
  15. 【請求項15】さらに、前記選択手段に結合された、前
    記第1推測文字のエラー・カウントを累計するための累
    計手段と、 前記累計手段に結合された、前記エラー・カウントから
    導出される値を用いて前記適応確率重み付け係数を修正
    することにより、前記複数の文字認識手段のうちの少な
    くとも1つに関する前記適応確率重み付け係数の新値を
    計算するための第2プロセッサ手段とを含む、請求項1
    4の文字認識装置。
  16. 【請求項16】さらに、前記第2プロセッサ手段に結合
    された、前記適応確率重み付け係数の前記新値を受け取
    り、前記データ処理システム内で、前記文字形状信頼係
    数と前記フィールド・タイプ信頼係数と前記適応確率重
    み付け係数の前記新しい値の積に前記第1信頼値と前記
    第2信頼値の差をかけた値として、認識手段選択信頼係
    数を計算するための前記第1プロセッサ手段を含む、請
    求項15の文字認識装置。
  17. 【請求項17】さらに、前記累計手段と第2プロセッサ
    手段とを格納する、前記データ処理システム内の手動監
    視訂正ステーションと、 前記手動ステーション内にあり、前記選択手段に結合さ
    れた、前記文書画像および前記第1推測文字を操作員に
    提示するための表示手段と、 前記第1推測文字と置換するため、前記操作員から訂正
    された文字を受け取るための、前記手動ステーション内
    の入力手段とを含む、請求項16の文字認識装置。
  18. 【請求項18】さらに、前記データ処理システム内にあ
    り、前記選択手段に結合された、前記第1推測文字の誤
    りを自動的に検出し、前記第1推測文字と置換するため
    訂正された文字を生成するための、自動監視訂正手段を
    含む、請求項16の文字認識装置。
  19. 【請求項19】複数の文字認識手段を含むデータ処理シ
    ステムにおいて、 前記複数の文字認識手段のうちの少なくとも1つが、第
    1推測文字および第1信頼値ならびに第2推測文字およ
    び第2信頼値を生成し、 前記複数の文字認識手段のうちの少なくとも1つとに結
    合された、前記第1信頼値と前記第2信頼値との間の差
    の関数として、認識手段選択信頼係数を計算するための
    第1プロセッサ手段と、 前記第1プロセッサ手段に結合された、前記データ処理
    システム内の前記複数の文字認識手段のうち最大の値の
    前記認識手段選択信頼係数を有するものを選択するため
    の選択手段とを含む、 文書画像のフィールド内の文字に使用するために前記複
    数の文字認識手段のうちの1つを選択する文字認識装
    置。
  20. 【請求項20】複数の文字認識手段を含むデータ処理シ
    ステムにおいて、 前記複数の文字認識手段のうちの少なくとも1つに関す
    る文字形状信頼係数を記憶するためのメモリを含み、 前記メモリが、前記複数の文字認識手段のうちの少なく
    とも1つに関するフィールド・タイプ信頼係数を記憶
    し、 前記複数の文字認識手段のうちの少なくとも1つが、第
    1推測文字および第1信頼値ならびに第2推測文字およ
    び第2信頼値を生成し、 さらに、前記メモリと前記複数の文字認識手段のうちの
    少なくとも1つとに結合された、前記文字形状信頼係数
    と前記フィールド・タイプ信頼係数の積に、前記第1信
    頼値と前記第2信頼値の差をかけた値として、認識手段
    選択信頼係数を計算するための第1プロセッサ手段と、 前記第1プロセッサ手段に結合された、前記データ処理
    システム内の前記複数の文字認識手段のうち最大の値の
    前記認識手段選択信頼係数を有するものを選択するため
    の選択手段とを含む、 文書画像のフィールド内の文字に使用するために前記複
    数の文字認識手段のうちの1つを選択する文字認識装
    置。
  21. 【請求項21】複数の文字認識手段を含むデータ処理シ
    ステムにおいて、 前記複数の文字認識手段のうちの少なくとも1つに関す
    る適応確率重み付け係数を記憶するためのメモリを含
    み、 前記複数の文字認識手段のうちの少なくとも1つが、第
    1推測文字および第1信頼値ならびに第2推測文字およ
    び第2信頼値を生成し、 さらに、前記メモリと前記複数の文字認識手段のうちの
    少なくとも1つとに結合された、前記適応確率重み付け
    係数に前記第1信頼値と前記第2信頼値の差をかけた値
    として、認識手段選択信頼係数を計算するための第1プ
    ロセッサ手段と、 前記第1プロセッサ手段に結合された、前記データ処理
    システム内の前記複数の文字認識手段のうち最大の値の
    前記認識手段選択信頼係数を有する1つを選択するため
    の選択手段とを含む、 文書画像のフィールド内の文字に使用するために前記複
    数の文字認識手段のうちの1つを選択する文字認識装
    置。
  22. 【請求項22】さらに、前記選択手段に結合された、前
    記第1推測文字のエラー・カウントを累計するための累
    計手段と、 前記累計手段に結合された、前記エラー・カウントから
    導出される値を用いて前記適応確率重み付け係数を修正
    することにより、前記複数の文字認識手段のうちの少な
    くとも1つに関する前記適応確率重み付け係数の新しい
    値を計算するための第2プロセッサ手段とを含む、請求
    項21の文字認識装置。
  23. 【請求項23】さらに、前記第2プロセッサ手段に結合
    された、前記適応確率重み付け係数の前記新値を受け取
    り、前記データ処理システム内で、前記適応確率重み付
    け係数の前記新値と、前記第1信頼値と前記第2信頼値
    の差をかけた値として、認識手段選択信頼係数を計算す
    るための前記第1プロセッサ手段を含む、請求項22の
    文字認識装置。
  24. 【請求項24】さらに、前記累計手段と第2プロセッサ
    手段とを格納する、前記データ処理システム内の手動監
    視訂正ステーションと、 前記手動ステーション内にあり、前記選択手段に結合さ
    れた、前記文書画像および前記第1推測文字を操作員に
    提示するための表示手段と、 前記第1推測文字と置換するため、前記操作員から訂正
    された文字を受け取るための、前記手動ステーション内
    の入力手段とを含む、請求項23の文字認識装置。
  25. 【請求項25】さらに、前記データ処理システム内にあ
    り、前記選択手段に結合された、前記第1推測文字の誤
    りを自動的に検出し、前記第1推測文字と置換するため
    訂正された文字を生成するための自動監視訂正手段を含
    む、請求項23の文字認識装置。
JP6078561A 1993-04-26 1994-04-18 文字認識方法及び装置 Expired - Fee Related JP2637915B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US051972 1993-04-26
US08/051,972 US5455872A (en) 1993-04-26 1993-04-26 System and method for enhanced character recogngition accuracy by adaptive probability weighting

Publications (2)

Publication Number Publication Date
JPH06348900A true JPH06348900A (ja) 1994-12-22
JP2637915B2 JP2637915B2 (ja) 1997-08-06

Family

ID=21974572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6078561A Expired - Fee Related JP2637915B2 (ja) 1993-04-26 1994-04-18 文字認識方法及び装置

Country Status (6)

Country Link
US (1) US5455872A (ja)
EP (1) EP0622751B1 (ja)
JP (1) JP2637915B2 (ja)
KR (1) KR970007280B1 (ja)
CN (1) CN1052319C (ja)
DE (1) DE69428621T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017021459A (ja) * 2015-07-08 2017-01-26 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2019169026A (ja) * 2018-03-26 2019-10-03 株式会社Pfu 情報処理装置、文字認識エンジン最適化方法及びプログラム

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE183593T1 (de) * 1993-03-29 1999-09-15 Kleindienst Datentech Gmbh Verfahren und vorrichtung zum automatischen erfassen und erkennen von schriften
DE4407998C2 (de) * 1994-03-10 1996-03-14 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg
US5805747A (en) * 1994-10-04 1998-09-08 Science Applications International Corporation Apparatus and method for OCR character and confidence determination using multiple OCR devices
US5970171A (en) * 1995-08-14 1999-10-19 Hughes Aircraft Company Apparatus and method of fusing the outputs of multiple intelligent character recognition (ICR) systems to reduce error rate
JP3367850B2 (ja) * 1996-12-17 2003-01-20 株式会社キングジム 文字情報処理装置
US5889897A (en) * 1997-04-08 1999-03-30 International Patent Holdings Ltd. Methodology for OCR error checking through text image regeneration
US6608944B1 (en) * 1997-07-28 2003-08-19 Lucent Technologies Inc. Value based scoring for optical character recognition
IL127982A0 (en) * 1999-01-10 1999-11-30 Shonut Ltd Incoming facsimile routing using text and image analysis
US6662180B1 (en) * 1999-05-12 2003-12-09 Matsushita Electric Industrial Co., Ltd. Method for searching in large databases of automatically recognized text
US7120302B1 (en) 2000-07-31 2006-10-10 Raf Technology, Inc. Method for improving the accuracy of character recognition processes
US6950555B2 (en) * 2001-02-16 2005-09-27 Parascript Llc Holistic-analytical recognition of handwritten text
US6951707B2 (en) * 2001-03-08 2005-10-04 Ppg Industries Ohio, Inc. Process for creating vias for circuit assemblies
JP4421134B2 (ja) * 2001-04-18 2010-02-24 富士通株式会社 文書画像検索装置
US7095875B2 (en) * 2001-05-15 2006-08-22 Lockheed Martin Corporation Method and system for address result arbitration
US6970877B2 (en) 2002-06-28 2005-11-29 Microsoft Corporation Reducing and controlling sizes of prototype-based recognizers
US6988107B2 (en) * 2002-06-28 2006-01-17 Microsoft Corporation Reducing and controlling sizes of model-based recognizers
US7305612B2 (en) * 2003-03-31 2007-12-04 Siemens Corporate Research, Inc. Systems and methods for automatic form segmentation for raster-based passive electronic documents
CA2529037A1 (en) * 2003-08-15 2005-02-24 Silverbrook Research Pty Ltd Natural language recognition using distributed processing
US20050094861A1 (en) * 2003-10-31 2005-05-05 International Business Machines Corporation Positional synchronization in a multivoting character recognition environment
US20070104370A1 (en) * 2003-11-18 2007-05-10 Siemens Aktiengesellschaft System and method for smart polling
CN1882395B (zh) * 2003-11-18 2010-12-29 西门子公司 转寄邮件项的方法和设备
CN100349172C (zh) * 2005-04-08 2007-11-14 北京中星微电子有限公司 一种不理想条件下可摄像移动终端名片识别的方法
WO2006123575A1 (ja) * 2005-05-19 2006-11-23 Kenji Yoshida 音声情報記録装置
JP2007304864A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 文字認識処理システムおよび文字認識処理プログラム
GB0611561D0 (en) * 2006-06-08 2006-07-19 Ibm A validation engine
GB0623236D0 (en) * 2006-11-22 2007-01-03 Ibm An apparatus and a method for correcting erroneous image identifications generated by an ocr device
US7849398B2 (en) * 2007-04-26 2010-12-07 Xerox Corporation Decision criteria for automated form population
JP7147208B2 (ja) * 2018-03-20 2022-10-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2019215747A (ja) * 2018-06-13 2019-12-19 富士ゼロックス株式会社 情報処理装置及びプログラム
KR20210034869A (ko) 2019-09-23 2021-03-31 한국전력공사 수기 표 이미지의 디지털 이미지 변환 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4032887A (en) * 1973-06-28 1977-06-28 International Business Machines Corporation Pattern-recognition systems having selectively alterable reject/substitution characteristics
US4773099A (en) * 1985-10-10 1988-09-20 The Palantir Corporation Pattern classification means for use in a pattern recognition system
US4876735A (en) * 1987-12-18 1989-10-24 International Business Machines Corporation Method and apparatus for character recognition systems
US4958375A (en) * 1988-02-17 1990-09-18 Nestor, Inc. Parallel, multi-unit, adaptive pattern classification system using inter-unit correlations and an intra-unit class separator methodology
US5052043A (en) * 1990-05-07 1991-09-24 Eastman Kodak Company Neural network with back propagation controlled through an output confidence measure
US5081690A (en) * 1990-05-08 1992-01-14 Eastman Kodak Company Row-by-row segmentation and thresholding for optical character recognition
US5046116A (en) * 1990-12-14 1991-09-03 Canon Research Center America, Inc. Symbol analyzing system and method with data exclusion and confidence factors
US5257323A (en) * 1991-05-29 1993-10-26 Canon Kabushiki Kaisha Selection agent for a symbol determination system with multiple character recognition processors

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017021459A (ja) * 2015-07-08 2017-01-26 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2019169026A (ja) * 2018-03-26 2019-10-03 株式会社Pfu 情報処理装置、文字認識エンジン最適化方法及びプログラム

Also Published As

Publication number Publication date
DE69428621D1 (de) 2001-11-22
EP0622751A2 (en) 1994-11-02
CN1052319C (zh) 2000-05-10
EP0622751A3 (en) 1995-03-15
JP2637915B2 (ja) 1997-08-06
DE69428621T2 (de) 2002-08-01
US5455872A (en) 1995-10-03
CN1096889A (zh) 1994-12-28
KR970007280B1 (ko) 1997-05-07
EP0622751B1 (en) 2001-10-17
KR940024589A (ko) 1994-11-18

Similar Documents

Publication Publication Date Title
JP2637915B2 (ja) 文字認識方法及び装置
US5067165A (en) Character recognition method
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US5293466A (en) Method and apparatus for selecting interpreter for printer command language based upon sample of print job transmitted to printer
US6021220A (en) System and method for pattern recognition
US6442555B1 (en) Automatic categorization of documents using document signatures
US5764799A (en) OCR method and apparatus using image equivalents
US7885464B2 (en) Apparatus, method, and program for handwriting recognition
US7047238B2 (en) Document retrieval method and document retrieval system
US20050248808A1 (en) Printing control interface system and method with handwriting discrimination capability
US5359671A (en) Character-recognition systems and methods with means to measure endpoint features in character bit-maps
JP2005242579A (ja) 文書処理装置、文書処理方法、および文書処理プログラム
EP0687991B1 (en) Information processing method and apparatus and computer readable memory medium
US11170265B2 (en) Image processing method and an image processing system
US8953910B2 (en) Proof reading of text data generated through optical character recognition
JPH1027214A (ja) 光学式文字認識コンピュータにおける接触文字の分離方法及び装置
JP2008225695A (ja) 文字認識誤り修正装置およびプログラム
JPH0869506A (ja) 手書き文字の認識方法および装置
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
JP3411796B2 (ja) 文字認識装置
JP2006343797A (ja) 文字認識装置、文字認識方法およびコンピュータプログラム
JPH08241378A (ja) 低品質文字の認識方法
JP2000155806A (ja) 文字認識方法、文字認識装置、辞書作成方法、辞書作成装置、文字品質判定方法、及び、記録媒体
JP2002312720A (ja) 文字認識装置、文字認識方法、プログラム及び記憶媒体

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100425

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100425

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees