JP3270551B2 - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法

Info

Publication number
JP3270551B2
JP3270551B2 JP34024992A JP34024992A JP3270551B2 JP 3270551 B2 JP3270551 B2 JP 3270551B2 JP 34024992 A JP34024992 A JP 34024992A JP 34024992 A JP34024992 A JP 34024992A JP 3270551 B2 JP3270551 B2 JP 3270551B2
Authority
JP
Japan
Prior art keywords
character
recognition result
character image
recognition
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34024992A
Other languages
English (en)
Other versions
JPH06187507A (ja
Inventor
明彦 酒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP34024992A priority Critical patent/JP3270551B2/ja
Publication of JPH06187507A publication Critical patent/JPH06187507A/ja
Application granted granted Critical
Publication of JP3270551B2 publication Critical patent/JP3270551B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書画像を入力して、
該文書画像の文字に認識処理を施す文字認識装置および
文字認識方法に関するものである。
【0002】
【従来の技術】一般に文字認識装置とは、文書画像デー
タから1文字ずつ“文字切り出し処理”を行うことによ
って得られた文字画像データに対して認識処理を施すこ
とにより、それがどのような文字かを識別するものであ
る。この認識処理では、認識したい文字画像データに対
して位置・傾き・線幅・濃度等の正規化処理を施した上
で、輪郭線特徴等の抽出を行い、その抽出された特徴抽
出量と予め求めておいた全ての認識対象文字の標準パタ
ーンと、どの程度マッチングがとれているかを調べ、そ
の結果を基準にして正解文字を決定する。
【0003】ここで、マッチングの対象となる全ての認
識対象文字の標準パターンおよびその文字を表わす文字
コードのセットをまとめて登録したものが通常、“認識
辞書”と呼ばれるものである。
【0004】認識率の向上を目的とし、それまでの“認
識辞書”で認識された結果を基に、認識辞書に登録され
ている文字コードの標準パターンの修正を行うこと、お
よび、文字コードと標準パターンセットの認識辞書への
追加登録を行うこと、を認識辞書の学習という。また、
学習によりその内容を書き換えることが可能な認識辞書
のことを“学習認識辞書”という。
【0005】従来の一般的な認識辞書の学習処理の手順
を、図2のフローチャートに示す。
【0006】図2において、まずステップS101(以
下、“ステップ”なる文言は省略する)では、ある認識
結果を用いて辞書の学習をするかどうかを指示する。も
しここで学習の指示がなされなければ、辞書の学習処理
は終了する。
【0007】S101で学習の指示がなされると、S1
02においてオペレータは引き続き、認識結果の中から
認識辞書の学習に対して効果があると予測される文字の
認識結果をオペレータ自身の主観的な判断により選択す
る。
【0008】S102において、辞書の学習のためにど
の認識結果を用いるかが指示されると、続くS103で
は、その指示された認識結果に対応する正解文字コード
および文字イメージの特徴抽出量から作成された特徴パ
ターンを用いた辞書の学習が行われる。
【0009】このように、ある認識結果に対する認識辞
書の学習は、上記のS101〜S103を以下繰り返す
ことにより行われるのが普通であった。
【0010】
【発明が解決しようとする課題】しかしながら上記従来
例では、認識辞書の学習時におけるオペレータの操作が
たいへん煩雑である上、認識辞書の学習に対して効果が
あると予測される文字に対する認識結果を選択する際の
客観的な判断が損なわれてしまうために、学習に対して
効果があると思われる認識結果の見落しや、学習に不適
切な認識結果の選択が生じやすく、効果的な認識辞書の
学習を行うことは大変困難であった。
【0011】よって本発明の目的は上述の点に鑑み、認
識辞書の学習に対して効果があると予想される認識結果
を自動的に選択し、適切な学習が実行されるように構成
した文字認識装置および文字認識方法を提供することに
ある。
【0012】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に係る本発明は、入力された文書画像か
ら文字画像を切り出し、認識辞書を用いて文字認識を行
うことにより、当該文字画像に対する認識結果を出力す
る認識手段と、前記認識結果に対して修正を行う修正手
段と、前記認識結果に対する修正内容を記憶する記憶手
段と、前記修正手段で修正が行われた認識結果で、且
つ、前記記憶手段に記憶されている当該認識結果の修正
内容とその前後の文字画像の認識結果に対する修正内容
の組合せが所定の組合せであるか否かに基づいて前記
文字画像の切り出し処理が成功していると判断される認
識結果について、該認識結果とその文字画像とに基づい
て前記認識辞書の学習を行うと判断する判断手段と、前
記判断手段で認識辞書の学習を行うと判断された場合、
該認識結果とその文字画像とに基づいて前記認識辞書の
学習を行う学習手段とを備えた文字認識装置である。請
求項2に係る本発明は、請求項1に係る文字認識装置に
おいて、前記記憶手段は、前記文字画像の認識結果に対
する修正を行う順番によって前記修正内容のデータ構造
が変わらないようにして記憶する。請求項3に係る本発
明は、請求項2に係る文字認識装置において、前記記憶
手段は、前記文字画像の認識結果の修正処理を行ってい
ない未修正処理、もしくは、前記文字画像の第1位の文
字候補を第2位以降のいずれかの文字候補と交換する交
換処理、もしくは、前記文字画像の第1位の文字侯補を
ユーザにより入力された文字に置き換える置き換え処
理、もしくは、前記文字画像の文字候補の削除を行う削
除処理、もしくは、当該文字画像の後に文字列を挿入す
る挿入処理のうち、行われた修正処理を当該文字画像の
認識結果に対する前記修正内容として記憶する手段であ
って、前後に並んで切り出された2つの文字画像に対
し、前の文字画像の認識結果に対しては前記削除処理が
行われ、後ろの文字画像の認識結果に対しては前記置き
換え処理が行われた場合、前記記憶手段は、前記前の文
字画像の認識結果に対しては、前記後ろの文字画像に対
して行われた置き換え処理の文字を用いて、前記置き換
え処理が行われたとして記憶し、前記後ろの文字画像の
認識結果に対しては、前記削除処理が行われたとして記
憶するようにし、前後に並んで切り出された2つの文字
画像に対し、前の文字画像の認識結果に対しては前記挿
入処理が行われ、後ろの文字画像の認識結果に対しては
前記削除処理が行われた場合、前記記憶手段は、前記前
の文字画像の認識結果に対しては前記未修正処理として
記憶し、前記後ろの文字画像の認識結果に対しては前記
挿入処理で挿入された文字列の1番目の文字を第1位の
候補として置き換える前記置き換え処理と、前記挿入さ
れた文字列の2番目以降の文字列の前記挿入処理とが行
われたとして記憶するようにし、文字画像の認識結果に
対して、前記挿入処理と前記削除処理とが行われた場
合、前記記憶手段は、前記挿入処理で挿入された文字列
の1番目の文字を第1位の候補として置き換える前記置
き換え処理と、前記挿入された文字列の2番目以降の文
字列の挿入処理とが行われたとして記憶するようにした
ものである。請求項4に係る本発明は、請求項3に係る
文字認識装置において、前記判断手段は、前記記憶手段
により記憶された当該文字画像の認識結果に対する修正
内容が前記交換処理であった場合、もしくは、当該文字
画像の認識結果に対する修正内容が前記置き換え処理
で、且つ当該文字画像の前後の文字画像の認識結果に対
する修正内容が前記未修正処理又は前記交換処理で、且
つ当該文字画像及びその前の文字画像の認識結果に対す
る修正内容に前記挿入処理が行われていない場合のいず
れかを満たしている場合、前記認識辞書の学習を行うと
判断する。請求項5に係る本発明は、入力された文書画
像から文字画像を切り出し、認識辞書を用いて文字認識
を行うことにより、当該文字画像に対する認識結果を出
力する認識ステップと、前記認識結果に対して修正を行
う修正ステップと、前記認識結果に対する修正内容を記
憶手段に記憶させる記憶ステップと、前記修正ステップ
で修正が行われた認識結果で、且つ、前記記憶ステップ
に記憶されている当該認識結果の修正内容とその前後の
文字画像の認識結果に対する修正内容との組合せが所定
の組合せであるか否かに基づいて前記文字画像の切り出
し処理が成功していると判断される認識結果について、
該認識結果とその文字画像とに基づいて前記認識辞書の
学習を行うと判断する判断ステップと、前記判断ステッ
プで認識辞書の学習を行うと判断された場合、該認識結
果とその文字画像とに基づいて前記認識辞書の学習を行
う学習ステップとを備えた文字認識方法である。請求項
6に係る本発明は、請求項5に係る文字認識方法におい
て、前記記憶ステップでは、前記文字画像の認識結果に
対する修正を行う順番によって前記修正内容のデータ構
造が変わらないようにして前記記憶手段に記憶させる。
請求項7に係る本発明は、請求項6に係る文字認識方法
において、前記記憶ステップでは、前記文字画像の認識
結果の修正処理を行っていない未修正処理、もしくは、
前記文字画像の第1位の文字候補を第2位以降のいずれ
かの文字候補と交換する交換処理、もしくは、前記文字
画像の第1位の文字侯補をユーザにより入力された文字
に置き換える置き換え処理、もしくは、前記文字画像の
文字候補の削除を行う削除処理、もしくは、当該文字画
像の後に文字列を挿入する挿入処理のうち、行われた修
正処理を当該文字画像の認識結果に対する前記修正内容
として前記記憶手段に記憶させるステップであって、前
後に並んで切り出された2つの文字画像に対し、前の文
字画像の認識結果に対しては前記削除処理が行われ、後
ろの文字画像の認識結果に対しては前記置き換え処理が
行われた場合、前記記憶ステップは、前記前の文字画像
の認識結果に対しては、前記後ろの文字画像に対して行
われた置き換え処理の文字を用いて、前記置き換え処理
が行われたとして記憶し、前記後ろの文字画像の認識結
果に対しては、前記削除処理が行われたとして前記記憶
手段に記憶させるようにし、前後に並んで切り出された
2つの文字画像に対し、前の文字画像の認識結果に対し
ては前記挿入処理が行われ、後ろの文字画像の認識結果
に対しては前記削除処理が行われた場合、前記記憶ステ
ップは、前記前の文字画像の認識結果に対しては前記未
修正処理として記憶し、前記後ろの文字画像の認識結果
に対しては前記挿入処理で挿入された文字列の1番目の
文字を第1位の候補として置き換える前記置き換え処理
と、前記挿入された文字列の2番目以降の文字列の前記
挿入処理とが行われたとして前記記憶手段に記憶させる
ようにし、文字画像の認識結果に対して、前記挿入処理
と前記削除処理とが行われた場合、前記記憶ステップ
は、前記挿入処理で挿入された文字列の1番目の文字を
第1位の候補として置き換える前記置き換え処理と、前
記挿入された文字列の2番目以降の文字列の挿入処理と
が行われたとして前記記憶手段に記憶させるようにした
ものである。請求項8に係る本発明は、請求項7に係る
文字認識方法において、前記判断ステップでは、前記記
憶手段に記憶された当該文字画像の認識結果に対する修
正内容が前記交換処理であった場合、もしくは、当該文
字画像の認識結果に対する修正内容が前記置き換え処理
で、且つ当該文字画像の前後の文字画像の認識結果に対
する修正内容が前記未修正処理又は前記交換処理で、且
つ当該文字画像及びその前の文字画像の認識結果に対す
る修正内容に前記挿入処理が行われていない場合のいず
れかを満たしている場合、前記認識辞書の学習を行うと
判断する。
【0013】
【0014】
【実施例】以下、本発明の実施例を詳細に説明する。
【0015】図1は、本発明の一実施例である文字認識
装置の概略構成を示すブロック図である。同図におい
て、201は読み取り対象から文書情報をアナログ信号
に変換して読み取るスキャナである。202は、スキャ
ナ201から出力されたアナログ信号を二値のデジタル
信号に変換する二値化回路である。
【0016】203は、割込み入力ポート、割込み制御
回路、クロックパルス発生器、命令デコーダ、レジスタ
群、ALU、入力ポート、出力ポートおよびイメージ入
力シフトレジスタを含む大規模集積回路(LSI)より
なる中央処理装置(CPU)である。
【0017】204は、アドレスごとに割り付けられた
読み書き可能な記憶部を有するランダムアクセスメモリ
(RAM)であり、CPU203のワークエリアとして
使用されると共に二値化回路202より入力された文書
画像データ、文書画像に対する認識結果データ、認識辞
書の学習処理により作成されたかあるいは既に作成済の
もので外部記憶装置206より読込まれた学習認識辞書
を一時的に格納するための記憶領域として使われる。
【0018】205は、CPU203によって順次実行
されるプログラム、学習による書換えが不可能な基本認
識辞書、および各種判定等で用いられる定数をコード化
して収納しているリードオンリーメモリ(ROM)であ
る。なお基本認識辞書には、誤った辞書学習により学習
認識辞書の性能が低下した場合にもある一定レベルの認
識性能を保つことができるようにするために、認識辞書
の初期状態が記憶されている。
【0019】206は、RAM204に一時的に格納し
た文書画像データや認識結果データ、学習認識辞書を長
期的に保存するための記憶領域として使われる外部記憶
装置である。207は、出力データを受け取ってCRT
208に表示するための信号を発生させるCRTインタ
ーフェイスである。
【0020】209はキーボード、210はポインティ
ングデバイスであり、このキーボード209とポインテ
ィングデバイス210はオペレータが該文字認識装置に
対する指示を入力するための装置である。
【0021】211は、外部アドレスおよび外部データ
バスを含む外部バスラインであり、これを介してROM
205および外部記憶装置206のアドレッシングやデ
ータのやり取り等が行われる。
【0022】図3は、図1に示した実施例におけるCP
U203の動作を説明するフローチャートであり、この
処理を実行する制御プログラムはROM205に記憶さ
れている。
【0023】まずステップS301(以下、“ステッ
プ”なる文言は省略する)で、スキャナ201において
オペレータによりセットされた読取り対象からの文書画
像情報をアナログ信号として読込み、さらに二値化回路
202によって該アナログ信号を二値化してRAM20
4に記憶する。
【0024】続いてS302では、S301で入力した
二値化された文書画像データに対して文字切り出し処理
を行う。この文字切り出し処理後の文字画像データはR
AM204に記憶される。
【0025】次にS303では、S302で切り出し処
理を行った文字画像データに対して認識処理を行う。認
識処理ではまず、位置、傾き、線幅、濃度等の正規化処
理を行う。続いて、この正規化された切り出し文字画像
データを認識部に送り込むことによって、それがどんな
文字かを認識する。認識は、まず正規化された切り出し
文字画像データに対し輪郭線特徴等の抽出を行い、その
抽出された特徴ベクトルと認識辞書における全ての文字
の標準パターンベクトルとのマッチングをとり、その際
最も確からしいとされた文字を第1候補とし、その後2
番目に確からしいものを第2候補、3番目に確からしい
ものを第3候補…と以下同様に第8候補までを出力する
ことによって行う。
【0026】なおこのマッチングにおいては、ROM2
05の中に記憶されている基本認識辞書および外部記憶
装置206からRAM204に読込まれた学習認識辞書
の2つの辞書を同時に用いている。これは、学習認識辞
書を用いることで過去の辞書学習の効果を認識結果に反
映させる一方、基本認識辞書を用いることで、誤った辞
書学習がなされた場合にも、認識性能がある一定水準以
下になることを防止しているためである。
【0027】また、S303による結果は認識結果デー
タとしてRAM204に記憶される。図4は、認識結果
データのデータ構造を示している。1つの切り出し文字
画像データに対する1文字あたりの認識結果データは、
マッチングの結果得られた第1から第8候補までの8つ
の文字コード、修正処理の方法や内容を記憶するための
修正フラグコード、および、修正時に文字コードの追加
が行われた場合に用いるポインタアドレスコードにより
構成される。
【0028】S303での認識直後、すなわち未修正時
の修正フラグコードとポインタアドレスコードの値に
は、それぞれ0およびヌルポインタが格納されている。
なおヌルポインタとは、アドレスとなり得ないある一定
の値であり、ポインタアドレスコードにこの値が格納さ
れている場合には、ポインタアドレスコードはどのアド
レスも指していないことを意味する。
【0029】続いてS304では、これらの認識結果デ
ータをCRT208に表示する。認識終了直後におい
て、CRT208に表示されるものは、1文字当たりの
認識結果データにおける第1候補文字のみであるが、そ
の中の任意の文字をポインティングデバイス210で示
すと、CRT208には、その文字の第1候補〜第8候
補までも併せて表示される。その時のCRT画面を図5
に示す。
【0030】S304で表示される各文字データにおけ
る認識結果の第1候補が正解文字と異なっている場合、
オペレータはS305の指示により認識結果データの修
正を行うことが可能である。第2候補〜第8候補の中に
正解文字が含まれている場合には、オペレータは不正解
文字である第1候補と第2候補〜第8候補との入れ換え
をキーボード209やポインティングデバイス210を
用いて指示することにより、認識結果を修正することが
可能である。また、候補文字に頼らず通常のテキストフ
ァイルのようにキーボード209からの入力を用いて直
接、第1候補文字の交換・削除・挿入により、認識結果
データの修正を指示することも可能である。
【0031】S305の修正の指示に基づき、S306
では認識結果データの修正を行う。修正された認識結果
データは、S305の修正指示の方法や内容の違いによ
り、次の4つのパターンに分類される。
【0032】(1)第2候補〜第8候補に含まれる正解
と第1候補とを交換する。この場合、修正フラグコード
には値1が格納される。
【0033】(2)キーボード209からの入力によ
り、第1候補の文字コードを正解文字コードで置き換え
る。オペレータの処理としては、ある認識結果データの
第1候補の文字コードの削除を行った後で、1文字分の
挿入を行うことになる。この場合、修正フラグコードに
は値2が格納される。
【0034】(3)キーボード209からの入力によ
り、第1候補の文字コードの削除を行う。この場合、修
正フラグコードには値3が格納される。
【0035】(4)キーボード209からの入力によ
り、文字コードの挿入を行う。この場合、修正フラグコ
ードにはそれまでの内容が保持され、あらかじめRAM
204の空きメモリ領域に確保しておいた挿入文字コー
ド記憶領域に挿入文字列コードを記憶させた上で、その
先頭のメモリ空間アドレスの値をポインタアドレスコー
ドに記憶させる。
【0036】以上のような4つパターンにより修正され
る認識結果データを、それぞれ図6〜図面9に示す。な
お図9の挿入文字列コードにおける“¥0”は、追加し
た文字列の末尾であることを示す文字コードである。
【0037】また、認識結果データを修正する際には、
たとえオペレータが最終的に同じ修正を行ったとして
も、その交換・削除・挿入などの処理を行う順序によっ
て認識結果のデータ構造が変わってしまう可能性があ
る。そこでそれを避けるために、次の3つ編集規則に従
った認識結果データの編集を行うこととする。
【0038】(1)フラグコードの値が2である認識結
果データ(データ1)の直前の認識結果データ(データ
0)において第1候補の文字コードの削除がなされた場
合、すなわちフラグコードに値3が格納された場合に
は、その2つの認識結果データのフラグコードの値を交
換し、さらにデータ0の第1候補の文字をデータ1の第
1候補の文字で置き換える。
【0039】(2)文字列の挿入が行われた認識結果デ
ータ(データ1)の直後の認識結果データ(データ2)
において第1候補の文字コードの削除がなされた場合、
すなわちフラグコードに値3が格納された場合には、デ
ータ1における挿入文字列の第1文字目の文字コードを
データ2における第1候補の文字として置き換え、デー
タ2のフラグコードには値2を格納する。そして、挿入
文字列の第2文字目の文字コードを格納したメモリ空間
アドレスの値をデータ2のポインタアドレスコードに記
憶させ、データ1のポインタアドレスコードにはヌルポ
インタを格納する。
【0040】(3)文字列の挿入が行われた認識結果デ
ータにおいて第1候補の文字コードの削除がなされた場
合、すなわちフラグコードに値3が格納された場合に
は、挿入文字列の第1文字目の文字コードを第1候補の
文字として置き換え、フラグコードには値2を格納す
る。そして、挿入文字列の第2文字目の文字コードを格
納したメモリ空間アドレスの値をポインタアドレスコー
ドに記憶させる。
【0041】以上のような3つの規則による認識結果デ
ータの編集処理の一例を、それぞれ図10〜図12に示
す。
【0042】図3に示したS305〜S306の繰り返
しにより一通り認識結果データの修正を行った後、S3
07では認識辞書の学習処理が行われる。
【0043】本実施例の特徴であるS307の学習処理
の詳細な手続きを図13に示す。
【0044】まずS1301において、オペレータは修
正結果による認識辞書の学習処理を行うか否かを指示す
ることができる。S1301における学習の指示は、キ
ーボード209やポインティングデバイス210を用い
て、所定の指示を入力することにより行われる。
【0045】S1301の学習の指示に応じて、S13
02では認識辞書の学習が行われる。認識辞書の学習
は、すべての認識結果データの中から認識辞書の学習に
対して効果があると予測されるいくつかの認識結果デー
タを選択し、それに対応する正解文字コードおよび文字
イメージの特徴抽出量から作成された特徴ベクトルを用
いて、RAM204に一時的に記憶されている学習認識
辞書の更新、あるいは学習認識辞書を過去に作成したこ
とがなければ新たな学習認識辞書の作成、を行うことに
よって行われる。
【0046】ここで、認識辞書の学習に用いる認識結果
データの選択は、従来の認識辞書の学習のようにオペレ
ータの主観的な判断にはよらず、以下の2つの点を満足
することを条件として自動的に選択される。
【0047】(1)修正処理がなされた認識結果である
こと。
【0048】(2)その文字イメージにおいて、文字切
り処理の失敗が生じていないこと。
【0049】上記(1)の条件は、今回の認識において
誤認識を生じたことを示しており、その文字に対する認
識結果を学習辞書に登録することは、次に同じ文字を認
識する場合において極めて有効である可能性が高い。
【0050】また上記(2)の条件は、誤認識が明らか
に認識処理におけるマッチングの失敗により生じている
ことを意味している。
【0051】この2つの条件を満足する認識結果データ
は、次のような基準で選択することが可能である。
【0052】(1)認識結果データの修正フラグコード
の値が1であること。
【0053】(2)認識結果データの修正フラグコード
の値が2であり、かつ、その前後の文字の認識結果デー
タのフラグコードの値が0か1のどちらかで、さらに、
その文字および直前の文字の認識結果データで文字の挿
入が行われていないこと。
【0054】なお、この(1)の基準は他の第2候補〜
第8候補との交換で修正がなされた、すなわちフラグコ
ードの値が1である認識結果データは文字切り出し処理
に成功しているという前提に基づいて定められている。
また、(2)の基準はフラグコードの値が2か3である
認識結果データが隣り合っているか、もしくは文字の挿
入が行われている場合にはなんらかの文字切り出し処理
の失敗が生じている可能性があるという前提に基づいて
定められている。
【0055】こうして選択された認識結果データを基に
して、学習認識辞書の更新および作成が行われる。学習
認識辞書の更新は、まず今回の学習のために選択された
認識結果データに対応する正解文字コードと同じ文字コ
ードの辞書パターンが、既に作成されている学習認識辞
書において登録されているかどうかを調べ、既に登録さ
れている場合には、それまでの辞書パターンと認識結果
データより得られた特徴ベクトルパターンとの平均化等
の処理により作成した新しい標準パターンによって辞書
パターンを更新し、まだ登録されていない場合には、新
しい文字コードの辞書パターンとして学習認識辞書に正
解文字コードおよびその特徴ベクトルパターンを追加登
録することによって行われる。
【0056】また新たな学習認識辞書の作成は、学習の
ために選択された認識結果データに対応する正解文字コ
ードとその特徴ベクトルパターンを学習認識辞書に登録
することによって行われる。
【0057】図13を用いて詳細に説明した学習処理S
307が行われた後、最後にステップS308では、S
303〜S306で作成・修正された認識結果データお
よびS307で作成・更新された学習認識辞書を外部記
憶装置206に格納する。
【0058】次に、他の実施例について説明する。
【0059】認識結果の候補は必ずしも8個選び出す必
要はなく、任意のN個の候補としても良い。
【0060】また、認識結果データの構造は、必ずしも
図4の形式による必要はなく、8つの認識候補文字に関
する情報および認識結果の修正方法や内容等を識別する
情報がデータの中に含まれていれば良い。さらに、マッ
チングの結果の情報(距離または類似度)を同時に保存
しておいてもよい。
【0061】辞書学習の際に用いる認識結果データの基
準については、文字切り出し処理の失敗が生じていない
という条件を満たしている認識結果データであれば、辞
書学習に用いることは一応可能である。従って、認識に
成功した結果、すなわち修正フラグコードの値が0であ
る認識結果データも、辞書学習の際に用いる認識結果デ
ータとして用いることが可能である。
【0062】このように本発明における辞書学習方法
は、学習に用いる認識結果データを修正フラグコードの
値に基づき自動的に選択するという点を特徴としてお
り、その結果選択された学習用認識結果データに基づく
具体的な学習認識辞書の作成、更新の方法については他
の公知である方法を用いることも可能である。
【0063】
【発明の効果】以上説明したとおり本発明によれば、認
識辞書の学習に対して効果があると思われるいくつかの
認識結果データを自動的に選択し、それを用いて認識辞
書の学習を行うこととしているので、オペレータの操作
性を向上させるのみならず、辞書学習に不適切な認識結
果データによる認識辞書の学習を軽減させ、認識辞書の
学習効率を上げることができる。すなわち本発明によれ
ば、修正が行われた認識結果の修正内容とその前後の認
識結果の修正内容から文字画像の切り出し処理が成功し
ているか否かを判断しており、このように切り出し処理
が成功していると判断されるものについて学習を行うこ
ととしているので、文字切り出しが失敗していないもの
について、辞書学習をすることができる。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】従来例における認識辞書の学習処理を示すフロ
ーチャートである。
【図3】本発明の一実施例における処理手順を示すフロ
ーチャートである。
【図4】本発明の一実施例における認識結果データの記
憶形式を示す図である。
【図5】本発明の一実施例における表示画面を示す図で
ある。
【図6】第2候補〜第8候補に含まれる正解と第1候補
との交換による修正がなされた場合の認識結果データの
構造の一例を示す図である。
【図7】キーボード209からの入力により第1候補の
文字コードを正解文字コードで書換えることによる修正
がなされた場合の、認識結果データの構造の一例を示す
図である。
【図8】キーボード209からの入力により第1候補の
文字コードの削除を行うことによる修正がなされた場合
の、認識結果データの構造の一例を示す図である。
【図9】キーボード209からの入力により第1候補の
文字コードの挿入を行うことによる修正がなされた場合
の、認識結果データの構造の一例を示す図である。
【図10】フラグコードの値が2である認識結果データ
の直前の認識結果データにおいて、第1候補の文字コー
ドの削除がなされた場合の、認識結果データの編集の一
例を示す図である。
【図11】文字列の挿入が行われた認識結果データの直
後の認識結果データにおいて、第1候補の文字コードの
削除がなされた場合の、認識結果データの編集の一例を
示す図である。
【図12】文字列の挿入が行われた認識結果データにお
いて、第1候補の文字コードの削除がなされた場合の、
認識結果データの編集の一例を示す図である。
【図13】本発明の一実施例における認識辞書の学習処
理を示すフローチャートである。
【符号の説明】
201 スキャナ 202 二値化回路 203 CPU 204 RAM 205 ROM 206 外部記憶装置 207 CRTインターフェイス 208 CRT 209 キーボード 210 ポインティングデバイス 211 バスライン
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/03 - 9/68 JICSTファイル(JOIS)

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された文書画像から文字画像を切り
    出し、認識辞書を用いて文字認識を行うことにより、当
    該文字画像に対する認識結果を出力する認識手段と、 前記認識結果に対して修正を行う修正手段と、 前記認識結果に対する修正内容を記憶する記憶手段と、 前記修正手段で修正が行われた認識結果で、且つ、前記
    記憶手段に記憶されている当該認識結果の修正内容とそ
    の前後の文字画像の認識結果に対する修正内容との組合
    せが所定の組合せであるか否かに基づいて前記文字画像
    の切り出し処理が成功していると判断される認識結果に
    ついて、該認識結果とその文字画像とに基づいて前記認
    識辞書の学習を行うと判断する判断手段と、 前記判断手段で認識辞書の学習を行うと判断された場
    合、該認識結果とその文字画像とに基づいて前記認識辞
    書の学習を行う学習手段とを備えることを特徴とする文
    字認識装置。
  2. 【請求項2】 前記記憶手段は、前記文字画像の認識結
    果に対する修正を行う順番によって前記修正内容のデー
    タ構造が変わらないようにして記憶することを特徴とす
    る請求項1に記載の文字認識装置。
  3. 【請求項3】 前記記憶手段は、前記文字画像の認識結
    果の修正処理を行っていない未修正処理、もしくは、前
    記文字画像の第1位の文字候補を第2位以降のいずれか
    の文字候補と交換する交換処理、もしくは、前記文字画
    像の第1位の文字侯補をユーザにより入力された文字に
    置き換える置き換え処理、もしくは、前記文字画像の文
    字候補の削除を行う削除処理、もしくは、当該文字画像
    の後に文字列を挿入する挿入処理のうち、行われた修正
    処理を当該文字画像の認識結果に対する前記修正内容と
    して記憶する手段であって、 前後に並んで切り出された2つの文字画像に対し、前の
    文字画像の認識結果に対しては前記削除処理が行われ、
    後ろの文字画像の認識結果に対しては前記置き換え処理
    が行われた場合、前記記憶手段は、前記前の文字画像の
    認識結果に対しては、前記後ろの文字画像に対して行わ
    れた置き換え処理の文字を用いて、前記置き換え処理が
    行われたとして記憶し、前記後ろの文字画像の認識結果
    に対しては、前記削除処理が行われたとして記憶するよ
    うにし、 前後に並んで切り出された2つの文字画像に対し、前の
    文字画像の認識結果に対しては前記挿入処理が行われ、
    後ろの文字画像の認識結果に対しては前記削除処理が行
    われた場合、前記記憶手段は、前記前の文字画像の認識
    結果に対しては前記未修正処理として記憶し、前記後ろ
    の文字画像の認識結果に対しては前記挿入処理で挿入さ
    れた文字列の1番目の文字を第1位の候補として置き換
    える前記置き換え処理と、前記挿入された文字列の2番
    目以降の文字列の前記挿入処理とが行われたとして記憶
    するようにし、 文字画像の認識結果に対して、前記挿入処理と前記削除
    処理とが行われた場合、前記記憶手段は、前記挿入処理
    で挿入された文字列の1番目の文字を第1位の候補とし
    て置き換える前記置き換え処理と、前記挿入された文字
    列の2番目以降の文字列の挿入処理とが行われたとして
    記憶するようにしたことを特徴とする請求項2に記載の
    文字認識装置。
  4. 【請求項4】 前記判断手段は、 前記記憶手段により記憶された当該文字画像の認識結果
    に対する修正内容が前記交換処理であった場合、もしく
    は、当該文字画像の認識結果に対する修正内容が前記置
    き換え処理で、且つ当該文字画像の前後の文字画像の認
    識結果に対する修正内容が前記未修正処理又は前記交換
    処理で、且つ当該文字画像及びその前の文字画像の認識
    結果に対する修正内容に前記挿入処理が行われていない
    場合のいずれかを満たしている場合、 前記認識辞書の学習を行うと判断することを特徴とする
    請求項3に記載の文字認識装置。
  5. 【請求項5】 入力された文書画像から文字画像を切り
    出し、認識辞書を用いて文字認識を行うことにより、当
    該文字画像に対する認識結果を出力する認識ステップ
    と、 前記認識結果に対して修正を行う修正ステップと、 前記認識結果に対する修正内容を記憶手段に記憶させる
    記憶ステップと、 前記修正ステップで修正が行われた認識結果で、且つ、
    前記記憶ステップに記憶されている当該認識結果の修正
    内容とその前後の文字画像の認識結果に対する修正内容
    の組合せが所定の組合せであるか否かに基づいて前記
    文字画像の切り出し処理が成功していると判断される認
    識結果について、該認識結果とその文字画像とに基づい
    て前記認識辞書の学習を行うと判断する判断ステップ
    と、 前記判断ステップで認識辞書の学習を行うと判断された
    場合、該認識結果とその文字画像とに基づいて前記認識
    辞書の学習を行う学習ステップとを備えることを特徴と
    する文字認識方法。
  6. 【請求項6】 前記記憶ステップでは、前記文字画像の
    認識結果に対する修正を行う順番によって前記修正内容
    のデータ構造が変わらないようにして前記記憶手段に記
    憶させることを特徴とする請求項5に記載の文字認識方
    法。
  7. 【請求項7】 前記記憶ステップでは、前記文字画像の
    認識結果の修正処理を行っていない未修正処理、もしく
    は、前記文字画像の第1位の文字候補を第2位以降のい
    ずれかの文字候補と交換する交換処理、もしくは、前記
    文字画像の第1位の文字侯補をユーザにより入力された
    文字に置き換える置き換え処理、もしくは、前記文字画
    像の文字候補の削除を行う削除処理、もしくは、当該文
    字画像の後に文字列を挿入する挿入処理のうち、行われ
    た修正処理を当該文字画像の認識結果に対する前記修正
    内容として前記記憶手段に記憶させるステップであっ
    て、 前後に並んで切り出された2つの文字画像に対し、前の
    文字画像の認識結果に対しては前記削除処理が行われ、
    後ろの文字画像の認識結果に対しては前記置き換え処理
    が行われた場合、前記記憶ステップは、前記前の文字画
    像の認識結果に対しては、前記後ろの文字画像に対して
    行われた置き換え処理の文字を用いて、前記置き換え処
    理が行われたとして記憶し、前記後ろの文字画像の認識
    結果に対しては、前記削除処理が行われたとして前記記
    憶手段に記憶させるようにし、 前後に並んで切り出された2つの文字画像に対し、前の
    文字画像の認識結果に対しては前記挿入処理が行われ、
    後ろの文字画像の認識結果に対しては前記削除処理が行
    われた場合、前記記憶ステップは、前記前の文字画像の
    認識結果に対しては前記未修正処理として記憶し、前記
    後ろの文字画像の認識結果に対しては前記挿入処理で挿
    入された文字列の1番目の文字を第1位の候補として置
    き換える前記置き換え処理と、前記挿入された文字列の
    2番目以降の文字列の前記挿入処理とが行われたとして
    前記記憶手段に記憶させるようにし、 文字画像の認識結果に対して、前記挿入処理と前記削除
    処理とが行われた場合、前記記憶ステップは、前記挿入
    処理で挿入された文字列の1番目の文字を第1位の候補
    として置き換える前記置き換え処理と、前記挿入された
    文字列の2番目以降の文字列の挿入処理とが行われたと
    して前記記憶手段に記憶させるようにしたことを特徴と
    する請求項6に記載の文字認識方法。
  8. 【請求項8】 前記判断ステップでは、 前記記憶手段に記憶された当該文字画像の認識結果に対
    する修正内容が前記交換処理であった場合、もしくは、
    当該文字画像の認識結果に対する修正内容が前記置き換
    え処理で、且つ当該文字画像の前後の文字画像の認識結
    果に対する修正内容が前記未修正処理又は前記交換処理
    で、且つ当該文字画像及びその前の文字画像の認識結果
    に対する修正内容に前記挿入処理が行われていない場合
    のいずれかを満たしている場合、 前記認識辞書の学習を行うと判断することを特徴とする
    請求項7に記載の文字認識方法。
JP34024992A 1992-12-21 1992-12-21 文字認識装置および文字認識方法 Expired - Fee Related JP3270551B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34024992A JP3270551B2 (ja) 1992-12-21 1992-12-21 文字認識装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34024992A JP3270551B2 (ja) 1992-12-21 1992-12-21 文字認識装置および文字認識方法

Publications (2)

Publication Number Publication Date
JPH06187507A JPH06187507A (ja) 1994-07-08
JP3270551B2 true JP3270551B2 (ja) 2002-04-02

Family

ID=18335133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34024992A Expired - Fee Related JP3270551B2 (ja) 1992-12-21 1992-12-21 文字認識装置および文字認識方法

Country Status (1)

Country Link
JP (1) JP3270551B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4935905B2 (ja) 2007-07-25 2012-05-23 富士通株式会社 文字認識処理方法及び装置

Also Published As

Publication number Publication date
JPH06187507A (ja) 1994-07-08

Similar Documents

Publication Publication Date Title
EP0439951B1 (en) Data processing
US5305396A (en) Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
EP0621553A2 (en) Methods and apparatus for inferring orientation of lines of text
JP2835178B2 (ja) 文書読取装置
JP2000293626A (ja) 文字認識方法及び装置ならびに記憶媒体
EP2138959A1 (en) Word recognizing method and word recognizing program
JP3270551B2 (ja) 文字認識装置および文字認識方法
JPH06215184A (ja) 抽出領域のラベリング装置
JP2002063197A (ja) 検索装置、記録媒体およびプログラム
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JP2870375B2 (ja) 文章訂正装置
JPH06195514A (ja) 文字認識装置
JPH07271921A (ja) 文字認識装置および文字認識方法
JP2886868B2 (ja) 文字認識の後処理方法
JPH0850631A (ja) 文字認識装置
JP2006343797A (ja) 文字認識装置、文字認識方法およびコンピュータプログラム
JP3355289B2 (ja) 文字データの自動校正方法及び装置
JP4261831B2 (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム
JP2002014981A (ja) 文書ファイリング装置
JPH0612520A (ja) 文字認識装置の確認修正方式
JPH01292586A (ja) 文字認識支援装置
JPH0944606A (ja) 文字認識処理方法
JPS61133487A (ja) 文字認識装置
JP2947832B2 (ja) 単語照合方法
JPH11191143A (ja) 情報処理装置及びその方法、コンピュータ可読メモリ

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090118

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090118

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100118

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110118

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120118

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees