JPH0573709A - 認識文字の修正方法 - Google Patents

認識文字の修正方法

Info

Publication number
JPH0573709A
JPH0573709A JP3236678A JP23667891A JPH0573709A JP H0573709 A JPH0573709 A JP H0573709A JP 3236678 A JP3236678 A JP 3236678A JP 23667891 A JP23667891 A JP 23667891A JP H0573709 A JPH0573709 A JP H0573709A
Authority
JP
Japan
Prior art keywords
character
memory
pattern
code
feature quantity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3236678A
Other languages
English (en)
Inventor
Tamotsu Maeda
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3236678A priority Critical patent/JPH0573709A/ja
Publication of JPH0573709A publication Critical patent/JPH0573709A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】認識文字を少ないメモリ容量と作業量で効率良
く修正する。 【構成】文字認識部3から文書パターンメモリ2の文字
パターン領域の座標、特徴量、認識された文字パターン
の文字コードおよびリジェクトコードが出力され、誤認
識の可能性の高い特徴量は特徴量圧縮部7で圧縮されて
特徴量メモリ8に蓄えられる。この文字コードを修正す
るために修正情報入力部10に正しい文字コードが入力さ
れ候補文字メモリ4中の文字コードをこれに置換したと
きに、前者の文字モードに対応する文字パターンの圧縮
した特徴量と別に記憶している特徴量とをマッチング部
11で比較し、その間の類似度が所定値より大きい場合は
上記別の特徴量の情報をもつ他の文字パターンの文字コ
ードを操作者に知らせ、正解の文字コードに自動的に修
正できるようにする。 【効果】特徴量を圧縮して保存するので、メモリ容量を
節約でき、類似度計算の演算量も軽減できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字パターンを読み取
って、その文字パターンから文字の認識を行う際の認識
文字の修正方法に関するものである。
【0002】
【従来の技術】従来の認識文字の修正方式について図6
にその構成例を示す。図6において、文字入力部41から
2値化入力された文字パターン列に対して文字認識部42
で文字切り出し、特徴抽出および文字認識処理を行い、
文字コードを文字コードメモリ43に出力する。表示部14
は文字コードメモリ43の内容を表示する。操作者は表示
部44を見て、誤って認識した文字があれば、これを修正
するための作業に入る。このとき、誤認識文字の文字コ
ードメモリ43における先頭番地からの順番N(N番目の
文字が誤ったという情報)と修正すべき正解の文字コー
ドCを修正情報入力部45から入力する。修正部46では文
字コードメモリ43内のN番目の文字コードをCに修正す
る。
【0003】
【発明が解決しようとする課題】しかしながら上記の従
来の構成では、誤認識文字に関する情報として文字コー
ドメモリ43における順番しか入力しないから、1回の操
作で1箇所の文字しか修正できない。文字入力部41から
読み込んだ文字パターン列内の同一の文字パターンが複
数箇所に存在する場合には、同様の誤認識文字が発生し
やすい傾向があるが、この場合でも誤認識文字の数だけ
修正情報を入力しなければならず使いにくいという問題
を有していた。
【0004】そこで、この問題を解決するために、本発
明者はさきに新しい認識文字の修正方法を特願平3-1016
87号において提案した。これは、ある文字パターンに対
して読みだされた文字コードが誤認識の可能性の高い場
合、この文字パターンと文字コードを操作者に提示し、
操作者がこの文字コードを修正するための文字コードを
入力した場合にこれを修正する。さらに、着目している
文字パターンの特徴量と他の文字パターンの特徴量を比
較し、この類似度が所定値より大きい場合には、この他
の文字パターンと文字コードを操作者に提示し、この提
示された文字コードに修正することを操作者に対して確
認し、操作者がこれを許可したときに上記修正を行うよ
うにするものである。
【0005】しかしながらこの構成では、すべての文字
について特徴量をメモリに記憶しておかねばならないた
めに大きなメモリ容量が必要であり、また誤認識の可能
性の低い文字でも一律に類似度演算を行うために処理時
間が長くかかるという問題を有していた。
【0006】本発明はこれらの問題を解決するもので、
従来の方法より少ないメモリ容量で、かつ少ない計算量
で認識文字を修正できる方法を提供するものである。
【0007】
【課題を解決するための手段】上記課題を解決するため
に、本発明の認識文字の修正方法は、原文字パターンか
ら抽出された特徴量を圧縮して記憶し、この特徴を特徴
量同士の類似度計算に利用するようにしたものである。
【0008】
【作用】上記構成により、特徴量を圧縮して保存するの
で、メモリ容量を節約でき、かつ類似度計算の演算量も
軽減でき、このために、従来の方法とほぼ同等の修正が
より少ないコストで、かつ高速に実現できる。
【0009】
【実施例】以下本発明の一実施例を図面に基づいて説明
する。図1は本発明の一実施例における認識文字の修正
方法を説明するためのブロック図を示す。図1におい
て、1は文書を光電変換して2値化データとして文書パ
ターンメモリ2に記憶させる画像入力部、3は上記2値
化データに前処理、特徴抽出、マッチングなどの文字認
識処理を行い、文書パターンメモリ2における文字パタ
ーンの領域の座標、特徴量、認識された文字パターンに
対応する文字コードおよびリジェクトコードを出力する
文字認識部、4は文字認識部3で認識された文字パター
ンに対応する文字コードを蓄える候補文字メモリ、5は
文書パターンメモリ2の内容、候補文字メモリ4中の候
補文字コードおよび確認部6からの修正の確認のメッセ
ージなどを表示する表示部、7は文字認識部3からの特
徴量圧縮する特徴圧縮部、8は特徴圧縮部7で圧縮した
特徴量を記憶する特徴量メモリ、9は文字認識部3から
のリジェクトコードと文字パターン領域の座標の情報を
蓄えるリジェクト情報メモリ、10は操作者からの修正情
報を入力する修正情報入力部、11は特徴量メモリ8に記
憶された特徴量同士を照合するマッチング部、12は確認
部6で操作者が修正を了承した場合にマッチング部11を
制御したり候補文字メモリ4の内容を修正する制御部で
あり、この制御部12はリジェクト情報メモリ9を参照
し、リジェクト情報メモリ9に記憶されている座標で表
わされる文字パターンと、候補文字メモリ4中の文字コ
ードと、この文字を修正するか否かのメッセージを表示
部5に表示し、操作者がこの文字コードを修正するため
に修正情報入力部10に正しい文字コードを入力し確認部
6で修正を許可した場合に、候補文字メモリ4中の文字
コードをこれに置換し、さらに操作者が上記のように文
字コードを他の文字コードに修正したときに、前者の文
字コードに対応する文字パターンの特徴量メモリ8で記
憶している圧縮した特徴量と、特徴量メモリ8で記憶し
ている圧縮した別の特徴量とをマッチング部11で比較
し、上記両特徴量間の類似度が所定値より大きい場合、
操作者が上記のように修正を指示しない文字パターンで
あっても、上記別の特徴量の情報をもつ文字パターンに
対応する文字コードを操作者が修正して上記他の文字コ
ードに更新することを操作者に対して知らせ、操作者が
確認部6でこれを確認したときに、修正ができるように
制御する。
【0010】図2は本実施例の認識文字の修正方法にお
ける機能ブロック図を示す。図2において、21は文書を
読み取るイメージスキャナであり、読み取った文書をビ
ットデータにして出力する。22はRAMであり、イメー
ジスキャナ21からのビットデータを記憶する文書パター
ンメモリ2、認識文字パターンに対応する文字コードを
記憶する候補文字メモリ4、候補文字メモリ4内の文字
コードのうち誤認識の可能性の高い文字パターンの特徴
量を圧縮して記憶する特徴量メモリ8、リジェクトに関
する情報を記憶するリジェクト情報メモリ9、操作者か
らの誤認識文字パターンに対する修正情報を記憶する修
正情報領域26、処理で使用するレジスタ領域27を有して
いる。23はROMであり、特徴量とこれに対応する文字
コードを記憶する辞書領域28、および図3、図4に示す
フローチャートにしたがった制御プログラムを記憶する
プログラム記憶領域29を有する。24はプログラム記憶領
域29に記憶された制御プログラムにしたがって処理を行
う処理回路である。25はデータを入力するキーボード、
5は表示部である。
【0011】このように構成された本実施例の認識文字
の修正方法について、修正のための前処理を図3に、実
際の修正処理を図4のフローチャートにしたがって説明
する。
【0012】まず修正のための前処理について説明す
る。図3において、ステップS10でレジスタ領域27内
のカウンタi を初期化する。ステップS11で画像入力部
1により文書を光電変換して入力した2値化データに、
ノイズの除去、文字切り出しなどの前処理を行うことに
より文書パターンメモリ2における文字パターンの領域
を決定する。ステップS12では認識すべき入力文字パタ
ーンがないときはステップS19に進み、あるときはステ
ップS13で特徴抽出、マッチングなどの文字認識処理を
行う。ステップS14ではステップS13で抽出された特徴
量を圧縮する。圧縮方法はいろいろ考えられるが、たと
えば、文字パターンを分割し特徴を抽出する場合には分
割数を粗くする方法、文字ごとに安定なセルを指定する
方法などがある。
【0013】ステップS15では圧縮した特徴量を特徴量
メモリ8のc[i]領域に記憶し、ステップS16でリジ
ェクト情報メモリ9のb[i]とd[i]の領域にそれ
ぞれ文字認識部3からのリジェクトコードと文書パター
ンメモリ2における文字パターンの領域の座標を記憶す
る。リジェクトコードはリジェクト時1、それ以外0と
決める。次に、ステップS17で認識文字パターンの文字
コードを候補文字メモリ4のa[i]領域に記憶する。
最後にステップS18でiの値をひとつ増加し、ステップ
S12に戻る。以上の処理を最後の文字パターンまで繰り
返す。表示部5には文書パターンメモリ2の内容、候補
文字メモリ4内の文字コード、またはこれに対応する文
字フォントを表示する。すべての文字パターンで処理を
終えたらステップS19で候補文字の最後を示すために、
a[i]に0を記憶させる。
【0014】次に実際の修正処理について説明する。図
4において、まず、ステップS20でレジスタ領域27内の
カウンタjに1を記憶させる。ステップS21で候補文字
メモリ4内に記憶されたa[j]の内容を参照し、a
[j]=0の場合は修正すべきリジェクト文字が残って
いないので処理を終了する。a[j]≠0の場合にはス
テップS22に進む。ステップS22ではj番目の文字がリ
ジェクトされたかを判断する。すなわち、b[j]=1
ならばリジェクトされた文字なのでステップS23に進
み、b[j]≠1ならばリジェクトされなかった文字な
のでステップS35に戻る。ステップS23で操作者にリジ
ェクト情報メモリ9内のd[j]が指す位置の文字パタ
ーンと文字コードa[j]を表示部5に表示する。ステ
ップS24では、表示された文字コードを他の文字コード
に修正する場合にはステップS25に、しない場合にはス
テップS35に進む。ステップS25で候補文字コードa
[j]を操作者が入力した文字に置き換える。
【0015】ステップS26でレジスタ領域27内のカウン
タkにj+1を記憶させ、ステップS27に進む。ステッ
プS27で候補文字メモリ4に候補文字が残っているかを
参照し、残っている場合はステップS28に、それ以外の
場合はステップS35に進む。ステップS35ではjの値を
ひとつ増加してステップS21に戻る。ステップS28では
k番目の文字がリジェクトされたか、あるいはリジェク
トされてもすでに修正が済んでいるかどうかを調べ、修
正の必要がない場合はステップS33にとび、必要がある
ときはステップS29に進む。
【0016】ステップS29で特徴量メモリ8内のj番目
の文字の情報量c[j]とk番目の文字の特徴量c
[k]の類似度を計算し、類似度があらかじめ定めたし
きい値より大きいか否を判断する。大きい場合にはステ
ップS30に、それ以外の場合はステップS33に進む。ス
テップS30で操作者に文字パターンと候補文字コードを
表示し、ステップS31で操作者に対し修正して良いか否
かを確認し、修正が許可されるときにステップS32に、
許可されなければステップS33に進む。ステップS32で
は候補文字メモリ4内の文字コードa[k]を修正し、
ステップS34に進む。ステップ34ではb[k]に修正済
みを示す0を記憶させる。ステップS33でkをひとつ増
加し、ステップS27に戻る。
【0017】次に、図5の認識例題文字列パターン「あ
かいあさがお」を例に、その動作を説明する。まず、画
像入力部1で、認識対象文字列パターンを2値画像とし
て文書パターンメモリ2に記憶する。次に文字認識部3
で、文書パターンメモリ2に記憶された画像にノイズの
除去、文字切り出しなどの処理をして切り出したi番目
の文字パターンに対し、特徴抽出および文字認識処理を
行い、文字コードを候補文字メモリ4のa[i]領域に
文字パターンの並び順に記憶する。文字認識部3がi番
目の文字をリジェクトした場合、特徴量メモリ8のc
[i]領域に特徴量圧縮部7で圧縮した特徴量を記憶
し、リジェクトコードと文書パターンにおける文字パタ
ーンの座標をそれぞれリジェクト情報メモリ9のb
[i]とd[i]の領域に記憶する。以上の処理を最後
の文字パターンまで繰り返す。図5のように認識例題文
字列パターン「あかいあさがお」を「おかいあさがお」
と誤認識し、i=1,4,7番目の文字がリジェクトさ
れた場合の候補文字メモリ4、リジェクト情報メモリ9
および特徴量メモリ8の内容はそれぞれ図5に示すよう
になる。
【0018】制御部12はリジェクト情報メモリ9を参照
し、このリジェクト情報メモリ9に記憶されている座標
d[l]で示される位置の文字パターンと、候補文字メ
モリ4中の文字コードa[l]と、この文字を修正する
か否かのメッセージを表示部5に表示する。修正情報入
力部10から修正すべき文字コード‘あ’が入力され、確
認部6で修正が許可された場合は、候補文字メモリ4中
の文字コードa[l]をこれに置換する。また、特徴量
c[l]とそれ以外のリジェクトコードb[i]=1な
る文字同士の特徴量c[4]やc[7]間の類似度を計
算する。特徴量メモリ8内のc[1]番目とc[4]番
目の特徴量間の類似度を計算し、類似度があらかじめ定
めたしきい値より大きいか否かを判断する。類似度が大
きい場合には修正するか否かのメッセージを表示部5に
提示し、操作者がこれを修正することを了承した場合
に、候補文字メモリ4内の文字コードa[4]をC=
‘あ’に修正する。類似度が小さい場合は次にc[1]
とc[7]を照合する。このようにして候補文字メモリ
4の文字コードは書き換えられる。
【0019】以上のように本実施例によれば、特徴量圧
縮部7を設けることにより、従来より少ない特徴量でマ
ッチング計算を行うから、メモリ容量と演算量が少なく
てすむようになり、コストパフォーマンスの高い認識文
字の修正作業が実現できる。
【0020】
【発明の効果】以上のように本発明によれば、提示され
た誤認識の可能性の高い文字に対し、操作者が正しい文
字コードを入力すれば、他の文字についても誤認識文字
を正解の文字コードに自動的に修正することができ、か
つ従来の方法よりも少ないメモリ容量で、かつ少ない計
算量で認識文字を修正できる、マン・マシン・インター
フェースに優れた認識文字の修正を行うことができる。
【図面の簡単な説明】
【図1】本発明の一実施例における認識文字の修正方法
を説明するためのブロック図である。
【図2】本発明の一実施例の認識文字の修正方法におけ
る機能ブロック図である。
【図3】本発明の一実施例における前処理の流れを説明
するフローチャートである。
【図4】本発明の一実施例における実際の修正処理を説
明するフローチャートである。
【図5】本発明の認識例題文字列パターンを例にその動
作を説明する図である。
【図6】従来の認識文字の修正方法を説明するための図
である。
【符号の説明】
1 画像入力部 2 文書パターンメモリ 3 文字認識部 4 候補文字メモリ 5 表示部 6 確認部 7 特徴量圧縮部 8 特徴量メモリ 9 リジェクト情報メモリ 10 修正情報入力部 11 マッチング部 12 制御部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 認識すべき文字パターンを読み取り、上
    記文字パターンの特徴量を抽出し、抽出された上記特徴
    量を辞書との比較などの処理を行い、各パターンの文字
    コードならびにリジェクトコードを読みだしてその文字
    コードを記憶し、読みだされた文字コードについて、そ
    の特徴量を圧縮した情報と修正に要する情報を記憶し、
    上記修正に要する情報にもとづき、操作者が上記文字コ
    ードを他の文字コードに修正したときに、前者の文字コ
    ードに対応する文字パターンの圧縮した特徴量と、記憶
    している圧縮した別の特徴量とを比較し、上記両特徴量
    間の類似度が所定値より大きい場合、上記別の特徴量の
    情報をもつ文字パターンに対応する文字コードを操作者
    が修正して上記他の文字コードに更新することを操作者
    に対して知らせ、操作者がこれを確認したときに上記修
    正を行うことを特徴とする認識文字の修正方法。
JP3236678A 1991-09-18 1991-09-18 認識文字の修正方法 Pending JPH0573709A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3236678A JPH0573709A (ja) 1991-09-18 1991-09-18 認識文字の修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3236678A JPH0573709A (ja) 1991-09-18 1991-09-18 認識文字の修正方法

Publications (1)

Publication Number Publication Date
JPH0573709A true JPH0573709A (ja) 1993-03-26

Family

ID=17004163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3236678A Pending JPH0573709A (ja) 1991-09-18 1991-09-18 認識文字の修正方法

Country Status (1)

Country Link
JP (1) JPH0573709A (ja)

Similar Documents

Publication Publication Date Title
US5394484A (en) Image recognition apparatus
JPH0573709A (ja) 認識文字の修正方法
CN115601778A (zh) 基于图像识别的作业批改方法、装置、设备及存储介质
US7016535B2 (en) Pattern identification apparatus, pattern identification method, and pattern identification program
JP3416975B2 (ja) 文字認識装置及び認識文字の修正方法
KR950001061B1 (ko) 문서인식 수정장치
JP3221968B2 (ja) 文字認識装置
JPH0721303A (ja) 文字認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH0331981A (ja) 文字認識装置
JPH05151384A (ja) 認識文字の修正方法
JP3037727B2 (ja) Ocrシステム
JPH0850631A (ja) 文字認識装置
JPS594358Y2 (ja) 文字修正における文字制御装置
JPH02220186A (ja) 文字読取装置
JPH0612520A (ja) 文字認識装置の確認修正方式
JP3481850B2 (ja) 文字認識装置
JP2954218B2 (ja) 画像処理方法及び装置
JPH04268684A (ja) 認識文字の修正方法
JPH07192079A (ja) 文字認識装置
JPH04138583A (ja) 文字認識装置
JPH06337966A (ja) 文字認識装置
JPH07210623A (ja) 文書画像処理装置
JPH0318987A (ja) 辞書登録方法
JPH09185682A (ja) 文字認識装置