JP3416975B2 - 文字認識装置及び認識文字の修正方法 - Google Patents

文字認識装置及び認識文字の修正方法

Info

Publication number
JP3416975B2
JP3416975B2 JP01519393A JP1519393A JP3416975B2 JP 3416975 B2 JP3416975 B2 JP 3416975B2 JP 01519393 A JP01519393 A JP 01519393A JP 1519393 A JP1519393 A JP 1519393A JP 3416975 B2 JP3416975 B2 JP 3416975B2
Authority
JP
Japan
Prior art keywords
character
pattern
characters
rejected
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP01519393A
Other languages
English (en)
Other versions
JPH06231299A (ja
Inventor
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP01519393A priority Critical patent/JP3416975B2/ja
Publication of JPH06231299A publication Critical patent/JPH06231299A/ja
Application granted granted Critical
Publication of JP3416975B2 publication Critical patent/JP3416975B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置による文
字認識処理によって得られた認識文字の修正方法に関す
るものである。
【0002】
【従来の技術】従来の認識文字の修正方法を用いた文字
認識装置について図7に構成図を示す。すなわち、文字
入力部101で文字画像を読み取り、文字認識部102
から出力された認識文字、特徴量、リジェクトコードを
文字パターンの数だけ記憶する。その後、誤認識の可能
性の高い認識文字とその文字パターンを文字コードメモ
リ103と文字パターンメモリ110から読みだし、表
示部104にて操作者に提示し、操作者がこの文字コー
ドを修正するために正しい文字コードを修正情報入力部
106から入力した場合、文字コードメモリ103の内
容をこれに修正し、さらに、特徴量メモリ105中にあ
る着目する文字パターンの特徴量と他の文字パターンの
特徴量との類似度を求め、この類似度が所定値より大き
い場合には操作者が修正を指示しない文字パターンであ
っても、この文字パターンと文字コードを操作者に提示
し、上記で修正された文字コードに修正することを確認
部108で操作者に対して確認し、操作者がこれを許可
したときに上記修正を行うようにする。
【0003】107は照合修正部、109はリジェクト
情報メモリ、111は、文書パターンメモリである。
【0004】
【発明が解決しようとする課題】しかしながら上記の従
来の構成では、誤認識の可能性の高い文字と特徴量が近
い文字を1文字ずつ表示し、確認作業を行う必要がある
ために、作業を効率良くおこなう上で問題があった。本
発明は、この問題を解決した認識文字の修正方法を提供
することを目的とする。
【0005】
【課題を解決するための手段】この課題を解決するため
に本発明は、画像中に含まれる文字について文字認識処
理を行い、当該文字認識処理において、各文字パターン
の座標情報、文字パターンから抽出した特徴量、特徴量
と辞書とを照合して得られた最大類似度の認識候補文字
と当該文字コードのリジェクト情報を出力する文字認識
装置であって、出力された各文字パターンのうち、リジ
ェクトされた文字パターンを設定する手段と、設定され
た文字パターンの特徴量とリジェクトされなかった文字
パターンの特徴量との距離を求める手段と、設定された
文字パターンと距離が所定の値未満であるリジェクト
されなかった文字パターンを設定された文字パターンと
併せて表示させる手段と、置換文字を指定する手段と、
表示された文字パターンを指定された文字に置換する手
段と、を有する。
【0006】
【作用】この構成により、文字認識処理後の認識結果の
修正作業において、リジェクトされた文字パターンを置
換する際、リジェクトされた文字パターンだけでなく、
当該リジェクトされた文字パターンに類似するリジェク
トされなかった文字パターンについても、リジェクトさ
れた文字パターンと併せて一括置換することができる。
【0007】
【0008】
【実施例】図1は本発明を文字認識の場合に適用した一
実施例における文字認識の修正方法を用いた文字認識装
置の機能ブロック図を示す。図1において1は文書を光
電変換して2値化データとして画像メモリ2に記憶させ
る画像入力部、2は画像入力部1からの2値化データを
蓄える画像メモリ、3は上記2値化データに前処理、特
徴抽出、マッチング等の文字認識処理を行い画像メモリ
2における文字パターンを囲む外接矩形の頂点座標、特
徴量、認識候補文字およびリジェクトフラグを出力する
文字認識部、4は外接矩形の頂点座標を記憶する文字矩
形メモリ、5は上記認識候補文字を蓄える候補文字メモ
リ、6はリジェクトフラグが付与された文字を記憶する
ためのリジェクトフラグメモリ、7は特徴量を記憶する
特徴量メモリ、8は画像メモリ2の内容、候補文字メモ
リ5や類似文字メモリ12中の候補文字および修正のた
めのメッセージ等を表示する表示部、9は操作者からの
修正情報を入力する修正情報入力部、10は修正情報に
基づき候補文字メモリ5の内容を正しい文字に書き換え
る修正部、11は特徴量メモリ7中の特徴量同士を照合
する照合部、12は照合部11での照合の結果類似した
文字を記憶するための類似文字メモリである。
【0009】図2は本実施例の認識文字の修正方法を用
いた文字認識装置の構成を示すブロック図である。ここ
で21は文書を読み取るイメージスキャナであり読み取
った文書をビットデータにして出力する。22はランダ
ム・アクセス・メモリ(以下、RAM)であり画像メモ
リ2、文字矩形メモリ4、候補文字メモリ5、リジェク
トフラグメモリ6、特徴量メモリ7、類似文字メモリ1
2、処理で使用する作業用メモリ30を有している。2
3はリード・オンリー・メモリ(以下、ROM)であり
特徴量とこれに対応する文字コードを記憶した辞書領域
31、及び図3(a)、(b)に示すフローチャートに
従った制御プログラムを記憶したプログラム記憶領域3
2を有する。24はプログラム記憶領域32に記憶され
た制御プログラムに従って処理を行う処理回路である。
25はデータを入力するキーボードであり、8は表示部
である。
【0010】以上のように構成された本実施例の認識文
字の修正方法について、図3のフローチャートに従って
説明する。
【0011】文字認識部3により文字領域の認識処理が
終了した時点で、ステップS1以下の処理を行う。
【0012】ステップS1のカウンタiは文字領域に含
まれる文字の並び順を示す文字番号である。まず、iに
初期値1をセットする。
【0013】ステップS2ではi番目の文字に対して修
正処理を行うかどうかをリジェクトフラグR[i]を参
照して判定する。R[i]は文字認識部3によって値が
代入される。たとえば、第1候補文字の距離、第1候補
文字と第2候補文字との距離の差、第1候補文字が誤読
の発生する傾向が強い特定の文字(「夕」と「タ」な
ど)であるとき、などは認識文字(第1候補文字)が誤
読である可能性が高い。このようなときにリジェクトフ
ラグメモリ6中のリジェクトフラグR[i]に1が、そ
れ以外のときは0が代入される。
【0014】リジェクトフラグR[i]が1のとき、す
なわちi番目の文字が誤読の可能性が高いときはステッ
プS24へ、R[i]が0のときはステップS20へ進
む。
【0015】ステップS24で、i番目の文字パターン
を表示部8に表示する。ステップS3で、カウンタkは
i番目の文字の特徴と似ている文字の番号である。似て
いる尺度としてたとえばシティブロック距離を用いるこ
とができ、これはステップS5で計算する。
【0016】ステップS4で、jにi+1を代入する。
ステップS5では前述したようにi番目の文字の特徴F
[I]とj番目の文字の特徴F[j]との距離を計算す
る。
【0017】ステップS6で、ステップS5で求めた距
離が所定の値より小さいときはj番目の文字がi番目の
文字と類似していると判断してステップS7に進み、そ
れ以外のときはステップS11に進む。
【0018】ステップS7で、kの値を1だけ増加させ
る。ステップS8で、類似文字メモリ12中のN[k]
に類似文字の番号jを記憶する。
【0019】ステップS9では、上記の距離をD[k]
に代入する。ステップS10では、座標P[N[k]]
で囲まれる類似文字の文字パターンを表示部8に表示す
る。このとき、ステップS24で表示した文字パターン
と重ならないように文字パターンの幅より幾分大きめの
ドット数だけ所定の方向(ここでは右方向)にずらして
表示する。
【0020】ステップS11で、認識した文字のすべて
に対して処理が終了したのかを調べる。終了であればス
テップS12へ、そうでなければS22へ進む。
【0021】ステップS22は文字番号jに1を加算し
て、その後でステップS5に戻る。ステップS12の時
点では、文字認識部3から出力されたすべての文字に対
して、i番目の文字との距離が小さい文字の番号jが類
似文字メモリ12のN[k]にセットされている。N
[k]にセットされた番号の文字はステップS13以降
で一括して修正するが、その前に修正対象から除外した
い文字があればこれを指定する。すなわち、修正情報入
力部9から除外したい文字の番号を入力すれば、この番
号kに対応するN[k]の値を0に書き換える。
【0022】ステップS25では、N[k]が指す矩形
領域P[N[k]]で囲まれる文字パターンを表示部8
から消去する。
【0023】ステップS13で、正しい文字を修正情報
入力部9から入力する。ステップS14で、カウンタj
に1をセットする。
【0024】ステップS15で、N[j]が0、すなわ
ち修正対象から除外したい文字であればステップS18
へ進み、それ以外はステップS16に進む。
【0025】ステップS16では、候補文字メモリ5中
の候補文字C[N[j]]にステップS13で入力した
文字をセットする。
【0026】ステップS17では、リジェクトフラグメ
モリ6中のリジェクトフラグR[j]に0をセットす
る。これは一度修正した文字を重複して処理しないため
である。
【0027】ステップS18では、ステップS15から
ステップS17までの修正処理を類似文字の総数k分だ
け繰り返すように反復回数を制御するための判定を行
い、反復を繰り返すときはステップS23に進み、それ
以外はステップS19に進む。
【0028】ステップS23ではjに1を加算する。ス
テップS19ではリジェクトフラグR[i]に0をセッ
トし、ステップS20に戻る。
【0029】ステップS20では修正中の文字の番号が
認識文字の総数以上であれば処理を終了し、未満であれ
ばステップS21に進む。
【0030】ステップS21でiに1を加算する。次に
認識例題文字列「生むぎ生ごめ生たまご」を用いて具体
的に説明する。
【0031】当該文字列を「生むぎ王ごめ王たまご」と
認識し、1番目と7番目の文字がリジェクトされたとす
る(図4(a)参照)。
【0032】まず、1番目の文字がリジェクトされるこ
とを検出し(R[1]=1)、この文字の特徴F[1]
と2番目以降の文字の特徴との距離を計算し、しきい値
未満の文字を決定する。1、4、7、9番目の文字がこ
の条件を満たすものとすると、図4(b)のように類似
文字メモリ12にその順番が記憶される。
【0033】次に、1番目の文字としきい値未満の文字
に対する文字パターンと候補文字を表示する。表示すべ
き候補文字は該当する文字のそれぞれの候補文字をすべ
て表示してもよく、頻度が高い順番に表示してもよい。
このときの表示部8の一例を図6(a)に示す。4つの
文字パターンは「生」、「生」、「生」、「ま」であ
り、候補文字は「生」、「王」、「舌」、「牛」であ
る。
【0034】次に、修正したくない文字があればこれを
類似文字メモリ12から除外する。例題では文字パター
ン「ま」を除外の対象とし、これを修正情報入力部9か
ら指示することにより、類似文字メモリ12のK=4に
0が書き込まれ(図5(b))、表示部8には図6
(b)のように「ま」の文字パターンが消去され対象か
ら除外されたことが示される。
【0035】最後に、候補文字の中から正解(「生」)
を選んで入力することにより、図5(a)のように候補
文字メモリ5中のK=1、4、7の候補文字がすべて
「生」に書き換えられる。
【0036】以上のように本実施例によれば、誤認識の
可能性の高い文字パターンとこれに距離が近い文字パタ
ーンを表示し、操作者が正しい文字を選択あるいは文字
コードを入力すれば、これらの文字パターンに対応する
認識文字を一括して正解の文字コードに自動的に修正す
ることができるために、従来の方法と比べて操作回数が
非常に小さくて済むために修正作業が効率よく行える。
【0037】
【発明の効果】以上のように本発明によれば、画像中に
含まれる文字について文字認識処理を行い、当該文字認
識処理において、各文字パターンの座標情報、文字パタ
ーンから抽出した特徴量、特徴量と辞書とを照合して得
られた最大類似度の認識候補文字と当該文字コードのリ
ジェクト情報を出力する文字認識装置であって、出力さ
れた各文字パターンのうち、リジェクトされた文字パタ
ーンを設定する手段と、設定された文字パターンの特徴
量とリジェクトされなかった文字パターンの特徴量との
距離を求める手段と、設定された文字パターンとの距離
が所定の値未満であるリジェクトされなかった文字パタ
ーンを設定された文字パターンと併せて表示させる手段
と、置換文字を指定する手段と、表示された文字パター
ンを指定された文字に置換する手段と、を有する構成と
したことにより、文字認識処理後の認識結果の修正作業
において、リジェクトされた文字パターンを置換する
際、リジェクトされた文字パターンだけでなく、当該リ
ジェクトされた文字パターンに類似するリジェクトされ
なかった文字パターンについても、リジェクトされた文
字パターンと併せて一括置換することができ、認識結果
を修正する操作者の負担が軽減される。
【図面の簡単な説明】
【図1】本発明の一実施例における認識文字の修正方法
を用いた文字認識装置の機能ブロック図
【図2】本実施例における認識文字の修正方法を用いた
文字認識装置のブロック図
【図3】本実施例の処理の流れを説明するフローチャー
【図4】本実施例における認識結果の例を示す図
【図5】本実施例における認識結果の例を示す図
【図6】本実施例における画面への表示例を示す図
【図7】従来の認識文字の修正方法を用いた文字認識装
置の構成図
【符号の説明】
1 画像入力部 2 画像メモリ 3 文字認識部 4 文字矩形メモリ 5 候補文字メモリ 6 リジェクトフラグメモリ 7 特徴量メモリ 8 表示部 9 修正情報入力部 10 修正部 11 照合部 12 類似文字メモリ

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】画像中に含まれる文字について文字認識処
    理を行い、当該文字認識処理において、各文字パターン
    の座標情報、文字パターンから抽出した特徴量、特徴量
    と辞書とを照合して得られた最大類似度の認識候補文字
    と当該文字コードのリジェクト情報を出力する文字認識
    装置であって、 出力された各文字パターンのうち、リジェクトされた文
    字パターンを設定する手段と、 設定された文字パターンの特徴量とリジェクトされなか
    った文字パターンの特徴量との距離を求める手段と、 設定された文字パターンと距離が所定の値未満である
    リジェクトされなかった文字パターンを設定された文字
    パターンと併せて表示させる手段と 換文字を指定する手段と、 表示された文字パターンを指定された文字に置換する手
    段と、を有することを特徴とする文字認識装置。
  2. 【請求項2】置換された文字のリジェクト情報を解除す
    る手段を有することを特徴とする請求項1記載の文字認
    識装置。
  3. 【請求項3】画像中に含まれる文字について文字認識処
    理を行い、当該文字認識処理において、各文字パターン
    の座標情報、文字パターンから抽出した特徴量、特徴量
    と辞書とを照合して得られた最大類似度の認識候補文字
    と当該文字コードのリジェクト情報を出力する文字認識
    装置における認識文字の修正方法であって、 出力された各文字パターンのうち、リジェクトされた文
    字パターンを設定し、 設定された文字パターンの特徴量とリジェクトされなか
    った文字パターンの特徴量との距離を求め、 設定された文字パターンと距離が所定の値未満である
    リジェクトされなかった文字パターンを設定された文字
    パターンと併せて表示させ 換文字指定されると、 表示された文字パターンを指定された文字に置換する、
    ように制御することを特徴とする認識文字の修正方法。
JP01519393A 1993-02-02 1993-02-02 文字認識装置及び認識文字の修正方法 Expired - Lifetime JP3416975B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01519393A JP3416975B2 (ja) 1993-02-02 1993-02-02 文字認識装置及び認識文字の修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01519393A JP3416975B2 (ja) 1993-02-02 1993-02-02 文字認識装置及び認識文字の修正方法

Publications (2)

Publication Number Publication Date
JPH06231299A JPH06231299A (ja) 1994-08-19
JP3416975B2 true JP3416975B2 (ja) 2003-06-16

Family

ID=11882025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01519393A Expired - Lifetime JP3416975B2 (ja) 1993-02-02 1993-02-02 文字認識装置及び認識文字の修正方法

Country Status (1)

Country Link
JP (1) JP3416975B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6075158B2 (ja) * 2013-03-29 2017-02-08 富士通株式会社 文字入力支援プログラムおよび文字入力支援装置

Also Published As

Publication number Publication date
JPH06231299A (ja) 1994-08-19

Similar Documents

Publication Publication Date Title
EP0439951B1 (en) Data processing
US5394484A (en) Image recognition apparatus
US5802204A (en) Handwritten character translator using fuzzy logic
JPS59136875A (ja) パタ−ン識別装置
JP2007058882A (ja) パターン認識装置
JP3416975B2 (ja) 文字認識装置及び認識文字の修正方法
CN112183525A (zh) 一种文本识别模型的构建及文本识别方法和装置
JPH0721303A (ja) 文字認識装置
JPH0573709A (ja) 認識文字の修正方法
JP3270551B2 (ja) 文字認識装置および文字認識方法
KR102583160B1 (ko) X-ray 이미지의 노듈위치 결정방법
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JP3037727B2 (ja) Ocrシステム
JPH0612520A (ja) 文字認識装置の確認修正方式
JP3486246B2 (ja) 文字認識装置
JP2624558B2 (ja) 文字認識装置
JP2976990B2 (ja) 文字認識装置
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
CN115577727A (zh) 手持扫码终端的扫码改进方法及装置
JPS6252911B2 (ja)
JPH04268684A (ja) 認識文字の修正方法
JP3277977B2 (ja) 文字認識方法
JPH03222074A (ja) 画像処理用ラベル付け装置
JP2023003647A (ja) 情報処理装置、及び、プログラム
JPH0749924A (ja) 手書き文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080411

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090411

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100411

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110411

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120411

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130411

Year of fee payment: 10

EXPY Cancellation because of completion of term