JP3416975B2 - 文字認識装置及び認識文字の修正方法 - Google Patents
文字認識装置及び認識文字の修正方法Info
- Publication number
- JP3416975B2 JP3416975B2 JP01519393A JP1519393A JP3416975B2 JP 3416975 B2 JP3416975 B2 JP 3416975B2 JP 01519393 A JP01519393 A JP 01519393A JP 1519393 A JP1519393 A JP 1519393A JP 3416975 B2 JP3416975 B2 JP 3416975B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- characters
- rejected
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
字認識処理によって得られた認識文字の修正方法に関す
るものである。
認識装置について図7に構成図を示す。すなわち、文字
入力部101で文字画像を読み取り、文字認識部102
から出力された認識文字、特徴量、リジェクトコードを
文字パターンの数だけ記憶する。その後、誤認識の可能
性の高い認識文字とその文字パターンを文字コードメモ
リ103と文字パターンメモリ110から読みだし、表
示部104にて操作者に提示し、操作者がこの文字コー
ドを修正するために正しい文字コードを修正情報入力部
106から入力した場合、文字コードメモリ103の内
容をこれに修正し、さらに、特徴量メモリ105中にあ
る着目する文字パターンの特徴量と他の文字パターンの
特徴量との類似度を求め、この類似度が所定値より大き
い場合には操作者が修正を指示しない文字パターンであ
っても、この文字パターンと文字コードを操作者に提示
し、上記で修正された文字コードに修正することを確認
部108で操作者に対して確認し、操作者がこれを許可
したときに上記修正を行うようにする。
情報メモリ、111は、文書パターンメモリである。
来の構成では、誤認識の可能性の高い文字と特徴量が近
い文字を1文字ずつ表示し、確認作業を行う必要がある
ために、作業を効率良くおこなう上で問題があった。本
発明は、この問題を解決した認識文字の修正方法を提供
することを目的とする。
に本発明は、画像中に含まれる文字について文字認識処
理を行い、当該文字認識処理において、各文字パターン
の座標情報、文字パターンから抽出した特徴量、特徴量
と辞書とを照合して得られた最大類似度の認識候補文字
と当該文字コードのリジェクト情報を出力する文字認識
装置であって、出力された各文字パターンのうち、リジ
ェクトされた文字パターンを設定する手段と、設定され
た文字パターンの特徴量とリジェクトされなかった文字
パターンの特徴量との距離を求める手段と、設定された
文字パターンとの距離が所定の値未満であるリジェクト
されなかった文字パターンを設定された文字パターンと
併せて表示させる手段と、置換文字を指定する手段と、
表示された文字パターンを指定された文字に置換する手
段と、を有する。
修正作業において、リジェクトされた文字パターンを置
換する際、リジェクトされた文字パターンだけでなく、
当該リジェクトされた文字パターンに類似するリジェク
トされなかった文字パターンについても、リジェクトさ
れた文字パターンと併せて一括置換することができる。
実施例における文字認識の修正方法を用いた文字認識装
置の機能ブロック図を示す。図1において1は文書を光
電変換して2値化データとして画像メモリ2に記憶させ
る画像入力部、2は画像入力部1からの2値化データを
蓄える画像メモリ、3は上記2値化データに前処理、特
徴抽出、マッチング等の文字認識処理を行い画像メモリ
2における文字パターンを囲む外接矩形の頂点座標、特
徴量、認識候補文字およびリジェクトフラグを出力する
文字認識部、4は外接矩形の頂点座標を記憶する文字矩
形メモリ、5は上記認識候補文字を蓄える候補文字メモ
リ、6はリジェクトフラグが付与された文字を記憶する
ためのリジェクトフラグメモリ、7は特徴量を記憶する
特徴量メモリ、8は画像メモリ2の内容、候補文字メモ
リ5や類似文字メモリ12中の候補文字および修正のた
めのメッセージ等を表示する表示部、9は操作者からの
修正情報を入力する修正情報入力部、10は修正情報に
基づき候補文字メモリ5の内容を正しい文字に書き換え
る修正部、11は特徴量メモリ7中の特徴量同士を照合
する照合部、12は照合部11での照合の結果類似した
文字を記憶するための類似文字メモリである。
いた文字認識装置の構成を示すブロック図である。ここ
で21は文書を読み取るイメージスキャナであり読み取
った文書をビットデータにして出力する。22はランダ
ム・アクセス・メモリ(以下、RAM)であり画像メモ
リ2、文字矩形メモリ4、候補文字メモリ5、リジェク
トフラグメモリ6、特徴量メモリ7、類似文字メモリ1
2、処理で使用する作業用メモリ30を有している。2
3はリード・オンリー・メモリ(以下、ROM)であり
特徴量とこれに対応する文字コードを記憶した辞書領域
31、及び図3(a)、(b)に示すフローチャートに
従った制御プログラムを記憶したプログラム記憶領域3
2を有する。24はプログラム記憶領域32に記憶され
た制御プログラムに従って処理を行う処理回路である。
25はデータを入力するキーボードであり、8は表示部
である。
字の修正方法について、図3のフローチャートに従って
説明する。
終了した時点で、ステップS1以下の処理を行う。
まれる文字の並び順を示す文字番号である。まず、iに
初期値1をセットする。
正処理を行うかどうかをリジェクトフラグR[i]を参
照して判定する。R[i]は文字認識部3によって値が
代入される。たとえば、第1候補文字の距離、第1候補
文字と第2候補文字との距離の差、第1候補文字が誤読
の発生する傾向が強い特定の文字(「夕」と「タ」な
ど)であるとき、などは認識文字(第1候補文字)が誤
読である可能性が高い。このようなときにリジェクトフ
ラグメモリ6中のリジェクトフラグR[i]に1が、そ
れ以外のときは0が代入される。
なわちi番目の文字が誤読の可能性が高いときはステッ
プS24へ、R[i]が0のときはステップS20へ進
む。
を表示部8に表示する。ステップS3で、カウンタkは
i番目の文字の特徴と似ている文字の番号である。似て
いる尺度としてたとえばシティブロック距離を用いるこ
とができ、これはステップS5で計算する。
ステップS5では前述したようにi番目の文字の特徴F
[I]とj番目の文字の特徴F[j]との距離を計算す
る。
離が所定の値より小さいときはj番目の文字がi番目の
文字と類似していると判断してステップS7に進み、そ
れ以外のときはステップS11に進む。
る。ステップS8で、類似文字メモリ12中のN[k]
に類似文字の番号jを記憶する。
に代入する。ステップS10では、座標P[N[k]]
で囲まれる類似文字の文字パターンを表示部8に表示す
る。このとき、ステップS24で表示した文字パターン
と重ならないように文字パターンの幅より幾分大きめの
ドット数だけ所定の方向(ここでは右方向)にずらして
表示する。
に対して処理が終了したのかを調べる。終了であればス
テップS12へ、そうでなければS22へ進む。
て、その後でステップS5に戻る。ステップS12の時
点では、文字認識部3から出力されたすべての文字に対
して、i番目の文字との距離が小さい文字の番号jが類
似文字メモリ12のN[k]にセットされている。N
[k]にセットされた番号の文字はステップS13以降
で一括して修正するが、その前に修正対象から除外した
い文字があればこれを指定する。すなわち、修正情報入
力部9から除外したい文字の番号を入力すれば、この番
号kに対応するN[k]の値を0に書き換える。
領域P[N[k]]で囲まれる文字パターンを表示部8
から消去する。
入力部9から入力する。ステップS14で、カウンタj
に1をセットする。
ち修正対象から除外したい文字であればステップS18
へ進み、それ以外はステップS16に進む。
の候補文字C[N[j]]にステップS13で入力した
文字をセットする。
モリ6中のリジェクトフラグR[j]に0をセットす
る。これは一度修正した文字を重複して処理しないため
である。
ステップS17までの修正処理を類似文字の総数k分だ
け繰り返すように反復回数を制御するための判定を行
い、反復を繰り返すときはステップS23に進み、それ
以外はステップS19に進む。
テップS19ではリジェクトフラグR[i]に0をセッ
トし、ステップS20に戻る。
認識文字の総数以上であれば処理を終了し、未満であれ
ばステップS21に進む。
認識例題文字列「生むぎ生ごめ生たまご」を用いて具体
的に説明する。
認識し、1番目と7番目の文字がリジェクトされたとす
る(図4(a)参照)。
とを検出し(R[1]=1)、この文字の特徴F[1]
と2番目以降の文字の特徴との距離を計算し、しきい値
未満の文字を決定する。1、4、7、9番目の文字がこ
の条件を満たすものとすると、図4(b)のように類似
文字メモリ12にその順番が記憶される。
に対する文字パターンと候補文字を表示する。表示すべ
き候補文字は該当する文字のそれぞれの候補文字をすべ
て表示してもよく、頻度が高い順番に表示してもよい。
このときの表示部8の一例を図6(a)に示す。4つの
文字パターンは「生」、「生」、「生」、「ま」であ
り、候補文字は「生」、「王」、「舌」、「牛」であ
る。
類似文字メモリ12から除外する。例題では文字パター
ン「ま」を除外の対象とし、これを修正情報入力部9か
ら指示することにより、類似文字メモリ12のK=4に
0が書き込まれ(図5(b))、表示部8には図6
(b)のように「ま」の文字パターンが消去され対象か
ら除外されたことが示される。
を選んで入力することにより、図5(a)のように候補
文字メモリ5中のK=1、4、7の候補文字がすべて
「生」に書き換えられる。
可能性の高い文字パターンとこれに距離が近い文字パタ
ーンを表示し、操作者が正しい文字を選択あるいは文字
コードを入力すれば、これらの文字パターンに対応する
認識文字を一括して正解の文字コードに自動的に修正す
ることができるために、従来の方法と比べて操作回数が
非常に小さくて済むために修正作業が効率よく行える。
含まれる文字について文字認識処理を行い、当該文字認
識処理において、各文字パターンの座標情報、文字パタ
ーンから抽出した特徴量、特徴量と辞書とを照合して得
られた最大類似度の認識候補文字と当該文字コードのリ
ジェクト情報を出力する文字認識装置であって、出力さ
れた各文字パターンのうち、リジェクトされた文字パタ
ーンを設定する手段と、設定された文字パターンの特徴
量とリジェクトされなかった文字パターンの特徴量との
距離を求める手段と、設定された文字パターンとの距離
が所定の値未満であるリジェクトされなかった文字パタ
ーンを設定された文字パターンと併せて表示させる手段
と、置換文字を指定する手段と、表示された文字パター
ンを指定された文字に置換する手段と、を有する構成と
したことにより、文字認識処理後の認識結果の修正作業
において、リジェクトされた文字パターンを置換する
際、リジェクトされた文字パターンだけでなく、当該リ
ジェクトされた文字パターンに類似するリジェクトされ
なかった文字パターンについても、リジェクトされた文
字パターンと併せて一括置換することができ、認識結果
を修正する操作者の負担が軽減される。
を用いた文字認識装置の機能ブロック図
文字認識装置のブロック図
ト
置の構成図
Claims (3)
- 【請求項1】画像中に含まれる文字について文字認識処
理を行い、当該文字認識処理において、各文字パターン
の座標情報、文字パターンから抽出した特徴量、特徴量
と辞書とを照合して得られた最大類似度の認識候補文字
と当該文字コードのリジェクト情報を出力する文字認識
装置であって、 出力された各文字パターンのうち、リジェクトされた文
字パターンを設定する手段と、 設定された文字パターンの特徴量とリジェクトされなか
った文字パターンの特徴量との距離を求める手段と、 設定された文字パターンとの距離が所定の値未満である
リジェクトされなかった文字パターンを設定された文字
パターンと併せて表示させる手段と、 置 換文字を指定する手段と、 表示された文字パターンを指定された文字に置換する手
段と、を有することを特徴とする文字認識装置。 - 【請求項2】置換された文字のリジェクト情報を解除す
る手段を有することを特徴とする請求項1記載の文字認
識装置。 - 【請求項3】画像中に含まれる文字について文字認識処
理を行い、当該文字認識処理において、各文字パターン
の座標情報、文字パターンから抽出した特徴量、特徴量
と辞書とを照合して得られた最大類似度の認識候補文字
と当該文字コードのリジェクト情報を出力する文字認識
装置における認識文字の修正方法であって、 出力された各文字パターンのうち、リジェクトされた文
字パターンを設定し、 設定された文字パターンの特徴量とリジェクトされなか
った文字パターンの特徴量との距離を求め、 設定された文字パターンとの距離が所定の値未満である
リジェクトされなかった文字パターンを設定された文字
パターンと併せて表示させ、 置 換文字が指定されると、 表示された文字パターンを指定された文字に置換する、
ように制御することを特徴とする認識文字の修正方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01519393A JP3416975B2 (ja) | 1993-02-02 | 1993-02-02 | 文字認識装置及び認識文字の修正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01519393A JP3416975B2 (ja) | 1993-02-02 | 1993-02-02 | 文字認識装置及び認識文字の修正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06231299A JPH06231299A (ja) | 1994-08-19 |
JP3416975B2 true JP3416975B2 (ja) | 2003-06-16 |
Family
ID=11882025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01519393A Expired - Lifetime JP3416975B2 (ja) | 1993-02-02 | 1993-02-02 | 文字認識装置及び認識文字の修正方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3416975B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6075158B2 (ja) * | 2013-03-29 | 2017-02-08 | 富士通株式会社 | 文字入力支援プログラムおよび文字入力支援装置 |
-
1993
- 1993-02-02 JP JP01519393A patent/JP3416975B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH06231299A (ja) | 1994-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0439951B1 (en) | Data processing | |
US5394484A (en) | Image recognition apparatus | |
US5802204A (en) | Handwritten character translator using fuzzy logic | |
JPS59136875A (ja) | パタ−ン識別装置 | |
JP2007058882A (ja) | パターン認識装置 | |
JP3416975B2 (ja) | 文字認識装置及び認識文字の修正方法 | |
CN112183525A (zh) | 一种文本识别模型的构建及文本识别方法和装置 | |
JPH0721303A (ja) | 文字認識装置 | |
JPH0573709A (ja) | 認識文字の修正方法 | |
JP3270551B2 (ja) | 文字認識装置および文字認識方法 | |
KR102583160B1 (ko) | X-ray 이미지의 노듈위치 결정방법 | |
JP2001236467A (ja) | パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体 | |
JP3037727B2 (ja) | Ocrシステム | |
JPH0612520A (ja) | 文字認識装置の確認修正方式 | |
JP3486246B2 (ja) | 文字認識装置 | |
JP2624558B2 (ja) | 文字認識装置 | |
JP2976990B2 (ja) | 文字認識装置 | |
JP4633271B2 (ja) | 辞書学習方法及び辞書学習プログラム | |
CN115577727A (zh) | 手持扫码终端的扫码改进方法及装置 | |
JPS6252911B2 (ja) | ||
JPH04268684A (ja) | 認識文字の修正方法 | |
JP3277977B2 (ja) | 文字認識方法 | |
JPH03222074A (ja) | 画像処理用ラベル付け装置 | |
JP2023003647A (ja) | 情報処理装置、及び、プログラム | |
JPH0749924A (ja) | 手書き文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080411 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090411 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100411 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110411 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120411 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130411 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term |