JPH0721303A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0721303A
JPH0721303A JP5030988A JP3098893A JPH0721303A JP H0721303 A JPH0721303 A JP H0721303A JP 5030988 A JP5030988 A JP 5030988A JP 3098893 A JP3098893 A JP 3098893A JP H0721303 A JPH0721303 A JP H0721303A
Authority
JP
Japan
Prior art keywords
character
pattern
characters
memory
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5030988A
Other languages
English (en)
Inventor
Tamotsu Maeda
田 保 前
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5030988A priority Critical patent/JPH0721303A/ja
Publication of JPH0721303A publication Critical patent/JPH0721303A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 認識文字を少ない操作回数で効率良く修正す
る。 【構成】 操作者からの修正情報を入力する修正情報入
力部9と、入力された修正情報に基づき候補文字メモリ
5の内容を正しい文字に書き換える修正部10を備え、
誤認識の可能性の高い文字パターンとこれに類似した文
字パターンを表示部8に表示して、操作者が正しい文字
を選択することにより一括修正する。 【効果】 誤認識の可能性の高い文字パターンとこれに
類似した文字パターンを表示し一括修正できるため作業
効率が向上する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識処理によって
得られた文字の修正手段を備えた文字認識装置に関する
ものである。
【0002】
【従来の技術】以下、従来の認識文字修正手段を備えた
文字認識装置について図7を参照して説明する。文字入
力部101から入力された文書画像は、一旦文書パター
ンメモリ111に蓄えられ、文字認識部102で文字認
識される。文字認識部102から出力された認識文字の
文字パターン、特徴量、リジェクトコードおよびコード
は、それぞれのメモリ110、105、109、103
に文字パターンの数だけ記憶される。その後、誤認識の
可能性の高い認識文字とその文字パターンを文字コード
メモリ103および文字パターンメモリ110から読み
出し、表示部104に表示して操作者に提示し、操作者
がこの文字コードを修正するために正しい文字コードを
修正情報入力部106から入力した場合、両方の文字コ
ードを照合修正部107で照合した上で、文字コードメ
モリ103の内容をこれに修正する。さらに、特徴メモ
リ105中にある着目する文字パターンの特徴量と他の
文字パターンの特徴量との類似度を求め、この類似度が
所定値より大きい場合には、操作者が修正を指示しない
パターンであっても、その文字パターンと文字コードを
操作者に提示し、上記で修正された文字コードに修正す
ることを確認部108で操作者に対して確認し、操作者
がこれを許可したときに上記修正を行なうようにする。
【0003】
【発明が解決しようとする課題】しかしながら、上記の
従来の構成では、誤認識の可能性の高い文字と特徴量が
近い文字を1文字ずつ表示し、確認作業を行なう必要が
あるので、作業を効率よく行なう上で問題があった。
【0004】本発明は、このような従来の問題を解決す
るものであり、認識文字を少ない操作回数で効率良く修
正することのできる文字認識装置を提供することを目的
とする。
【0005】
【課題を解決するための手段】本発明は、上記目的を達
成するため、認識された文字コードのうち誤認識の可能
性の高い文字パターンと、この文字パターンに類似する
文字の文字パターンとを認識候補文字として一度に表示
し、これらの認識候補文字から操作者が正解文字を選択
することにより認識候補文字を正解文字に一括して修正
するようにしたものである。また、文字パターン中に不
適当な文字パターンが含まれているときは操作者がこれ
を指示することにより修正対象から外すことができ、ま
た認識候補文字中に正解文字が存在しないときは、かな
漢字変換等を用いて入力した文字に一括して置換する。
【0006】
【作用】複数の文字パターンに対するそれぞれの候補文
字をリストアップするので、ある文字パターンの候補文
字に正解がない場合であっても距離の近い他の文字パタ
ーンでの候補文字を参照できるため、操作者が候補文字
の中から正解文字を選択することが容易になり、従来の
方法より少ない操作回数で修正作業ができる。
【0007】
【実施例】図1は本発明の一実施例における文字認識装
置の機能ブロック図である。図1において、1は文書を
光電変換して2値化データとして画像メモリ2に記憶さ
せる画像入力部、2は画像入力部1からの2値化データ
を蓄える画像メモリ、3は2値化データに前処理、特徴
抽出、マッチング等の文字認識処理を行ない、画像メモ
リ2における文字パターンを囲む外接矩形の頂点座標、
類似文字、認識候補文字およびリジェクトフラグを出力
する文字認識部、4は文字パターンの外接矩形の頂点座
標を記憶する文字矩形メモリ、5は認識候補文字を蓄え
る候補文字メモリ、6はリジェクトフラグが付与された
文字を記憶するためのリジェクトフラグメモリ、7は類
似文字を記憶する類似文字メモリ、8は画像メモリ2の
内容、候補文字メモリ5や類似文字メモリ7中の候補文
字および修正のためのメッセージ等を表示する表示部、
9は操作者からの修正情報を入力する修正情報入力部、
10は入力された修正情報に基づき候補文字メモリ5の
内容を正しい文字に置き換える修正部である。
【0008】図2は本実施例の文字認識装置の構成を示
す装置ブロック図である。図2において、21は画像入
力回路であり、図1の1に対応し、イメージスキャナ等
により読み取った文書をビットデータにして出力する。
22はランダム・アクセス・メモリ(以下、RAM)で
あり、図1の画像メモリ2、文字矩形メモリ4、候補文
字メモリ5、リジェクトフラグメモリ6、類似文字メモ
リ7および処理で使用する作業用メモリ28を有してい
る。23はリード・オンリーメモリ(以下、ROM)で
あり、図3に示すフローチャートに従った制御プログラ
ムを記憶したプログラム記憶領域29を有する。24は
プログラム記憶領域29に記憶された制御プログラムに
従って処理を行なう処理回路である。25はデータを入
力するキーボードである。26は表示回路であり、図1
の8に対応し、27は文字認識回路であり、図1の3に
対応する。
【0009】以上のように構成された文字認識装置にお
いて、以下認識文字の修正方法について、図1の機能ブ
ロック図および図3のフローチャートに従って説明す
る。修正の処理は、文字認識部3により文字領域の認識
処理が終了した時点から始まる。
【0010】まずステップ31で、文字領域に含まれる
文字の並び順を示すカウンタ番号iに初期値1をセット
する。
【0011】ステップ32では、i番目の文字に対して
修正処理を行なうかどうかをリジェクトフラグR[i]
を参照して判定する。R[i]は文字認識部3によって
値が代入される。たとえば、第1候補文字の距離、第1
候補文字と第2候補文字との距離の差、第1候補文字が
誤読の発声する傾向が強い特定の文字(「夕」と「タ」
など)であるときは、認識文字(第1候補文字)が誤読
である可能性が高い。このようなときにリジェクトフラ
グメモリ6中のリジェクトフラグR[i]に1が、それ
以外のときは0が代入される。
【0012】リジェクトフラグR[i]が1のとき、す
なわちi番目の文字が誤読の可能性が高いときはステッ
プ33へ、R[i]が0のときはステップ52へ進む。
ステップ33では、i番目の文字パターンを表示部8に
表示する。
【0013】ステップ34で、カウンタにi番目の文字
の特徴と似ている文字の番号kを設定する。またステッ
プ35で、jにi+1を代入する。
【0014】ステップ36では、前述したようにi番目
の文字の特徴F[i]とj番目の文字の特徴F[j]と
の距離を計算する。
【0015】ステップ37で、G[j]が0でないとき
はG[j]番目の文字がi番目の文字と類似していると
判断してステップ38に進み、それ以外のときはステッ
プ42に進む。ステップ38で、kの値を1だけ増加さ
せ、ステップ39で、類似文字メモリ7中のN[k]に
類似文字の番号jを記憶する。
【0016】ステップ40では、座標P[N[k]]で
囲まれる類似文字の文字パターンを表示部8に表示す
る。このとき、ステップ33で表示した文字パターンと
重ならないように文字パターンの幅より幾分大きめのド
ット数だけ所定の方向(ここでは右方向)にずらして表
示する。このあと、ステップ41に進む。ステップ41
では、文字番号jに1を加算した後、ステップ37に戻
る。
【0017】ステップ42の時点では、文字認識部3か
ら出力されたすべての文字に対して、i番目の文字との
距離が小さい文字の番号jが類似文字メモリ7中のN
[k]にセットされている。N[k]にセットされた番
号の文字はステップ44以上で一括して修正するが、そ
の前に修正対象から除外したい文字があればこれを指定
する。すなわち、修正情報入力部9から除外したい文字
の番号を入力すれば、この番号kに対応するN[k]の
値を0に書き換え、次にステップ43で、N[k]が指
す矩形領域P[N[k]]で囲まれる文字パターンを表
示部8から消去する。
【0018】ステップ44で、正しい文字を修正情報入
力部9から入力し、ステップ45で、カウンタjに1を
セットする。ステップ46で、N[j]が0、すなわち
修正対象から除外したい文字であればステップ49へ進
み、それ以外はステップ47に進む。
【0019】ステップ47では、候補文字メモリ5中の
候補文字C[N[j]]にステップ44で入力した文字
をセットし、ステップ48では、リジェクトフラグメモ
リ6中のリジェクトフラグR[j]に0をセットする。
これは一度修正した文字を重複して処理しないためであ
る。
【0020】ステップ49では、ステップ46からステ
ップ48までの修正処理を類似文字の総数k分だけ繰り
返すように反復回数を制御するための判定を行ない、反
復を繰り返すときはステップ50に進み、それ以外はス
テップ51に進む。
【0021】ステップ50では、jに1を加算し、ステ
ップ51では、リジェクトフラグR[i]に0をセット
し、ステップ52に移る。
【0022】ステップ52では、修正中の文字の番号が
認識文字の総数以上であれば処理を終了し、未満であれ
ばステップ53に進む。ステップ53では、iに1を加
算してステップ32に戻る。
【0023】次に、図4以降を参照して認識例題文字列
「生むぎ生ごめ生たまご」を用いて上記処理をさらに具
体的に説明する。この文字列を「王むぎ生ごめ王たま
ご」と誤認識し、1番目と7番目の文字がリジェクトさ
れたとする(図4(a)参照)。
【0024】まず、1番目の文字がリジェクトされるこ
とを検出し(R[1]=1)、この文字と距離の近い文
字はG[1]=4であることから4であり、この4番目
の文字と距離の近い文字はG[4]は7であり、この7
番目の文字と距離の近い文字G[7]はないことがわか
る。このとき、1、4、7、9番目の文字が1番目の文
字と距離が近いものとすると、図4(b)のように類似
文字メモリ7にその順番が記憶される。
【0025】次に、1番目の文字と距離がしきい値未満
の文字に対する文字パターンと候補文字を図5(a)の
ように表示部8に表示する。これは図3のステップ42
の前段に相当する。表示すべき候補文字は該当する文字
のそれぞれの候補文字をすべて表示してもよく、頻度が
高いに順番に表示してもよい。図5(a)では、4つの
文字パターンは「生」、「生」、「生」、「ま」であ
り、候補文字は「生」、「王」、「舌」、「牛」であ
る。
【0026】次に、修正したくない文字があればこれを
類似文字メモリ7から除外する。例題では文字パターン
「ま」を除外の対象とし、これを修正情報入力部9から
指示することにより、図6(b)のように類似文字メモ
リ7のK=4に0が書き込まれ、表示部8には図5
(b)のように「ま」の文字パターンが消去され対象か
ら除外されたことが示される。これは図3のステップ4
3終了時に相当する。
【0027】最後に、候補文字の中から正解(「生」)
を選んで入力することにより、図6(a)のように候補
文字メモリ5中のK=1、4、7の候補文字がすべて
「生」に書き換えられる。
【0028】以上のように、本実施例によれば、誤認識
の可能性の高い文字パターンとこれに距離が近い文字パ
ターンを表示し、操作者が正しい文字を選択あるいは文
字コードを入力することにより、これらの文字パターン
に対応する認識文字を一括して正解の文字コードに自動
的に修正することができるため、従来の方法と比べて操
作回数が非常に少なくて済み、修正作業が効率良く行な
える。
【0029】
【発明の効果】本発明は、上記実施例から明らかなよう
に、誤認識の可能性の高い文字パターンとこれに距離が
近い文字パターンを表示し、操作者が正しい文字を選択
あるいは文字コードを入力することにより、一括して正
解の文字コードに自動的に修正することができるので、
マン・マシン・インターフェースに優れた認識文字の修
正を行なうことができる。
【図面の簡単な説明】
【図1】本発明の一実施例における文字認識装置の機能
ブロック図。
【図2】同実施例における文字認識装置の装置ブロック
図。
【図3】同実施例における認識文字修正処理の流れを示
すフローチャート。
【図4】同実施例における認識文字修正処理を説明する
ための一覧図。
【図5】同実施例における認識文字修正処理時の表示例
を示す画面図。
【図6】同実施例における認識文字修正処理を説明する
ための一覧図。
【図7】従来の認識文字修正機能を備えた文字認識装置
の機能ブロック図。
【符号の説明】
1 画像入力部 2 画像メモリ 3 文字認識部 4 文字矩形メモリ 5 候補文字メモリ 6 リジェクトフラグメモリ 7 類似文字メモリ 8 表示部 9 修正情報入力部 10 修正部 21 画像入力回路 22 RAM 23 ROM 24 処理回路 25 キーボード 26 表示回路 27 文字認識回路 28 作業用メモリ 29 プログラム記憶領域

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文書画像を読み取って2値化したデータ
    をもとに文字認識を行なう文字認識部と、認識された文
    字のうち誤認識の可能性の高い文字パターンとこれに類
    似する文字の文字パターンとを同時に表示する表示部
    と、表示された文字パターンの中から操作者が正解文字
    を選択する修正情報入力部と、入力された修正情報に基
    づき正解文字に一括して修正する修正部とを備えた文字
    認識装置。
  2. 【請求項2】 文字パターンを表示する場合、誤認識の
    可能性の高い文字としてリジェクトされた文字の文字パ
    ターンの前後の文字と、前記リジェクトされた文字に類
    似する文字の前後の文字パターンとを表示することを特
    徴とする請求項1記載の文字認識装置。
  3. 【請求項3】 文字パターンを表示する場合、誤認識の
    可能性の高い文字としてリジェクトされた文字の文字パ
    ターンと、これに類似する文字の文字パターンとを表示
    し、操作者の指示により、リジェクトされた文字の文字
    パターンの前後の文字と、リジェクトされた文字に類似
    する文字の前後の文字パターンとを表示することを特徴
    とする請求項1記載の文字認識装置。
  4. 【請求項4】 表示された文字パターン中から操作者の
    指示により特定の文字を除外する手段を備えた請求項1
    から3のいずれかに記載の文字認識装置。
JP5030988A 1993-02-19 1993-02-19 文字認識装置 Pending JPH0721303A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5030988A JPH0721303A (ja) 1993-02-19 1993-02-19 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5030988A JPH0721303A (ja) 1993-02-19 1993-02-19 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0721303A true JPH0721303A (ja) 1995-01-24

Family

ID=12319008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5030988A Pending JPH0721303A (ja) 1993-02-19 1993-02-19 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0721303A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207960A (ja) * 2001-01-12 2002-07-26 Nippon Digital Kenkyusho:Kk 認識文字修正方法及び認識文字修正プログラム
JP2006178543A (ja) * 2004-12-20 2006-07-06 Canon Marketing Japan Inc 画像処理方法、画像処理装置
WO2012014611A1 (ja) 2010-07-26 2012-02-02 株式会社豊田中央研究所 トラクションドライブ機構

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207960A (ja) * 2001-01-12 2002-07-26 Nippon Digital Kenkyusho:Kk 認識文字修正方法及び認識文字修正プログラム
JP2006178543A (ja) * 2004-12-20 2006-07-06 Canon Marketing Japan Inc 画像処理方法、画像処理装置
WO2012014611A1 (ja) 2010-07-26 2012-02-02 株式会社豊田中央研究所 トラクションドライブ機構

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
EP0063454A2 (en) Method for recognizing machine encoded characters
EP0343786A2 (en) Method and apparatus for reading and recording text in digital form
JPH0721303A (ja) 文字認識装置
US7016535B2 (en) Pattern identification apparatus, pattern identification method, and pattern identification program
JP3416975B2 (ja) 文字認識装置及び認識文字の修正方法
JPH11213087A (ja) 文字認識装置
JPH09282309A (ja) 文書編集校正処理装置
JP2703559B2 (ja) 文字認識支援装置
JP2763042B2 (ja) 画像処理方法
JP3037727B2 (ja) Ocrシステム
JPH06337966A (ja) 文字認識装置
JPS61147379A (ja) 光学式文字読取装置
JPH0467282A (ja) 認識文字の修正方法
JPH05151384A (ja) 認識文字の修正方法
JPH04268684A (ja) 認識文字の修正方法
JPH0830717A (ja) 文字認識方法とその装置
JPH0436885A (ja) 光学式文字読取装置
JPH0573709A (ja) 認識文字の修正方法
JPH06290308A (ja) 文字認識装置
JPH09305712A (ja) 文字認識方法及び装置、及び文字認識用プログラムを記憶した記憶媒体
JP2504373B2 (ja) 文字認識装置
JPH11184962A (ja) 光学的文字読取装置、照合修正方法、及び記録媒体
JP2020140350A (ja) 文字画像特定装置、画像形成装置及び文字画像特定方法
JPH02150980A (ja) 文字及び単語の認識方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees