JPH06111071A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06111071A
JPH06111071A JP4282542A JP28254292A JPH06111071A JP H06111071 A JPH06111071 A JP H06111071A JP 4282542 A JP4282542 A JP 4282542A JP 28254292 A JP28254292 A JP 28254292A JP H06111071 A JPH06111071 A JP H06111071A
Authority
JP
Japan
Prior art keywords
character
recognition
result
recognition result
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4282542A
Other languages
English (en)
Inventor
Shigeru Owada
茂 大和田
Masateru Sakata
正輝 坂田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Engineering Co Ltd
Original Assignee
Hitachi Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Engineering Co Ltd filed Critical Hitachi Engineering Co Ltd
Priority to JP4282542A priority Critical patent/JPH06111071A/ja
Publication of JPH06111071A publication Critical patent/JPH06111071A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 誤認識文字の認識候補を表示する時に、その
文字の切り出し方を変更した場合の認識結果を認識候補
として表示し、変更可能とすることにより、文字切り出
しを失敗した場合の誤認識文字を高効率に変更できる文
字認識装置を提供することにある。 【構成】 文字の認識結果を表示装置に表示し、その認
識結果中の誤認識している文字を操作者が指定した場合
に、その文字の切り出し方を変更した複数個のパターン
を生成し、その各パターンを認識した結果を認識候補と
して生成して表示装置に表示する。表示された各認識候
補を操作者が指定した場合に、その指定した認識候補と
なるよう変更することにより、文字切り出しを失敗した
場合の誤認識文字を高効率に変更する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識する際に、文
字切り出しが失敗したために発生した誤認識文字の修正
を高効率に行う文字認識装置に関する。
【0002】
【従来の技術】従来、文字認識装置における認識結果の
変更は、各文字ごとに認識候補を選択して、それを表示
装置に表示し、操作者が正解文字を指定するようにして
いる。この場合の認識候補は、指定した文字の切り出し
方を変更しない場合の認識候補としているのが一般的に
なっている。図6に、従来の認識結果変更方法の一例を
示す。図6は、文字列「新開発」を認識させた場合に、
認識結果が図6(a)のように「新問発」となった場合
の例を示している。操作者は、表示されている「問」よ
り、文字「開」を誤認識したことを判断し、誤認識文字
「問」を指定して、文字候補を表示させる。図6(b)
では、「開」、「間」、「閉」の3つを文字候補にして
いる。この文字候補は文字の切り出し方を変更していな
い認識候補である。操作者は、その文字候補の中から正
解である文字「開」を見つけて、それを指定し、図6
(c)のように認識結果の変更を行っている。また、文
字の切り出し方を複数個用意して認識結果を求める方法
が、例えば、特開昭61−221889号公報に記載さ
れている。この方式は、文字認識時に複数個の切り出し
方を仮定し、各切り出し方ごとの認識結果の妥当性より
一つの切り出し方に決定するものである。この方式によ
る認識結果変更も決定した1つの文字切り出しで得られ
る認識候補との変更のみを可能としている。
【0003】
【発明が解決しようとする課題】文字切り出しが失敗す
ると、正解文字への変更ができないため、他の変更手段
(例えば、キーボード等の入力装置より正解文字を入力
する方法等)を用いて認識結果変更を行なわなければな
らず、認識結果変更の効率を低下させている。図7に文
字切り出しを失敗した場合の認識候補の表示例を示す。
図7(a)は、文字列「第31ルート」を認識させた場合
に、認識結果が「第引ルート」となった場合の例であ
る。これは、半角の文字列「31」を1つの文字として切
り出したために、認識結果が「引」となったものであ
る。これを従来の認識結果変更方法のように誤認識文字
「引」の認識候補を表示しても、文字パターン「31」と
しての認識候補は、図7(b)のように、例えば、
「印」、「刊」、「叶」の3つしか表示されないため
に、正解である文字列「31」という認識候補を得ること
はできない。本発明の目的は、文字切り出しが失敗して
も、認識候補表示時に切り出し方を変更した場合の認識
候補を表示させて、認識結果変更を高効率に行わせるこ
とができる文字認識装置を提供することにある。
【0004】
【課題を解決するための手段】本発明では、文字の切り
出し方を変更した場合の認識候補を生成し、表示する。
【0005】
【作用】操作者が誤認識であると判断すると、文字切り
出し方の異なる認識候補から正解文字を容易に抽出でき
るので、変更を簡単に行える。
【0006】
【実施例】本発明の一実施例を図1に示す。図1におい
て、画像入力装置1より入力された文書画像データは、
電子計算機2の文書画像データ記憶手段21に記憶され
る。文字認識手段22は、文書画像データ記憶手段21
の画像データより文字を切り出し、文字認識辞書手段2
3とのパターンマッチングにより文字認識処理を実行す
る。文字認識手段22の認識結果は記憶手段24に記憶
される。入力された文書画像データの全ての文字の認識
が終了すると、記憶手段24に格納されている認識結果
をCRT表示装置3に表示する。切り直し手段25は、
文字の切り出し方を変更したパターンを複数個生成し、
切り直し結果表示手段26に出力する。認識結果変更手
段27と切り直し手段25はマウスなどのポインティン
グデバイス装置4によって指定される。出力手段28は
記憶手段24に格納されている認識結果を出力する。
【0007】まず、全体の処理を図2を用いて説明す
る。画像入力装置1より入力された文書画像データは、
文書画像データ記憶手段21に記憶される。文字認識手
段22は、文書画像データ記憶手段21の画像データよ
り文字を切り出し、正規化、塵処理等の前処理を行った
後、文字認識辞書手段23とのパターンマッチング等の
認識手法により文字認識処理を行い、切り出した文字の
画像データに似ていると判断された文字認識辞書手段2
3の文字候補を認識結果記憶手段24に格納する(ステ
ップ101)。全ての文字の認識が終了した後、前記認
識結果記憶手段24の認識結果をCRT等の表示装置3
に表示する(ステップ102)。操作者は、表示された
認識結果の確認を行い、誤認識している文字が存在しな
い場合は、認識結果変更作業を終了し(ステップ10
3)、誤認識している文字が存在する場合は、その認識
結果をマウス等のポインティングデバイス装置4で指定
する(ステップ104)。切り直し手段25は、操作者
の指定した誤認識している文字または文字列に対応する
文書画像データ記憶手段21の画像データを取り出し、
その文字の切り出し方を変更したパターンを複数個生成
し、それを前記文字認識手段22と同様の処理を行って
認識し、その認識結果を切り直し結果表示手段26へ出
力する(ステップ105)。
【0008】ここで、切り直し手段25の処理を図3、
図4、図5を用い説明する。図3、図4は、文字列「第
31ルート」を認識し、認識結果が「第引ルート」となっ
た時に、文字「引」を誤認識文字として指定した場合の
切り直し手段25の処理を示す例である。切り直し手段
25は、指定した誤認文字の前後X文字(本例では、X
=1としている)を含めた形で切り出し方を変更し、そ
の認識結果を出力する。その処理フローは、図5のよう
になる。まず、ステップ401では、切り出し方を変更
する全範囲(本例では、前後1文字を含めた範囲として
いるので、「第31ル」の範囲となる)中で、各切り出さ
れた文字が最小となる切り出し最小単位を求める。つま
り、図3(a)のように、文字行と垂直方向へのヒスト
グラムの値を求め、そのヒストグラムの値がある値(本
例では、0としている)より以下の場合に、そこを切り
出し位置とし、その切り出し位置により分離される切り
出し最小単位(図中の)を求める。ステップ
402では、前記切り出し最小単位のうち、連続する複
数個の切り出し最小単位を融合しても、1つの文字とし
て適当と考えられるサイズとなる場合の切り出し最小単
位の融合の組み合せを算出する。図3(a)の例では、
隣合う切り出し最小単位を融合しても、あらかじめ求め
ておいた標準となる文字サイズより小さい場合は融合可
能とし、切り出し最小単位の融合の組み合せの一つとし
て記憶することにより、図3(b)の様な結果(図中の
)が得られる。ステップ403では、これら切り
出し最小単位(図3(b)の)及び、融合組
み合せ(図3(b)の)の各画像データに対し、
前記文字認識手段22と同様の処理を行い、各認識結果
を求める。ただし、最初の認識結果として認識済みであ
る切り出し方(図3(b)の)については、再度
認識する必要はない。図3(b)各認識結果は、図4
(c)の様になる。ステップ404では、各切り出しの
認識結果(切り出し最小単位と融合組み合せ)の全組み
合せを生成し、その生成された認識結果の妥当性をチェ
ックし、妥当であると判定された認識結果を切り直し結
果表示手段26へ出力する。各認識結果には、図4
(c)のように、相違度(相違度が0に近い程その認識
結果は確からしい)という評価値を持たせている。各認
識結果の組み合せ(図4(d)中のNo.1〜No.
5)ごとの相違度の合計値を認識結果の組み合せの文字
数で割った1文字ごとの平均相違度を算出し、その値が
ある値(本実施例では、5としている)より小さい場合
を認識結果は妥当であると判定する、これにより、図4
(d)の判定の様な結果(〇は妥当であり、×は妥当で
ない)が得られる。ここで、図4(d)のNo.5の組
み合せパターンは、相違度は5以下であるのに判定では
×となっているが、これはこの組み合せパターンがすで
に表示している認識結果と同一であるためである。次
に、図2において、切り直し結果表示手段26は、切り
直し手段25により求められた切り直しを行った認識結
果のうち、前記妥当であると判定された組み合せの認識
結果を、切り直しをした認識候補としてCRT表示装置
3へ表示する。(ステップ106)。図3(a)の場合
は、図4(e)の様に表示される。なお、図4(e)の
表示例では、切り直しを行わない場合の認識候補と、切
り直しを行った場合の認識候補の両方を同時に表示装置
3の下部に表示する様にしているが、切り直しを行った
認識候補だけを表示してもよい。認識結果変更手段27
は、切り直し結果表示手段26にて表示された認識候補
より、操作者は正解である認識候補を探し、その認識候
補をマウス等のポインティングデバイス装置4で指定し
た場合(ステップ107)に、指定された認識候補に合
う様に認識結果記憶手段24内の認識結果の変更を行う
(ステップ108)。認識結果出力手段28は、全ての
誤認識の変更が終了したと操作者が指定した場合(ステ
ップ103)に、その認識結果記憶手段24の認識結果
をファイル等へ出力する(ステップ109)。このよう
にして、誤認識を変更するが、文字切り出しの失敗した
認識結果についても、切り出し方を変更した場合の認識
候補を生成して表示している。したがって、容易に正解
文字への変更を行える。
【0009】次に、以上の説明では、図4(d)に示す
ように、切り出し方を変更した認識結果の全組み合せを
生成するようにしているが、切り出し方を変更した1つ
の認識結果を生成し、それを表示するようにすると、切
り直し結果の表示を高速に行うことができる。このよう
にする際、生成する切り出し方が以前に生成した切り出
し方と重複しないようにするためには、以下のようにす
る。まず、認識結果記憶手段24の認識結果の文字ごと
に切り直しを行った回数を記憶する切り直し回数記憶テ
ーブルを用意する。そして、誤認識している文字または
文字列が指定されるたびに、その指定した文字または文
字列に対応する切り直し回数テーブルをカウントアップ
するようにする。切り出し方を変更した認識候補の生成
は、あらかじめ切り出し方を変更する方法の順番を固定
しておき、その指定した文字または文字列に対応する切
り直し回数テーブルに記憶されている回数番目に生成さ
れる切り出し方を求め、その認識結果を求める。このよ
うにすると、操作者が誤認識した文字または文字列を指
定するたびに、切り出し方を変更した認識候補が以前の
認識候補と重複することなく、1つだけ高速に表示され
るようになる。ここで、本発明は、操作者が指定した誤
認識している文字の前後1文字を含めた範囲を切り直し
を行なう範囲とするのではなく、誤認識している文字列
の先頭文字及び末尾文字を指定することにより、切り直
しを行なう範囲を指定したり、指定した1文字のみ切り
直すということもできる。また、操作者が誤認識してい
る文字または文字列を指定した時に、各切り出し方を変
更した場合の認識結果を求めるようにしているが、最初
の認識時に全ての切り出し方の認識結果を求めておくよ
うにすれば、指定時に切り出し方を変更した場合の認識
結果を求める必要がなくなり、高速に切り出し方を変更
した場合の認識候補を表示することが可能となる。
【0010】
【発明の効果】以上説明したように、本発明によれば、
文字切り出しの失敗した認識結果についても、切り出し
方を変更した場合の認識候補を生成して表示し、それを
指定することにより容易に正解文字への変更が可能とな
るため、従来の様にキーボード等の入力装置から正解文
字を入力するよりも、認識結果の変更作業時間の短縮が
可能となり、効率向上が達成される。
【図面の簡単な説明】
【図1】本発明の一実施例を示す全体構成図である。
【図2】本発明の全体処理フローである。
【図3】切り直し手段の処理説明図である。
【図4】切り直し手段の処理説明図(図3の続き)であ
る。
【図5】切り直し手段の処理フローである。
【図6】従来の認識結果変更方法の説明図である。
【図7】文字切り出し失敗時の認識候補表示例である。
【符号の説明】
1 画像入力装置 2 電子計算機 21 文書画像データ記憶手段 22 文字認識手段 23 文字認識辞書手段 24 認識結果記憶手段 25 切り直し手段 26 切り直し結果表示手段 27 認識結果変更手段 28 認識結果出力手段 3 CRT表示装置 4 ポインティングデバイス装置

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力された文書画像データから文字を切
    り出して認識し、認識した結果を表示装置に表示し、そ
    の認識結果の誤認識文字を変更可能な文字認識装置にお
    いて、前記表示装置に表示されている認識結果の誤認識
    文字の指定により、その文字切り出し方を変更した複数
    個のパターンを生成し、その各パターンを認識した結果
    を認識候補として生成する切り直し手段と、前記切り直
    し手段により生成された認識候補を前記表示装置に表示
    する切り直し結果表示手段と、前記切り直し結果表示手
    段により表示された各認識候補が指定されると、認識結
    果をその指定した認識候補となるよう変更する認識結果
    変更手段とを有し、認識結果の認識候補は、文字の切り
    出し方を変更した場合の認識候補も表示することを特徴
    とする文字認識装置。
  2. 【請求項2】 請求項1において、前記切り直し手段
    は、前記表示装置に表示されている誤認識文字につい
    て、切り出し方を変更した1つのパターンで認識した結
    果の認識候補を順次表示することを特徴とする文字認識
    装置。
JP4282542A 1992-09-28 1992-09-28 文字認識装置 Pending JPH06111071A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4282542A JPH06111071A (ja) 1992-09-28 1992-09-28 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4282542A JPH06111071A (ja) 1992-09-28 1992-09-28 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06111071A true JPH06111071A (ja) 1994-04-22

Family

ID=17653828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4282542A Pending JPH06111071A (ja) 1992-09-28 1992-09-28 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06111071A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145308A (ja) * 1997-07-29 1999-02-16 Omron Corp ナンバープレート認識方法およびナンバープレート認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145308A (ja) * 1997-07-29 1999-02-16 Omron Corp ナンバープレート認識方法およびナンバープレート認識装置

Similar Documents

Publication Publication Date Title
US6546401B1 (en) Method of retrieving no word separation text data and a data retrieving apparatus therefor
JP2726568B2 (ja) 文字認識方法及び装置
JP3427692B2 (ja) 文字認識方法および文字認識装置
JPH08293001A (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
JP2002269499A (ja) 数式認識装置および数式認識方法並びに文字認識装置および文字認識方法
Karpinski et al. Metrics for complete evaluation of ocr performance
JPH06111071A (ja) 文字認識装置
JPH1173472A (ja) フォーマット情報登録方法及びocrシステム
JPH01250184A (ja) 文字認識方法及び文字の回転角度判定方法
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
US9015573B2 (en) Object recognition and describing structure of graphical objects
JPH06215184A (ja) 抽出領域のラベリング装置
JP2000251067A (ja) 文書解析方法及び装置並びに記録媒体
JPH09274645A (ja) 文字認識方法および装置
JP3157530B2 (ja) 文字切り出し方法
JPH08161426A (ja) 手書き文字ストローク切出し装置
JPH0528324A (ja) 英文字認識装置
JPH10232871A (ja) 検索装置
JP3442548B2 (ja) 文字認識方法および装置
JPH07271921A (ja) 文字認識装置および文字認識方法
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JPH04335487A (ja) 文字認識装置の文字切り出し方法
JPH0830734A (ja) 文字列認識装置
JP3100786B2 (ja) 文字認識後処理方式
JPH10134150A (ja) 文字認識結果の後処理方法