JPH03240183A - 認識文字自動修正方式 - Google Patents

認識文字自動修正方式

Info

Publication number
JPH03240183A
JPH03240183A JP2035855A JP3585590A JPH03240183A JP H03240183 A JPH03240183 A JP H03240183A JP 2035855 A JP2035855 A JP 2035855A JP 3585590 A JP3585590 A JP 3585590A JP H03240183 A JPH03240183 A JP H03240183A
Authority
JP
Japan
Prior art keywords
character
candidate
recognition
correct
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2035855A
Other languages
English (en)
Inventor
Osamu Nakamura
修 中村
Tadashi Kitamura
正 北村
Tsutomu Ishikawa
勉 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2035855A priority Critical patent/JPH03240183A/ja
Publication of JPH03240183A publication Critical patent/JPH03240183A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、認識文字の修正方式に関し、特に、誤認識を
含む文字認識結果から誤りを除去し、正しい文字候補を
得るための誤認識後の処理技術に関するものである。
〔従来技術〕
認識装置における音声や文字の認識処理においては、1
00%の認識率を実現することは極めて難しく、また、
原理的にも実現可能であるという保証がない。このため
、認識結果に対して人間が確認修正を施して間違いを取
り除く作業を行うことが一般的である。前記の確認修正
を前提として、文字認識時には各記入文字について1位
のみの文字候補だけではなく複数の文字候補を合わせて
出力することが一般的に行われており、認識装置を操作
するオペレータは、1位の認識結果として出力された文
字候補が誤っている場合には、前記の複数の文字候補の
中から正しい文字を選択するか、または、直接キーボー
ドから正しい文字を入力するなどして文字認識結果を修
正する場合が多い。
また、修正対象となる文字候補(誤認識結果)は、特定
の文字について、例えば標準字形とは異なる特定の記入
者の癖字など繰り返し記入される場合が多く、これら誤
認識文字に対する修正処理は重複操作となる可能性が高
い。
〔発明が解決しようとする課題〕
しかしながら、前記の従来の確認修正作業においては、
多量の帳票に記入された文字の認識を行わせる場合で、
かつ、記入文字の品質が低く比較的誤認識が起こる確率
が高い場合などでは、多大の労力を必要とし、認識シス
テムの導入効果が薄れるという問題があった。ここで、
文字とは、数字、ひらがな、カタカナ、漢字などである
本発明は、前記問題点を解決するためになされたもので
ある。
本発明の目的は、誤認識文字の確認修正作業の自動化が
可能な文字認識結果の確認修正方式を提供することにあ
る。
本発明の前記ならびにその他の目的と新規な特徴は、本
明細書の記述及び添付図面によって明らかになるであろ
う。
〔課題を解決するための手段〕
前記目的を遠戚するために、本発明は、文字認識結果に
対する確認修正処理において、文字単位の認識を実行す
る文字認識手段と、文字認識結果を表示する手段と、確
認の結果および修正指示を与える手段と、全文字認識結
果を保持するテーブルと、正解文字候補が2位以下とさ
れる誤認識に対して正解文字候補を1位とする修正が施
された場合に他の文字位置について類似の誤認識が生起
しているか否かを識別する並べ替え判定手段と、前記の
各手段の動作を制御する制御手段とを備えたL2識文字
自動修正方式であって、前記並べ替え判定手段において
、類似の誤認識が生起していると判断された文字位置に
対して正解文字候補と推定される文字候補の順位を1位
とする入れ替えを行うことを最も特徴とする。
〔作用〕
前述の手段によれば、正解文字候補が2位以下とされる
誤認識に対して正解文字候補を上位とする修正が施され
た場合に、他の文字位置について類似の誤認識が生起し
ているか否かを識別し、その結果、類似の誤認識が生起
していると判断された文字位置に対しては正解文字候補
と推定される文字候補の順位を王位とする入れ替えを行
うことにより、類似誤認識結果に対して1回の文字修正
を行うだけで類似の誤認識が生起している複数の文字位
置に対する認識文字の自動修正が行えるので、従来の多
大の労力を要していた認識文字に対する確認修正作業の
大幅な省力化が可能な認識文字修正方式を実現すること
ができる。
〔発明の実施例〕
以下、本発明の一実施例を図面を用いて具体的に説明す
る。
以下の説明においては、説明を具体的かつ簡明にするた
めに、下記のような前提事項を置く。
(1)帳票の形式を有する用紙に手書きで記入された数
字を認識する。
(2)文字認識の結果として、各記入文字位置毎に3位
までの文字候補を出力する。
(3)各記入文字位置における文字候補は、距離値より
小さな文字候補を上位とする並びで出力する。
(4)各文字候補に付された前記の距離値は、各文字に
関して文字辞書中に登録された特徴データからのずれを
表現した数値と定義する。
従って、記入文字品質が比較的良好な場合、距離値が小
さい程、認識結果が正確らしいと想定される。
第1図は、本発明を適用した認識文字自動修正システム
の一実施例の概略構成を示すブロック図である。
第1図において、1は帳票のイメージデータを対象に1
文字毎の文字認識を行う文字認識手段、2は認識結果等
のデータの表示を行う表示手段、3はオペレータが指示
やデータを入力するための操作指示手段、4は認識結果
テーブル各種のデータ等を記憶するメモリ、5はL&識
文字の順位の並べ替えを実行するか否かを判定する並べ
替え判定手段、6は前述の各ブロックの動作を制御する
制御手段である。
次に、本実施例の認識文字自動修正システムのの動作を
説明する。
なお、本実施例の認識文字自動修正システムにおける各
動作の位置付けについては、第4図を用いて詳細に後述
する。
第1図において、まず、信号線7を介して帳票イメージ
データを文字認識手段1へ入力する。前記帳票形式の詳
細については、第5図を用いて後述する。
前記の文字認識手段1では、下記の処理を行うことによ
り最終的に各文字位置における複数の文字候補を認識結
果として出力する。なお、下記に示す文字認識の動作は
一例であって、同等の最終結果が得られるならば、本発
明の方式にはここで示す以外の文字認識方式を使用する
ことができる。
■、帳票相当のイメージデータから各文字相当のイメー
ジデータを切り出す。
■、前前記処理上よって切り出した各文字相当のイメー
ジデータに対して、文字中心位置を各切りだし枠の中央
に移動するとともに、サイズの標準化を行う(正規化処
理)。
■0文字辞書中に登録されである標準文字パターンとの
照合を行い、入力した各文字相当イメージデータに近い
標準文字パターンの文字コードを別途定められた個数だ
け上位から出力する。
文字認識手段1は、制御手段6の制御の基に。
前記処理■における処理結果を信号AR8を介してメモ
リ4に格納する。なお、メモリ4への格納形式の詳細に
ついては、第2図、第3図を用いて後述する。帳票上に
記入された全ての文字について、前記処理の、■、■を
行った後に、以下の確認修正処理に移る。
確認修正処理は大別して、以下の3つの動作から構成さ
れる。
(1)認識結果の表示(表示動作)、 (2)オペレータによる確認および誤認識結果に対する
修正(確認修正動作)、 (3)本発明に基づく着目文字位置以外の文字位置にお
ける類似の誤認識に対する自動修正(自動修正動作)、 前記の動作(1)、(2)、(3)の内、(2)、(3
)については、各文字位置について(2)→(3)→(
2)→(3)・・・のように修正が必要となる各文字(
誤認識であった)の位置毎に繰り返す。
以下、前述の3つの動作(1)、(2)、(3)につい
て詳細に説明する。
まず(1)の表示動作は、制御手段6の制御の基に、メ
モリ4に保持した認識結果を信号線15および信号線9
を介して表示手段2へ転送する。表示手段2では、別途
定められた画面形式によって前述の転送データを画面に
表示する。
ここで、画面形式については任意の形式に設定可能であ
り、本発明の主旨とは直接関係しないので詳細な説明は
省略する。
次に、(2)の確認修正動作においては、オペレータが
表示手段2で画面に表示された認識結果を目視によって
誤認識の有無を確認し、誤認識となっている文字位置に
おいて、下記の修正動作を行う。
■、操作指示手段3により、着目文字位置における2位
以下の文字候補(認識結果)を表示させる。
■0表示した文字候補の中に正解となる文字候補が存在
する場合には、操作指示手段3により、該正解候補文字
候補を選択し、最終的な文字認識結果とする。
■、前述の動作■において、文字候補中に正解文字候補
が存在しない場合には、操作指示手段3により、正解文
字を入力する。正解文字の入力は、直接操作指示手段3
のキーボードを用いて行う。
前述の動作■または■によって誤認識文字が修正された
場合、前記(3)の自動修正動作を行う。
自動修正動作(3)では、制御手段6の制御の基に以下
の動作を行う。なお、以下の動作の詳細は。
第6図および第7図を用いて後述する。
■0着目する文字位置における修正対象となった誤認識
候補(文字コードのみ、または文字コードと距離値)お
よび正解文字候補(文字コードのみ、または文字コード
と距離値)を検索キーとして、認識結果テーブル内で他
の文字位置における文字候補を検索する。
■1着目文字位置以外の文字位置について、前記■の誤
認識候補および正解文字候補から同様の誤認識が生起し
ているか否かを判定し、同等の誤認識と判定された文字
位置に対しては、オペレータによって施された修正と同
等の修正処理、すなわち正解文字候補を1位とする文字
候補の並べ替えを行う。
前述の説明の如く、第1図に示したブロック構成に基づ
く確認修正処理によれば、オペレータの判断によって修
正された誤認識結果と類似の、他の文字位置における誤
認識結果を自動的に修正することが可能となる。
第2図および第3図は、帳票内の記入欄が2個の場合を
例に、メモリ4内に格納する認識結果テーブルの構成を
説明する図面である。これらの図面の内、第2図は、認
識結果として文字コードのみを保持する場合の構成であ
り、第3図は、認識結果として文字コードおよび距離値
を保持する場合の構成である。第2図および第3図中の
メモリは4である。
まず、第2図を用いて認識結果テーブルの構成を説明す
る。図中の記号C1jkが文字コードを表しており、i
は記入欄の通し番号、jは記入欄iにおける文字位置、
kは記入Iiiの文字位置jにおける文字認識直後(修
正前)の文字候補順位をそれぞれ表している。また、図
中のa、b、c。
dは各文字位置において出力された文字候補の最下位順
位(出力文字候補個数)を表し、これらの値は各文字位
置によって異なる。第1図により説明した並べ替え操作
の内、文字コードのみによって判定を行う場合には、前
述の第2図に示した構成の認識結果テーブルを用いる。
第3図に示した認識結果テーブルの構成は、第2図に示
した認識結果情報の他に、記述Kijkで示す距離値を
付加した構成である。
第1図により説明した並べ替え操作の内、文字コードお
よび距離値によって判定を行う場合には前述の第3図に
示した構成の認識結果テーブルを用いる。
第4図は、本実施例の認識文字自動修正システムの全体
の動作を説明するための動作ブロック図である。
図中、22は文字認識処理の動作ブロック、23は文字
認識に用いる文字辞書、24は確認修正処理の動作ブロ
ックである。
第4図に示した動作ブロックへの入力情報は、イメージ
スキャナ等によって読み込まれたイメージデータである
。また、前記動作ブロックからの出力は、誤認識が除去
された確認修正済みの文字認識結果である。
文字認識処理の動作ブロック22からの出力は、文字コ
ードのみであるか、あるいは、文字コードと各文字候補
処理の動作ブロック22における文字認識処理では、文
字辞書23中に登録されている全ての文字標準パターン
との照合を行い、文字認識対象としている1文字相当の
入力イメージデータに近い上位n個の標準パターンに対
応する文字コードおよび距離値を出力する。
第5図は、@票の具体例を示す図面である。図中、29
は帳票、30は1番目の記入欄、31は2番目の記入欄
である。ここで示すような帳票に対して、イメージデー
タの取得を行うには、イメージスキャナ等により帳票2
9の上部から下部に向かって白黒のドツトイメージで読
取りを行う。この場合、記入130、および記入413
1を構成する罫線は、通常ドロップアウトカラーとよば
れる色で印刷しておき、イメージスキャナでは読み取ら
ないようにすることが一般的である。ドロップアウトカ
ラーの使用により、罫線が文字の一部として誤って取り
込まれることを防ぐことが可能となる。
第6図は、第2図に示した認識結果テーブルを用いて誤
認識文字の自動修正を実現するための動作原理を説明す
る図面である。図中、30は記入欄1.31は記入欄2
を示している。なお、第6図の動作は、第1図の説明中
の、オペレータによる修正処理から正解文字候補の並べ
替えまでの動作範囲を示している。また、説明を具体的
かつ簡明とするため以下の事項を前提にしている。
(1)帳票に記入された文字は、記入l!11について
は、1,2,3,4.5の5個の数字、記入欄2につい
ては1,2,3,1,2.3の6個の数字とする。
(2)前述の記入された数字の内、1および2は文字辞
書中の標準パターンとは異なる癖字である。
従って、1,2については文字認識の結果、正解文字候
補が1位にならず、1については7,2゜l・・・の順
位で、また、2については0,2.・・・の順位で文字
候補が出力されるものとする。
(3)同様の数字についての記入字形のばらつきは極め
て少ないとする。
前記の前提事業に基づく具体的な自動修正動作を以下に
示す。
■、オペレータによって修正が行われた文字位置におけ
る修正前の1位文字候補と正解文字候補の文字コードお
よびこれらの文字候補の並びを記憶する。
(例)第1文字目→1位文字候補=7,2位以下となっ
た正解文字候補=1 ■、前記記憶した1位文字候補および2位以下となった
正解文字候補を認識結果として出力している他の文字位
置を探索する。
■、前記の動作■で、前記動作ので記憶した認識文字と
同様の認識結果を出力している文字位置については、正
解文字候補を1位とする並べ替えを行う。従って、並べ
替えの結果、1位として出力された文字候補は2位に、
2位として出力された文字候補は3位へと順に下位にシ
フトする。
前述の動作の、■、■は、第6図に示した例の場合、記
入Wlの第1文字目および第2文字目に対して実行され
、同様の誤認識を起こしている記入1!J2の第1文字
目、第2文字目、第4文字目、および第5文字目につい
ては、自動的に正解文字を1位とする文字候補の並べ替
えが自動的に行われ、オペレータによる修正操作を省略
することができる。
第7図は、第2図に示した認識結果テーブルを用いて誤
認識文字の自動修正を実現するための動作原理を説明す
るための図面であり、文字候補の出力距離値を付加する
点で第6図に示した動作原理と異なる。
図中、30は記入欄1.31は記入s2を示している。
なお、第7図に示す動作についても、第1図の説明中の
、オペレータによる修正処理から、正解文字候補の並べ
替えまでの動作範囲を示している。また、説明を具体的
かつ簡明とするため、第6図の説明と同様に以下の事項
を前提にしている。
(1)@票に記入された文字は、記入欄1については1
,2,3,4.5の5個の数字、記入欄2については1
,2,3,1,2,3の6個の数字とする。
(2)前述の記入された数字の内、1および2は文字辞
書中の標準パターンとは異なる癖字である。
従って、1,2については文字認識の結果、正解文字候
補が1位にならず、1については7,2゜1・・・の順
位で、また、2については0,2.・・・の順位で文字
候補が出力されるものとする。
(3)同種数字についての記入字形のばらつきは極めて
少ないとする。さらに、第7図の固有の前提として以下
の事項を設定する。
(4)着目文字位置における修正文字候補および正解文
字候補の距離値と、他の文字位置における文字候補の距
離値との類似度判定は、着目文字位置の文字候補に付さ
れた距離値の±10以内をもって類似していると判定す
るものとする。
前記の前提に基づく具体的な自動修正動作を以下に示す
■、オペレータによって修正が行われた文字位置におけ
る、修正前の1位文字候補と正解文字候補の文字コード
および距離値、ならびにこれら文字候補の並びを記憶す
る。
(例)第1文字目→1位文字候補=7 その距離値=100 2位以下となった正解文学僕 補=1 その距離値=150 ■、前記記憶した1位文字候補および2位以下となった
正解文字候補を認識結果として出力している他の文字位
置を、距離値の類似性も合わせて探索する。
(例)記入欄1の第1文字目と記入欄2の第1文字目、
第4文字目がマツチ、 ■、前記動作■で、前記動作ので記憶した認識文字と同
様の認識結果を出力している文字位置については、正解
文字候補を1位とする並べ替えを行う。従って、並べ替
えの結果、1位として出力された文字候補は2位に、2
位として出力された文字候補は3位へと順に下位にシフ
トする。
前記の動作■、■、■は、第7図に示した例の場合、第
6図に示した例と同様に、記入1i1の第I文字目およ
び第2文字目に対して実行され、同様の誤認識を起こし
ている記入w12の第1文字目、第2文字目、第4文字
目、および第5文字目については、自動的に正解文字を
1位とする文字候補の並べ替えが自動的に行われ、オペ
レータによる修正操作を省略することができる。
なお、ここでは、数字を文字候補として説明したが、数
字以外の文字に対しても同様である。
以上、本発明を実施例にもとづき具体的に説明したが、
本発明は、前記実施例に限定されるものではなく、その
要旨を逸脱しない範囲において種々変更可能であること
は言うまでもない。
〔発明の効果〕
以上、説明したように、本発明によれば、類似誤認識結
果に対して1回の文字修正を行うだけで類似の誤認識が
生起している複数の文字位置に対する認識文字の自動修
正を行えるので、従来の多大の労力を要していた認識文
字に対する確認修正作業の大幅な省力化が可能な認識文
字修正方式を実現できるという顕著な効果を奏するもの
である。
【図面の簡単な説明】
第1図は、本発明を認識文字自動修正システムに適用し
た一実施例の概略構成を示すブロック図、第2図および
第3図は、帳票内の記入欄が2個の場合を例にメモリ内
に格納する認識結果テーブルの構成を示す図、 第4図は、本実施例の認識文字自動修正システムの全体
の動作を説明するための動作ブロック図。 第5図は、本実施例の帳票の具体例を示す図面、第6図
および第7図は、第2図に示した認識結果テーブルを用
いて誤認識文字の自動修正を実現するための動作原理を
説明するための図面である。 図中、1・・・文字認識手段、2・・・表示手段、3・
・・操作指示手段、4・・・メモリ、5・・・並べ替え
手段、6・・・制御手段、22・・・文字認識処理の動
作ブロック、23・・・文字辞書、24・・・確認修正
処理の動作ブロック、29・・・説明のためのサンプル
帳票、30・・・記入欄1.31・・・記入W2゜ (イメージデータ) 第4図

Claims (1)

    【特許請求の範囲】
  1. (1)文字認識結果に対する確認修正処理において、文
    字単位の認識を実行する文字認識手段と、文字認識結果
    を表示する手段と、確認の結果および修正指示を与える
    手段と、全文字認識結果を保持するテーブルと、正解文
    字候補が2位以下とされる誤認識に対して正解文字候補
    を1位とする修正が施された場合に他の文字位置につい
    て類似の誤認識が生起しているか否かを識別する並べ替
    え判定手段と、前記の各手段の動作を制御する制御手段
    とを備えた認識文字自動修正方式であって、前記並べ替
    え判定手段において、類似の誤認識が生起していると判
    断された文字位置に対して正解文字候補と推定される文
    字候補の順位を1位とする入れ替えを行うことを特徴と
    する認識文字自動修正方式。
JP2035855A 1990-02-16 1990-02-16 認識文字自動修正方式 Pending JPH03240183A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2035855A JPH03240183A (ja) 1990-02-16 1990-02-16 認識文字自動修正方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2035855A JPH03240183A (ja) 1990-02-16 1990-02-16 認識文字自動修正方式

Publications (1)

Publication Number Publication Date
JPH03240183A true JPH03240183A (ja) 1991-10-25

Family

ID=12453605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2035855A Pending JPH03240183A (ja) 1990-02-16 1990-02-16 認識文字自動修正方式

Country Status (1)

Country Link
JP (1) JPH03240183A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04199483A (ja) * 1990-11-29 1992-07-20 Fuji Xerox Co Ltd 文書認識修正装置
JP2010218041A (ja) * 2009-03-13 2010-09-30 Omron Corp 携帯式文字認識装置、文字認識プログラム及び文字認識方法
US8953910B2 (en) 2011-09-30 2015-02-10 International Business Machines Corporation Proof reading of text data generated through optical character recognition

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04199483A (ja) * 1990-11-29 1992-07-20 Fuji Xerox Co Ltd 文書認識修正装置
JP2010218041A (ja) * 2009-03-13 2010-09-30 Omron Corp 携帯式文字認識装置、文字認識プログラム及び文字認識方法
US8953910B2 (en) 2011-09-30 2015-02-10 International Business Machines Corporation Proof reading of text data generated through optical character recognition
US8971670B2 (en) 2011-09-30 2015-03-03 International Business Machines Corporation Proof reading of text data generated through optical character recognition

Similar Documents

Publication Publication Date Title
US4677585A (en) Method for obtaining common mode information and common field attribute information for a plurality of card images
JPH03240183A (ja) 認識文字自動修正方式
JPH07146918A (ja) 手書き文字認識装置
JPH1049623A (ja) 文字読取装置
JPS592191A (ja) 手書き日本語文の認識処理方式
JPS60217483A (ja) 文字認識装置
JPS61272882A (ja) 情報認識装置
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
JPH05108867A (ja) パターン認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP2746904B2 (ja) 文書読取り装置
JPH0612520A (ja) 文字認識装置の確認修正方式
JPS60254387A (ja) 文字認識装置における文字修正方法
JPH07320002A (ja) 文字認識装置
JPH07141468A (ja) 手書入力文字装置における手書文字認識処理方法
JPH0347553B2 (ja)
JPH0458381A (ja) 光学的文字読取装置
JPH0520490A (ja) 光学的文字読取修正システム
JP2004227130A (ja) イメージ処理システム
JPH08221508A (ja) 文字認識処理装置
JPH0612521A (ja) 光学文字読取システム
JPS60150190A (ja) 文字認識方法
JPH0793424A (ja) 帳票入力装置
JPS6385887A (ja) 文字認識システム
JPS6398788A (ja) 認識装置