JP3077580B2 - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JP3077580B2
JP3077580B2 JP08021137A JP2113796A JP3077580B2 JP 3077580 B2 JP3077580 B2 JP 3077580B2 JP 08021137 A JP08021137 A JP 08021137A JP 2113796 A JP2113796 A JP 2113796A JP 3077580 B2 JP3077580 B2 JP 3077580B2
Authority
JP
Japan
Prior art keywords
character
candidate
recognition
characters
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP08021137A
Other languages
English (en)
Other versions
JPH09212577A (ja
Inventor
一雄 有吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP08021137A priority Critical patent/JP3077580B2/ja
Publication of JPH09212577A publication Critical patent/JPH09212577A/ja
Application granted granted Critical
Publication of JP3077580B2 publication Critical patent/JP3077580B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文字(記号を含
む。)を表す画像データを得て、この画像データに基づ
いて画像中に含まれる文字を認識し、対応する文字コー
ドを出力する文字読取装置に関し、誤って認識された文
字の修正方式に関するものである。
【0002】
【従来の技術】文字読取装置(OCR)では、イメージ
スキャナやファクシミリ装置によって光学的に帳票を読
み取ることにより得られた画像データから、文字画像を
切出し、文字の特徴を認識用辞書の内容と比較・照合し
て、特徴量が最も類似している文字の文字コードが、認
識結果として出力される。さらに、特徴量が一定のレベ
ルで類似している複数の認識候補文字を出力することも
できる。しかし、文字の認識は必ずしも正確に行われる
とは限らないため、誤って認識された認識文字を正しい
文字に修正するための修正作業を事後的に行う必要があ
る。このような修正作業は、認識結果である認識文字を
表示装置に表示させ、キーボードやマウス等の指示入力
装置で修正操作をすることによって行われる。
【0003】次に誤認識文字を修正するための動作につ
いて説明する。図7において、表示装置の画面に表示さ
れた各認識結果表示フィールド21a〜21iのうち、
誤認識と思われる文字にカーソル22を合わせてクリッ
ク操作を行うことにより、当該認識文字の認識過程にお
いて抽出された複数の認識候補文字群23が表示され
る。ここの例では、類似度が第1位の文字”E”が認識
結果である文字となり、2番目に大きな類似度の文字”
B”は、第2位の認識候補文字、3番目に大きな類似度
の候補文字”6”は第3位の認識候補文字となる。(以
下4番目以降も同様)
【0004】表示された各認識候補文字は、類似度の大
きな文字であるから、この候補文字群のなかに正しい文
字が含まれている可能性が高い。そこで、認識候補文字
群23を表示させた後、操作者はさらに表示された認識
候補文字の中の正しい認識候補文字の位置にカーソル2
2を移動させ、この位置でクリック操作を行う。候補文
字の中に正しい認識文字が無い場合には、キーボードか
ら正しい文字を入力する。これらの操作により、誤認識
文字の修正を行なう。なお、この従来技術の方式は、例
えば特開平5−324901号公報に示されている。
【0005】
【発明が解決しようとする課題】従来の認識過程におい
て抽出された類似度の高い認識候補文字群のみを表示し
て、その中から正解文字を選択する方法では、認識候補
文字群の中に、正解文字が含まれていない場合には、正
しい文字を選ぶことはできず、別の操作(例えばキ−ボ
−ド操作)によって正しい文字を新規に入力する必要が
あり、修正効率が悪いという問題点があった。
【0006】この発明は、上記のような問題点を解消す
るためになされたもので、常に同じ操作で、認識結果を
正しい文字に修正できるようにする文字読取装置を提供
することを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
の請求項1記載の発明は、画像データで表された帳票の
文字を認識して、認識結果である認識文字を出力する認
識処理手段と、この認識処理手段が出力する認識文字を
画面に表示する認識文字表示手段と、この表示手段によ
り表示された認識文字のうち、任意の文字を画面上のカ
ーソルで指示するための文字指示手段とを備えた文字読
取装置において、各文字記入フィ−ルドの文字種情報と
文字種情報に対応した記入される可能性のあるすべての
候補文字群を定義情報とを保持したフォ−マットデ−タ
部を設け、文字指示手段からの指示入力に応答して、
示された文字の認識処理において抽出された複数の認識
候補文字群を先ず表示させ、その後当該文字が含まれる
文字記入フィ−ルドの文字種に対応したフォ−マットデ
−タ部の全ての候補文字群の少なくとも一部を上記画面
に表示させ、これらの候補文字群中の任意の候補文字を
上記文字指示手段で選択することにより、上記文字指示
手段で指示された文字位置の文字と置換するよう構成し
たものである。
【0008】また、請求項2記載の発明は、請求項1記
載の発明において、上記文字指示手段により指示された
文字の類似度が所定値より低い場合に、指示された文字
の認識処理において抽出された複数の認識候補文字群の
表示を行わず、直ちに上記フォ−マットデ−タ部の候補
文字群の表示を行わせるものである。以上
【0009】
【発明の実施の形態】
実施の形態1.図1は帳票の具体的な記入例を示すもの
で、1は帳票を示している。この帳票1は、文字記入フ
ィールド2a、2b、・・・から成り、各文字記入フィ
ールド2a、2b、・・・には文字が記入または印刷さ
れている。図2はこの発明の実施の形態1の文字読取装
置の概略構成図である。11は光電変換部で、図1で示
したような帳票1の表面を光学的に走査し、イメージデ
ータに変換する機能を持っている。文字認識部12で
は、このイメージデータからフォーマットデータ部14
に従って、各文字をそれぞれ切出し、その特徴パラメー
タを抽出して、特徴パラメータで示される各文字毎に、
文字認識辞書13に登録された標準パターンとの類似度
計算を行ない、記入または印刷された文字に対して、そ
れぞれ候補文字を求めている。文字認識部12で求めた
認識結果の第1候補各文字が、表示部15に表示され
る。16は前述の処理を制御するコントローラ、17、
18は、それぞれ、各種の情報を入力する為のキーボー
ドおよびマウスである。なお、上記フォーマットデータ
部14には、図5のように、各文字記入フィード単位に
認識対象文字種の情報51と、文字種情報に対応した候
補文字群情報52とを保持している。
【0010】上記構成による装置において、図1の帳票
を入力し、文字認識部12で認識した類似度の一番高い
文字の集まりを表示部15に表示した例が、図3(A)
である。図3(A)において、21a、21b、21c
・・・・は、それぞれ図1の各文字記入フィールド2
a、2b、2c・・・・の記入文字に対応した認識結果
表示フィールドである。図3(A)において、マウス1
8でマウスカーソル22を移動させ、例えば表示フィー
ルド21g中の修正対象文字”A”をクリックすると、
フォーマットデータ部14に定義されている、文字記入
フィールド2gに対応した認識対象文字種の候補文字群
情報が図3(B)に示すようにウィンドウ23に表示さ
れる。ウィンドウ23の中から正解文字”E”を選択し
てクリックする事により、フィールド21gのカーソル
位置の文字”A”を、ウィンドウ23で選択した文字”
E”に置き換える。以上のように、この実施の形態にお
いては、誤認識文字を常に同じ操作(例えばマウス操
作)によって修正する事ができる。
【0011】また、マウス18でマウスカーソル22を
移動させ、図4のように、フィールド21hをクリック
したとすると、そのフィールド2hに入力可能な文字種
の候補文字群”A、B、C”のみが表示されるため、簡
単に選択できるだけでなく、入力を許可していない文字
の誤入力を防止することもできる。
【0012】実施の形態2.図6はこの発明の実施の形
態2のFAXOCR装置の概略構成図で、図2の光電変
換部11にあたる部分をFAX受信部19に置き換えた
ものであり、外部から帳票の情報がFAX情報としてF
AX受信部19に到着した後の動作は、上記実施の形態
1と同様である。
【0013】実施の形態3.実施の形態1及び実施の形
態2では、候補文字の表示ウィンドウ23では、図5の
フォーマットデータ部で定義された順序で表示を行って
いたが、文字の認識過程における類似度の一番高い文字
が、このフォーマットデータに定義された文字の中に含
まれていた場合には、その文字を候補文字の先頭に移動
して表示し、類似度の2番目に高い文字があった場合に
は、2番目に移動して表示し、3番目以降の文字につい
ても同様にする事により、更に選択する文字を選びやす
くすることもできる。
【0014】実施の形態4.文字の認識過程における類
似度の一番高い文字の類似度が、あらかじめ指定した値
よりも高い文字に対しては従来通り、類似度の高い文字
を候補としてウィンドウ23に表示し、類似度の一番高
い文字の類似度が、あらかじめ指定した値よりも低い文
字に対しては、この発明のように、フォーマットデータ
部で定義された文字すべてを表示するというように、候
補文字の表示方法を自動的に切替えて、文字の訂正をし
やすくすることもできる。
【0015】実施の形態5.上記文字指示手段により指
示された文字の認識処理において抽出された複数の認識
候補文字群を先ず表示させ、これらの認識候補文字群中
に目的の文字が含まれていない(又はみつからない)場
合に、その後上記フォ−マットデ−タ部の候補文字群の
表示を行わせるよう構成しても差し支えない。このよう
に構成すれば一般的には認識候補文字群中に目的の文字
が含まれている場合が多いことから、第一次の修正を効
率良く行えるとともに、認識候補文字群中に目的の文字
が含まれていない場合の修正入力も効率的に行え、特に
沢山の候補文字群があるフィ−ルドについて有効とな
る。
【0016】
【発明の効果】この発明の文字読取装置によれば、認識
文字を画面に表示させて、誤読または認識不能文字を修
正する際に、当該修正対象文字をクリックする事によ
り、当該位置に記入される可能性のある文字すべてが候
補文字として表示されるため、必ず候補文字の中に正解
文字が存在し、常に同じ操作によって修正を行うことが
可能になる。
【0017】また、候補文字の選択ミスや、キーボード
からの誤入力により、当該位置に入力してはならない文
字等を入力してしまう事を防止できる。
【図面の簡単な説明】
【図1】この発明で取り扱う帳票の具体的な記入例を示
す図である。
【図2】この発明の実施の形態1の文字読取装置の構成
を示す概略構成図である。
【図3】この発明による認識結果表示及び修正指示画面
例を示す図である。
【図4】この発明による認識結果表示及び修正指示画面
の別例を示す図である。
【図5】この発明で用いるフォーマットデータ部のデ−
タ例を示す概念図である。
【図6】この発明の実施の形態2のFAXOCR装置の
構成を示す概略構成図である。
【図7】従来例の文字読取装置の修正画面を示す画面図
である。
【符号の説明】
1 OCR帳票 2(2a〜2i) 記入フィールド 11 光電変換部 12 文字認識部 13 文字認識辞書 14 フォーマットデータ部 15 表示部 17 キーボード 18 マウス

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 手書き、あるいは、印刷された文字画像
    データを読み取り、認識する認識処理部と、この認識処
    理部より出力される認識文字を表示する文字表示手段
    と、この表示手段に表示された文字群の中から任意の文
    字を指示するための文字指示手段とを備えた文字読取装
    置において、各文字記入フィ−ルドの文字種情報と文字
    種情報に対応した候補文字群情報とを保持したフォ−マ
    ットデ−タ部を設け、上記文字指示手段で指示された
    字について、当該文字の認識処理において抽出された複
    数の認識候補文字群を先ず表示させ、その後、当該文字
    が含まれる文字記入フィ−ルドの文字種に対応したフォ
    −マットデ−タ部の全ての候補文字の少なくとも一部を
    前記画面に表示させ、これらの候補文字群中の任意の候
    補文字を選択することにより、前記文字指示手段で指示
    された文字位置の文字と置換するよう構成したことを特
    徴とする文字読取装置。
  2. 【請求項2】 上記文字指示手段により指示された文字
    の類似度が所定値より低い場合に直ちに当該文字が
    含まれる文字記入フィ−ルドの文字種に対応したフォ−
    マットデ−タ部の全ての候補文字の少なくとも一部を前
    記画面に表示させ、この候補文字群中の任意の候補文字
    を選択することにより、前記文字指示手段で指示された
    文字位置の文字と置換するよう構成したことを特徴とす
    る請求項1記載の文字読取装置。
JP08021137A 1996-02-07 1996-02-07 文字読取装置 Expired - Lifetime JP3077580B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08021137A JP3077580B2 (ja) 1996-02-07 1996-02-07 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08021137A JP3077580B2 (ja) 1996-02-07 1996-02-07 文字読取装置

Publications (2)

Publication Number Publication Date
JPH09212577A JPH09212577A (ja) 1997-08-15
JP3077580B2 true JP3077580B2 (ja) 2000-08-14

Family

ID=12046519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08021137A Expired - Lifetime JP3077580B2 (ja) 1996-02-07 1996-02-07 文字読取装置

Country Status (1)

Country Link
JP (1) JP3077580B2 (ja)

Also Published As

Publication number Publication date
JPH09212577A (ja) 1997-08-15

Similar Documents

Publication Publication Date Title
US5717794A (en) Document recognition method and system
US5022081A (en) Information recognition system
JPS63155386A (ja) 帳票デ−タ読取装置
JP7387363B2 (ja) データ入力支援装置、データ入力支援方法及びプログラム
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP3077580B2 (ja) 文字読取装置
JP3319203B2 (ja) 文書ファイリング方法及び装置
JP3083171B2 (ja) 文字認識装置及び方法
JP2829186B2 (ja) 光学的文字読取装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP3221969B2 (ja) 文字認識装置
JPH08137987A (ja) 光学式文字読取装置
JPH0562008A (ja) 文字認識方法
JPH06290308A (ja) 文字認識装置
JPH06333083A (ja) 光学式文字読取装置
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JPH04293185A (ja) ファイリング装置
JP2950286B2 (ja) 画面イメージ読み取り装置
JPH0520492A (ja) 文書認識修正装置
JPH09237317A (ja) 一般文書読取装置
JPH06348889A (ja) 文字認識装置
JPH01287755A (ja) 修正機能付情報入力装置
JPS63208180A (ja) 文字認識装置
WO2001013325A1 (fr) Procede d'entree de document, support d'impression, programme d'entree de document a imprimer et dispositif d'entree de document