JPH08137987A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH08137987A
JPH08137987A JP6278871A JP27887194A JPH08137987A JP H08137987 A JPH08137987 A JP H08137987A JP 6278871 A JP6278871 A JP 6278871A JP 27887194 A JP27887194 A JP 27887194A JP H08137987 A JPH08137987 A JP H08137987A
Authority
JP
Japan
Prior art keywords
character
recognition
characters
quality
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6278871A
Other languages
English (en)
Inventor
Kiyoshi Kobayashi
清 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6278871A priority Critical patent/JPH08137987A/ja
Publication of JPH08137987A publication Critical patent/JPH08137987A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 読み取られた文字が不読または誤読であった
場合、不読または誤読の文字の修正時間を短縮する光学
式文字読取装置を提供する。 【構成】 帳票1に記入されている文字を読み取るスキ
ャナ部2と、スキャナ部2で読み取られた文字を1文字
ずつ切出す切出部3と、切出された文字を認識する文字
認識部4とを有し、この文字認識部4で認識された結果
を表示する表示部6を有する。表示部6には、不読また
は誤読の認識結果も表示され、不読または誤読の文字に
ついてはマウス部8を操作することにより、不読または
誤読の原因を表示部6に表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、媒体上の文字を光学的
に読取る光学式文字読取装置に関し、とくに誤読、不読
した場合に適する光学式文字読取装置に関する。
【0002】
【従来の技術】従来の光学式文字読取装置においては、
スキャナにより媒体上の文字を読取り、読み取られた画
像データは文字切出部へ送られて、ここで1文字1文字
の画像が切出される。切出された文字は、文字認識部へ
送られて認識される。認識された結果は、表示装置に出
力される。以上のように動作が行われるが、文字認識部
による認識の結果、誤読または不読と判断された場合
は、オペレータがキーボードにより誤読文字あるいは不
読文字を削除し、新たに文字を入力しなければならな
い。修正方法としては、キーボードよりかな漢字変換で
入力する方法や、候補文字や候補単語を表示して入力す
る。現在の認識技術ではまだ誤読あるいは不読される文
字は多く、その度に誤読文字あるいは不読文字の削除お
よび再入力を行わなければならない。
【0003】
【発明が解決しようとする課題】上記従来の光学式文字
読取装置においては、誤読または不読と判断された場
合、誤読あるいは不読した文字をいちいち削除し、その
後改めて入力し直さなければならないので、誤読あるい
は不読がある度にオペレータによる文字修正に時間を要
するという問題があった。
【0004】
【課題を解決するための手段】上記課題を解決するため
に本発明が講じた第1の解決手段は、媒体上の文字を光
学的に読取り、読取った文字パターンから特徴を抽出し
て1文字ずつ切り出し、認識部により認識辞書と照合し
て文字を認識する光学式文字読取装置において、前記認
識部による認識結果が不読または誤読となった場合、不
読または誤読の原因を出力する出力手段とを設けたもの
である。
【0005】また第2の解決手段として、文字品質の程
度に対応して設けられた複数の認識辞書と、文字品質の
程度を表示する表示手段とを有し、前記媒体上の文字に
合う文字品質が選択された後、選択された文字品質の認
識辞書と照合して前記媒体上の文字を認識するようにし
てもよい。
【0006】
【作用】第1の解決手段によれば、認識部による認識結
果が不読または誤読となった場合、出力手段が不読また
は誤読の原因を出力する。これによりオペレータは、不
読または誤読の原因を文字の記入者に知らせることがで
き、次の文字を記入する際の注意を促すことができる。
【0007】また第2の手段によれば、認識部による認
識結果が不読または誤読となった場合、オペレータの指
示に応じて、表示手段により文字品質の程度が表示され
る。不読または誤読となった文字と同じ程度の文字品質
が選択されると、この文字品質の程度に対応する認識辞
書と照合して再認識が行われる。読み取った文字と認識
辞書の品質の程度を合わせることにより、認識率が向上
するので、これにより不読または誤読文字の修正が可能
である。
【0008】
【実施例】以下、本発明に係る実施例を図面にしたがっ
て説明する。なお各図面に共通する要素には同一の符号
を付す。図1は本発明に係る第1実施例の構成を示すブ
ロック図である。
【0009】図1において、帳票1は文字等の読み取り
対象が記入される媒体である。スキャナ部2は、帳票1
上を走査されることにより帳票1上の文字等を読み取
り、画像データを文字切出部3へ送る。文字切出部3
は、送られてくる画像データから文字イメージを得て、
その文字の画像を1文字ずつ切出す。文字認識部4は、
文字画像を認識して文字コードを出力する。制御部5
は、前述のスキャナ部2、文字切出部3、文字認識部4
および表示部6、キーボード部7を制御する。表示部6
は、文字認識部4からの認識結果やキーボード部7から
の入力情報を表示する。キーボード部7は、オペレータ
により文字認識の指示操作や、認識結果の文字修正のた
めのキー入力を行う。またマウス部8は、表示部6にお
ける表示文字の指示や、認識の指示操作を行う。
【0010】図2は第1実施例で使用する帳票1の例を
示す説明図である。図2において、帳票1にはスキャナ
部2が読み取る文字フィールド1aが設けられ、この文
字フィールド1a内に文字を記入する文字枠9が設けら
れている。この文字枠9は、黒枠であり、この文字枠9
の中に文字あるいは数字が記入される。本実施例では、
数字1、2、3、4、5が記入されているとする。
【0011】次に動作を説明する。まず制御部5がスキ
ャナ部2に対して画像取込みの指示を出すと、スキャナ
部2により帳票1の文字フィールド1a内の記入文字
(この場合は数字)が読み取られる。読み取られた画像
は、文字切出部3へ送られ、ここで1文字毎の画像に切
出される。切出された画像は、文字認識部4へ送られて
認識され、その結果が表示部6へ表示される。
【0012】図3は表示部6に表示された認識結果を示
す説明図である。この認識は黒枠表形式で定義されてい
る。この認識結果を見ると、記入数字“5”が不読とな
っている。ここでオペレータは、キーボード部7により
表示部6のカーソルを不読文字の位置まで移動する。次
にオペレータは、マウス部8を使用し左ボタンでクリッ
クすると、修正イメージが表示部6に表示される。修正
イメージとは、フォーマットプログラムで指定された文
字枠領域の単なる取得イメージのことである。
【0013】図4は修正イメージを示す説明図である。
図4に示すように、修正イメージを表示させてみると記
入数字“5”が文字枠9に接しているように思われる
が、このことが原因で不読になったかどうかはわからな
い。
【0014】次にオペレータは、マウス部8の右ボタン
をダブルクリックして、記入数字“5”の修正イメージ
を拡大して表示するとともに、その隣に記入数字“5”
の文字切出し後の認識イメージを拡大して表示する。表
示した状態を図5に示す。図5に示すように、認識イメ
ージは、文字枠9から切り離されて表示される。
【0015】ここで文字枠の切り離しについて図6にし
たがって説明する。図6は文字切出し動作を示す説明図
である。同図において、文字枠の切り離しは、文字切出
し動作において行われる。まず記入数字“5”の文字枠
について、水平方向の射影パターンと垂直方向の射影パ
ターンを求める。文字切出し時に、文字枠の線幅を求め
て、文字枠の線の中心から終りの線の中心までの距離と
文字ピッチとを比較し、文字枠内の距離と線幅を差し引
いた文字ピッチとを比較する。これにより、水平方向の
射影パターンについては、上下の文字枠の線と接触して
いることはないと判断できるが、垂直方向の射影パター
ンについては、左右の文字枠の線と明らかに接触してい
ることがわかる。この場合、文字枠の線の中心と、線の
終りの位置と文字ピッチとを考慮し、強制的に文字枠の
線を切り離すこととしている。以上により、記入文字が
線に接触しているかどうかが判断できる。
【0016】認識イメージを表示させた後、図5に示す
ように、その隣に、記入数字“5”を何故不読したかの
原因のコメントを表示する。コメントの内容は、修正イ
メージを見ただけでは判断できないことにする。また原
因を表示した後、認識した文字(数字)の信頼度を表示
する。この信頼度とは、認識した文字が手書き標準文字
に対してどの程度の確からしさを有するかを示すもので
あり、信頼度が100%であれば、不読または誤読の可
能性は全くない。
【0017】ここで信頼度について説明する。本実施例
では、文字認識を構造化線素整合法により行い、文字認
識を行う際、認識結果が標準手書き字形にどの程度類似
しているかを示す距離値を求める。(構造化線素整合法
については、「沖電気研究開発」1992年10月、第
156号、第12頁参照)距離値は構造化線素整合法の
最終判断となる一次元の値であり、認識イメージと認識
辞書との照合結果を示す値である。本実施例では、この
距離値に基づいて信頼度を表示する。下記の表1に距離
値と信頼度の関係を示す。
【0018】
【表1】 表1において、例えば距離値が50のときは信頼度は80%
である。本実施例では、距離値が50以下のときは、その
距離値となった認識文字を認識結果とする。また、記入
数字“5”の認識結果において、認識文字“6”の距離
値が70で、認識文字“5”の距離値が80と求められたと
すると、認識文字“6”の信頼度は60%で、認識文字
“5”の信頼度は50%となる。
【0019】以上のように第1実施例によれば、文字不
読の原因を表示することにより、帳票1への文字の記入
者がその原因を容易に知ることができ、記入の際の注意
を促すことができる。これにより次回からの記入に際し
て、記入者に慎重を期させることができる。また不読の
原因のコメントとともに、認識文字の信頼度も表示する
ようにしているので、次回からの記入の際の目安とする
ことができる。なお上記実施例では、文字を不読した場
合を例に説明したが、誤読した場合も同様である。
【0020】次に本発明の第2実施例の光学式文字読取
装置を説明する。図7は第2実施例の光学式文字読取装
置の構成を示すブロック図である。同図において、第2
実施例の光学式文字読取装置の基本的構成は、図1に示
す第1実施例のものとほぼ同様である。異なる点は、第
2実施例における文字認識部11が複数の文字品質の認
識辞書を持っている点である。また第2実施例における
帳票12には、図8に示すように、文字フィールド12
a内に文字枠は設けられていない。図8は第2実施例の
帳票を示す説明図である。
【0021】第2実施例の動作を説明する。帳票12に
は図8に示す如く、数字1、2、3、4、5が記入され
ているとする。第1実施例と同様に、まず制御部5がス
キャナ部2に対して画像取込みの指示を出すと、スキャ
ナ部2により帳票12の文字フィールド12a内の記入
文字(この場合は数字)が読み取られる。読み取られた
画像は、文字切出部3へ送られ、ここで1文字毎の画像
に切出される。切出された画像は、文字認識部4へ送ら
れて認識され、その結果が表示部6へ表示される。
【0022】図9は表示された認識結果を示す説明図で
ある。図9から分かるように、記入数字“2”と“4”
が不読となり、記入数字“3が誤読となっている。
【0023】ここでオペレータは、キーボード部7ある
いはマウス部8により、表示部6のカーソルを不読数字
あるいは誤読数字に合わせて、修正したい文字(数字)
を1文字単位、数文字単位あるいはフィールド単位で、
マウス部8によりドラグして指定する。これにより表示
部6には、修正画面が表示される。
【0024】図10は修正画面を示す説明図である。修
正画面には「記入文字品質」として、「上」、「中」、
「下」の3種類の品質を選択できるようになっている。
ここでマウス部8により、「上」、「中」、「下」のい
ずれかの程度の「記入文字品質」を指定する。「記入文
字品質」の例を図11に示す。マウス部8での指定によ
り、図11に示すいずれかの程度の「記入文字品質」が
表示部6に表示される。図10には「下」の「記入文字
品質」が表示された場合を示す。オペレータは、帳票1
2あるいは修正イメージと、表示された「記入文字品
質」とを見比べて、品質の程度が合っている場合には、
「実行」をマウス部8で指定し、合っていなければ、別
の程度の「記入文字品質」を選択する。
【0025】「実行」が指定されると、制御部5は文字
認識部11に再認識を行わせる。このとき、選択された
「記入文字品質」の程度の認識辞書と照合して認識され
る。「記入文字品質」と認識辞書とのそれぞれの程度に
おける組み合わせにより、認識率は異なってくる。例え
ば、「記入文字品質」が「上」の文字を「下」の程度の
認識辞書で認識した場合は、認識率は下がり、「記入文
字品質」が「上」の文字を「上」の程度の認識辞書で認
識した場合は、認識率は上がる。この関係を下記の表2
に示す。
【0026】
【表2】 ただし、〇は、ほぼ読み取れる、△は、品質により誤不
読が発生し、その発生率が比較的多い、×は、ほとんど
読み取れない、となっている。
【0027】以上のように、「記入文字品質」の例を表
示することにより、実際に記入した文字の品質の程度を
速やかに知ることができ、その程度の認識辞書を即座に
選択できる。品質の程度を合わせた認識辞書により再認
識を行うことにより、図12に示すように、良好な認識
結果を得ることができる。図12は再認識後の認識結果
を示す説明図である。
【0028】上記実施例では、「記入文字品質」および
認識辞書の品質の種類を3種類としているが、さらに種
類の数を増やすことにより、より認識精度の向上した認
識結果を得ることができる。また、予めフォーマットプ
ログラムで文字品質の程度を指定しておくことにより、
システムとしての効率をアップすることができる。
【0029】図13は修正画面を示す説明図である。こ
の修正画面には、「記入文字品質」の他に、「信頼度表
示」と「マルチ修正」が表示されている。「記入文字品
質」を指定した後、マウス部8で「信頼度表示」を指定
すると、表示部6には信頼度とどの程度の品質の認識辞
書で再認識させるかを表示する。図14はこの表示例を
示す。
【0030】図14において、表示された信頼度(55
%)は、帳票12に実際に記入した文字(数字)が「記
入文字品質」の「下」の品質程度で、程度が「上」の認
識辞書で認識した場合の、記入文字(数字)全体の信頼
度である。オペレータは、信頼度が低いのを確認して、
マウス部8で「実行」を指定することにより、程度が
「下」の認識辞書で再認識させる。これにより図12に
示すような良好な認識結果を得ることができる。図14
に示す画面を表示することにより、記入文字の品質の程
度をオペレータが知らなくても、記入文字の品質の程度
に適した認識辞書で再認識を行うことができる。
【0031】図13に示す修正画面において、「記入文
字品質」を指定した後、マウス部8で「マルチ修正」を
指定すると、表示部6には、再認識させる文字(群)、
フィールド、複数フィールド、帳票全文字を選択させる
画面が表示される。「マルチ修正」は、2以上の文字を
一括して修正したい場合、どの程度の範囲で修正するか
を示す。「マルチ修正」画面を図15に示す。
【0032】図15において、オペレータは再認識させ
る単位をマウス部8で指定し、さらに「実行」を指定す
ることにより、再認識を実行させる。このようにどの程
度の範囲で修正するかが選択できることにより、適確な
修正を即座に実行することができる。
【0033】以上のように第2実施例においては、不読
あるいは誤読した場合、記入文字の品質の程度を即座に
知ることができるので、記入文字の程度に合った品質の
認識辞書による再認識を直ぐに実行できるので、修正時
間の短縮を図ることができる。
【0034】
【発明の効果】以上詳細に説明したように本発明によれ
ば、不読あるいは誤読した場合に、不読あるいは誤読の
原因を表示することにより、または文字品質の程度を表
示してその程度に合わせて再認識を行うことにより、文
字修正の時間を短縮することが可能になる。
【図面の簡単な説明】
【図1】第1実施例の構成を示すブロック図である。
【図2】第1実施例の帳票を示す説明図である。
【図3】第1実施例の認識結果を示す説明図である。
【図4】第1実施例の修正イメージを示す説明図であ
る。
【図5】第1実施例の表示画面を示す説明図である。
【図6】文字切出し動作を示す説明図である。
【図7】第2実施例の構成を示すブロック図である。
【図8】第2実施例の帳票を示す説明図である。
【図9】第2実施例の認識結果を示す説明図である。
【図10】第2実施例の修正画面を示す説明図である。
【図11】記入文字品質の例を示す説明図である。
【図12】再認識後の認識結果を示す説明図である。
【図13】第2実施例の修正画面を示す説明図である。
【図14】第2実施例の信頼度の表示を示す説明図であ
る。
【図15】第2実施例のマルチ修正画面を示す説明図で
ある。
【符号の説明】
1 帳票 4 文字認識部 5 制御部 8 マウス部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 媒体上の文字を光学的に読取り、読取っ
    た文字パターンから特徴を抽出して1文字ずつ切り出
    し、認識部により認識辞書と照合して文字を認識する光
    学式文字読取装置において、 前記認識部による認識結果が不読または誤読となった場
    合、不読または誤読の原因を出力する出力手段とを設け
    たことを特徴とする光学式文字読取装置。
  2. 【請求項2】 認識した文字の標準字形に対する信頼性
    を出力する手段を有する請求項1記載の光学式文字読取
    装置。
  3. 【請求項3】 媒体上の文字を光学的に読取り、読取っ
    た文字パターンから特徴を抽出して1文字ずつ切り出
    し、認識部により認識辞書と照合して文字を認識する光
    学式文字読取装置において、 文字品質の程度に対応して設けられた複数の認識辞書
    と、 文字品質の程度を表示する表示手段とを有し、 前記媒体上の文字に合う文字品質が選択された後、選択
    された文字品質の認識辞書と照合して前記媒体上の文字
    を認識することを特徴とする光学式文字読取装置。
  4. 【請求項4】 認識した文字の標準字形に対する信頼性
    を表示する手段を有する請求項3記載の光学式文字読取
    装置。
JP6278871A 1994-11-14 1994-11-14 光学式文字読取装置 Pending JPH08137987A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6278871A JPH08137987A (ja) 1994-11-14 1994-11-14 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6278871A JPH08137987A (ja) 1994-11-14 1994-11-14 光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPH08137987A true JPH08137987A (ja) 1996-05-31

Family

ID=17603286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6278871A Pending JPH08137987A (ja) 1994-11-14 1994-11-14 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPH08137987A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015049653A (ja) * 2013-08-30 2015-03-16 富士通株式会社 表示方法、表示プログラム及び表示装置
JP2018156308A (ja) * 2017-03-16 2018-10-04 富士ゼロックス株式会社 情報処理装置、情報処理システム及びプログラム
JP2020052498A (ja) * 2018-09-25 2020-04-02 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015049653A (ja) * 2013-08-30 2015-03-16 富士通株式会社 表示方法、表示プログラム及び表示装置
JP2018156308A (ja) * 2017-03-16 2018-10-04 富士ゼロックス株式会社 情報処理装置、情報処理システム及びプログラム
JP2020052498A (ja) * 2018-09-25 2020-04-02 富士ゼロックス株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
JPH06274680A (ja) 文書認識方法およびシステム
JPH08293001A (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
JP2835178B2 (ja) 文書読取装置
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP2021144307A (ja) 情報処理装置及びプログラム
JP4181328B2 (ja) 数式認識装置および数式認識方法
JPH08137987A (ja) 光学式文字読取装置
KR20010015963A (ko) 한자의 일자대조에 의한 교정 시스템
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JP3717971B2 (ja) 認識文字とイメージデータの対応的表示方法及び文字認識装置
JP2004341754A (ja) 文字認識結果修正装置及びその方法並びに文字認識結果修正プログラム
JP2829186B2 (ja) 光学的文字読取装置
JPH0388086A (ja) 文書読取装置
JPH04293185A (ja) ファイリング装置
JPH0916712A (ja) 文書読取装置
JPH09114918A (ja) 光学式文字読取装置
JP3077580B2 (ja) 文字読取装置
JP2023046687A (ja) 情報処理装置、情報処理方法、およびプログラム
JPS61198376A (ja) 光学的文字読取装置
JP2002133367A (ja) 文字認識装置
JPH06223221A (ja) 文字認識装置
JPH07239901A (ja) 光学式読み取り装置における文字修正方法
JPH103515A (ja) 画像処理方法及び装置
JP3045086B2 (ja) 光学式文字読取方法および装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030408