JPH09114918A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH09114918A
JPH09114918A JP7269795A JP26979595A JPH09114918A JP H09114918 A JPH09114918 A JP H09114918A JP 7269795 A JP7269795 A JP 7269795A JP 26979595 A JP26979595 A JP 26979595A JP H09114918 A JPH09114918 A JP H09114918A
Authority
JP
Japan
Prior art keywords
character
unit
frame
black frame
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7269795A
Other languages
English (en)
Inventor
Kiyoshi Kobayashi
清 小林
Masafumi Shimoyama
雅史 下山
Yasuhiro Tamura
康弘 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7269795A priority Critical patent/JPH09114918A/ja
Publication of JPH09114918A publication Critical patent/JPH09114918A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 光学式文字読取装置(OCR)の処理時間を
短縮する。 【解決手段】 帳票1の画像をスキャナ部21が読取
る。文字切出部22は、スキャナ部21からの画像か
ら、帳票1中の文字枠の黒枠を検出する。黒枠が検出で
きたら、黒枠中の1文字単位の画像を切出してそれが表
示選択部23を介して文字認識部23へ与えられる。文
字認識部24での文字認識結果が表示部25に渡され、
それが表示される。ここで、スキャナ部21が画像を読
取る際に規格外のスキューが発生した場合、黒枠が検出
されず、文字切出部22は黒枠検出エラーの情報を出力
する。黒枠が検出できなかった場合、表示選択部23は
その情報を表示部25に渡す。表示部25では、黒枠検
出エラーの情報に対応する文字に対しては、リジェクト
文字を文字認識結果の代わりに表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票上の文字枠で
ある黒枠等に記入された文字に対して、文字認識を行う
光学式文字読取装置(以下、OCRという)に関するも
のである。
【0002】
【従来の技術】図2は、従来のOCRの構成ブロック図
である。このOCRは、走行中の帳票1を読取るスキャ
ナ2と、そのスキャナ2から出力される画像データから
文字イメージ画像を得て、それから1文字1文字の画像
を切出す文字切出部3とを備えている。文字切出部3の
出力側は、該文切出部3から得た画像に対する認識を行
って文字コードを出力する文字認識部4に接続されてい
る。文字認識部4の出力側には表示部5が接続されてい
る。スキャナ2、文字切出部3、文字認識部4、及び表
示部5は、それらの一連の制御を行う制御部6に接続さ
れている。表示部5は、文字認識部4で得られた認識結
果を制御部6の指示に基づいて表示したり、後述するキ
ーボード7を介して入力された入力文字を表示する機能
を有している。制御部6には、キーボード7及びマウス
8が接続されている。キーボード7やマウス8は、オペ
レータが文字認識の指示操作や認識結果に対する文字修
正を行うためのものである。次に、図2のOCRでの文
字認識方法を、図を参照しつつ、説明する。
【0003】図3は、図2の帳票中の文字枠を示す図で
あり、帳票1上の1フィールド10が示されている。帳
票1中には、例えば文字枠である黒枠11がある。黒枠
11は文字を記入する領域であり、孤立して存在する場
合もあれば、図3のように連続的に配置される場合もあ
る。ここでは、簡単のため黒枠11内に文字は記入され
ていない場合を説明する。なお、図3中の黒点は、黒枠
11の位置を特定するための基準点を示している。制御
部6の指示に基づき、スキャナ2は走行中の帳票1の画
像を取込む。取込まれた画像は文字切出部3に送られ、
そこで1文字1文字の画像に分離される。これを文字切
出しと呼ぶ。切出された画像が文字認識部4に送られ、
文字認識部4が文字認識を行なう。その文字認識の結果
が、表示部5に表示される。図4(i),(ii)は、表
示部に表示された図2の認識結果を説明する図である。
図4(i)は正常な認識結果であり、黒枠11内部に対
応する認識結果が例えば“φ”(スペース)で表示され
る。これは、帳票1の走行時のスキュー量が規格内で、
文字切出部3が正しく黒枠11を検出した結果である。
一方、図4(ii)は、帳票1の走行時に、規格外のスキ
ュー/伸縮が発生し、それが原因で黒枠11を正しく検
出できなかった場合の表示例である。ここで、文字切出
部3における黒枠の検出と画像の切出しを、次の図5〜
図7を参照して説明する。
【0004】図5(i),(ii)は、黒枠の検出方法の
説明図であり、黒枠検出範囲を示している。図6
(i),(ii),(iii)及び図7(i),(ii),(ii
i)は、文字切出しとその結果と文字認識結果の表示例を
示す図(その1,その2)である。黒枠11を検出する
場合、例えばフォーマット定義情報によって指定される
右の基準位置からのフィールド位置aと行位置bに基づ
き、文字切出部3はフィールド10における先頭(一番
左)の黒枠を検出する。フォーマット定義情報には、1
個の黒枠の高さh、幅w、ピッチp、及び線幅sも定義
されている。まず、図6(i)及び図7(i)のよう
に、黒枠検出範囲(b±R)での水平投影及び垂直投影
をとり、黒点数をカウントして黒枠と考えられるものが
あるかどうかをサーチする。例えば黒点数が所定の値よ
りも多ければ、黒枠11を形成する線が、その黒枠検出
範囲(b±R)にあることを示している。黒枠11の線
が検出できたら、その線幅sの中心からピッチp分右を
見て、次の黒枠11の線を同様にサーチする。黒枠11
の2番目の線と判断できるものがあれば、1個の黒枠の
両側が検出されたことになる。よって、幅wと垂直投影
した結果から、黒枠の線を除いた部分、つまり、左右の
線に挟まれた部分が、横方向の文字切出し寸法として求
められる。同様に縦方向に関しても、水平投影と高さh
と線幅sとから、縦方向の文字切出寸法が求められる。
以上により、縦横の切出し寸法が設定され、1文字分の
画像が、図6(ii) 中の一点鎖線のように切出される。
切出された画像に対する文字認識結果は、例えば図6の
(iii)のように、“φ”となる。図5(i)のように左
右方向に若干のずれが発生していても、それらのすべて
の黒枠11の線が、黒枠検出範囲(±R)にある場合、
黒枠の高さh、幅w、ピッチp、及び線幅sに基づき、
黒枠11の内側の画像がそれぞれ切出される。よって、
それらに対して文字認識を行なえば、図4(i)のよう
に、すべて結果は“φ”となる。
【0005】図7(i)のように黒枠検出範囲(±R)
内に、黒枠11の線に該当するものがない場合の処理を
説明する。文字切出部3は黒枠11を検出するため、フ
ォーマット定義情報によって指定される右の基準位置か
らのフィールド位置aと行位置bに基づき、フィールド
10における先頭(一番左)のサーチする。つまり、黒
枠検出範囲(b±R)での水平投影及び垂直投影をと
り、黒点数をカウントして黒枠11と考えられるものが
あるかどうかを横方向にサーチする。この場合は、黒枠
11を形成する線がその黒枠検出範囲(b±R)にない
ので、黒点数が所定の値よりも少ない。つまり、黒枠1
1を形成する線が検出できなったので、フォーマット定
義情報に基づき、単純に文字画像を切出す。つまり、文
字枠の高さh、幅w、ピッチp、及び線幅sに基づき、
黒枠11の線があった仮想して、その仮定した黒枠を除
いた1文字分の画像を切出す。仮想されて切出された画
像に対する認識により、認識結果の“1”が表示され
る。なぜならば、図7(ii)に一点鎖線で示したよう
に、切出された切出された画像中には、黒枠11の線が
実在し、その線が文字認識され、結果は図7(iii)のよ
うに“1”となる。もし、その画像中に他の文字がある
場合には黒枠11と混合された文字となり、それに対す
る認識結果は誤読文字或いは不読文字となる。従って、
図5(ii)のように左右方向に規格外のずれがあり、黒
枠検出範囲(±R)内に黒枠11の線に該当するものが
ない場合、文字認識結果は、図4(ii)のように“1”
が連続したものとなる。オペレータは、表示部5に表示
された認識結果と帳票1とを照合し、誤読或いは不読が
ないかを確認し、誤読がある場合にはキーボード7を用
いて誤読文字を削除したうえ、オペレータは誤読文字或
いは不読文字に対応する新たな文字入力を行なって修正
する。ここでの修正方式は、キーボード7から漢字変換
で入力する場合もあれば、候補文字や候補単語を表示し
てそれらを選択させる場合もある。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
OCRでは、次のような課題があった。帳票1を読取る
段階で規格外のスキュー或いは伸縮が発生すると、黒枠
検出にエラーが発生し、切出された画像に対する認識結
果に、誤読文字或いは不読文字が発生する。このスキュ
ー或いは伸縮に起因する誤読文字或いは不読文字を修正
するために、オペレータは、表示手段5に表示された認
識結果と帳票1とをいちいち見比べる。そして、誤読文
字或いは不読文字が発見された場合、オペレータはキー
ボード7から新たな文字を漢字入力したり、候補文字や
候補単語を選択して入力して修正を行なっている。シス
テム上、このような確認修正作業には、多大な労力と時
間がかかることになる。
【0007】
【課題を解決するための手段】第1の発明は、前記課題
を解決するために、文字を記入する文字枠を有した帳票
の画像から、その文字に対応する画像を1文字単位で順
次切出す文字切出部と、前記切出した画像に対する文字
認識を行ない、前記文字枠内に記載された文字を求める
文字認識部と、前記文字認識結果を表示する表示部と、
前記表示された文字認識結果を修正する修正手段とを備
えたOCRにおいて、次のような構成にしている。即
ち、第1の発明のOCRにおいて、前記文字切出部は、
前記帳票上の文字枠に関する情報を有したフォーマット
定義情報に基づき前記文字枠をサーチし、該サーチ結果
で該文字枠を検出した場合には該文字枠内の前記1文字
単位の画像を切出して前記文字認識部に与え、該サーチ
結果で該文字枠を検出できなかった場合には検出エラー
を示す情報を出力する構成としている。そして、前記表
示部では、前記検出エラーとなった文字枠に記入された
前記文字に対して、読取り不可能を示す文字を前記文字
認識結果の代わりに表示する構成にしている。第2の発
明は、OCRにおいて、次のような構成にしている。即
ち、前記文字切出部は、前記帳票上の文字枠に関する情
報を有したフォーマット定義情報に基づき前記文字枠を
サーチし、該サーチ結果で該文字枠を検出した場合には
該文字枠内の前記1文字単位の画像を切出して前記文字
認識部に与え、該サーチ結果で該文字枠を検出できなか
った場合には検出エラーを示す情報を出力する構成とし
ている。そして、前記表示部では、前記検出エラーとな
った文字枠に記入された前記文字に対して、予め表示文
字とその文字色と背景色字が設定された指定文字を前記
文字認識結果の代わりに表示する構成にしている。
【0008】第3の発明は、第1または第2の発明にお
ける前記文字切出部において前記文字枠を検出できなか
った場合、前記表示部には、前記文字認識結果の代わり
に表示する文字のほかに、その文字の周辺に、前記帳票
の画像の読取りで規格外のスキュー或いは伸縮が発生し
たことを示すメッセージを表示する構成にしている。第
4の発明は、第1〜第3の発明のOCRにおいて、前記
文字認識結果を修正する最初の段階で、前記規格外のス
キュー或いは伸縮の発生状況とそれに応じたメッセージ
とを前記表示部で表示する構成にしている。第5の発明
は、第1〜第4の発明のOCRにおいて、前記文字認識
結果を修正する段階で、その修正を帳票単位で行うか、
フィールド単位で行うか、または文字単位で行うかを選
択させる画面を表示部に表示して選択させ、その結果選
択された単位で、前記文字認識結果の代わりに表示され
た文字を一括して変換文字に変換していく構成にしてい
る。第6の発明は、第1〜第5の発明のOCRにおい
て、前記サーチ結果で該文字枠を検出できなかった場合
には、前記文字認識部がその文字枠に記入された文字に
対する文字認識を行わないように制御する構成にしてい
る。第1の発明によれば、以上のようにOCRを構成し
たので、文字切出部は、フォーマット定義情報に基づき
文字枠をサーチし、サーチ結果で文字枠を検出した場合
には、その文字枠内の1文字単位の画像を切出して文字
認識部に与える。文字認識部が文字認識を行うことでひ
の文字枠に記入され文字が求められる。その文字認識結
果の文字が表示部に表示される。一方、文字枠を検出で
きなかった場合には、検出エラーを示す情報が文字切出
部から出力される。表示部では、その検出エラーとなっ
た文字枠に記入された文字に対して、読取り不可能を示
す文字が、文字認識結果の代わりに表示される。即ち、
規格外のスキュー或いは伸縮が発生し、文字枠の例えば
黒枠が検出できない文字に対して、文字認識結果ではな
い読取り不可能を表す文字が表示される。
【0009】第2の発明によれば、規格外のスキュー或
いは伸縮が発生し、文字枠の例えば黒枠が検出できない
文字に対して、予め表示文字とその文字色と背景色字が
設定された指定文字が前記文字認識結果の代わりに表示
される。第3の発明によれば、第1または第2の発明
で、文字切出部において文字枠を検出できなかった場
合、表示部には、文字認識結果の代わりに表示される文
字のほかに、その文字の周辺に、規格外のスキュー或い
は伸縮が発生したことを示すメッセージが表示される。
第4の発明によれば、第1〜第3の発明のOCRにおい
て、文字認識結果を修正する最初の段階で、規格外のス
キュー或いは伸縮の発生率況とそれに応じたメッセージ
とが、表示部で表示される。第5の発明によれば、第1
〜第4の発明のOCRにおいて、文字認識結果を修正す
る段階で、その修正を帳票単位で行うか、フィールド単
位で行うか、または文字単位で行うかを選択させる画面
が表示部に表示され、オペレータによってそれが選択さ
れる。その結果で選択された単位で、文字認識結果の代
わりに表示された文字が一括して変換文字に変換され
る。第6の発明によれば、第1〜第5の発明のOCRに
おけるサーチの結果、文字枠を検出できなかった場合に
は、文字認識部がその文字枠に記入された文字に対する
文字認識を行わないように制御される。
【0010】
【発明の実施の形態】図1は、本発明の実施形態を示す
OCRの構成ブロック図である。このOCRは、図示し
ないイメージセンサである光電変換器と画像データ格納
用メモリ等で形成され、走行中の帳票1を読取るスキャ
ナ21を備えている。スキャナ21の出力側は、文字切
出部22に接続されている。文字切出部22は、スキャ
ナ21から出力される画像データから帳票1中の黒枠1
1を検出すると共に、フォーマット定義情報を参照し、
画像データから文字イメージとして1文字1文字の画像
を切出す機能を有している。文字切出部22の出力側に
は表示選択部24が接続され、表示選択部23の出力側
が文字認識部24と表示部25に接続されている。表示
選択部23は、文字切出部22で黒枠を検出できなった
とき、黒枠検出エラーの情報を表示部25に与え、検出
できた場合には、文字切出部22で切出された画像を文
字認識部24に与えるものである。スキャナ21、文字
切出部22、表示選択部23、文字認識部24、及び表
示部25は、それらの一連の制御を行う制御部26に接
続されている。文字認識部24は、表示選択部23から
与えられた各1文字分の画像に対する文字認識を辞書等
を参照して行うものであり、その認識結果の文字コード
が表示部25に与えられる構成である。表示部25は平
面ディスプレイ等で構成され、文字認識部24で得られ
た認識結果や、制御部26の指示に基づいた画像を表示
したり、従来と同様、キーボード27を介して入力され
た入力文字を表示する機能を有している。制御部26に
は、キーボード27及びマウス28が接続されている。
キーボード27やマウス28は、オペレータが文字認識
の指示操作を行うものでもあり、認識結果に対する修正
を行う修正手段でもある。
【0011】次に、図1のOCRの動作を説明する。こ
こでは、図3のフィールド10を有した帳票1に対する
文字認識を行なうものとする。制御部26の指示に基づ
き、スキャナ21は走行中の帳票1の画像を取込む。取
込まれた画像は文字切出部22に送られる。文字切出部
22は、従来とまったく同様にして、まず、帳票1中の
黒枠の検出を行なう。例えば、最初に横方向でサーチを
行ない、黒枠の左側の線の検出を行なう。左側の黒枠の
線が検出されたら、その右の黒枠の線と上下の線を検出
して、1文字分の画像を切出す。そして、制御部26は
表示選択部23を制御し、切出された画像を文字認識部
24に与え、そこで文字認識を行なわせる。そして、制
御部26は表示部25に指示を出し、その表示部25に
文字認識結果を表示させる。黒枠11が連続している場
合は、この一連の動作を繰返すことで、連続した黒枠1
1内に記入された各文字が、認識される。スキャナ部2
1で帳票1の読取りを行う際に規格外のスキュー或いは
伸縮が発生し、文字切出部22での黒枠検出で左側の黒
枠11の線を検出できなかった場合、文字切出部22は
制御部26に対して、黒枠検出不可能を示す情報「黒枠
検出エラー」を通知する。「黒枠検出エラー」の情報を
受取ると、制御部26は表示選択部23、文字認識部2
4、及び表示部25を制御し、該文字認識部24での文
字認識処理を行なわせずに、表示部25にリジェクト文
字(読取り不可能文字)に対応する指定文字の例えば
“?”を表示させる。これは、「黒枠検出エラー」の情
報に対応する文字の、文字認識結果の代わりになるもの
である。
【0012】図8は、規格外のスキュー/伸縮が発生し
た場合の表示例を示す図である。スキャナ部21での読
取りにおいて、規格外のスキュー或いは伸縮が発生し、
図3の黒枠の画像がすべてずれた状態で取込まれた場
合、表示部25の表示する文字認識結果は、図8のよう
にすべての“?”となる。この図8では、規格外のスキ
ュー或いは伸縮が発生した場合、無条件にリジェクト文
字“?”を表示しているが、これはオペレータが誤読で
はないと判断できる文字であれば、どの文字でもかまわ
ない。この「黒枠検出エラー」に対応する文字を本来の
リジェクト文字と区別するために、その回りを別の色で
囲むことで、さらにオペレータがその判断をしやすくな
る。図9(i)(ii)は、他の認識結果表示例を示す図
であり、同図(i)はその認識結果表示の設定登録を行
なう画面、及び同図(ii)は表示例である。規格外のス
キュー或いは伸縮が発生した場合に表示させる文字を設
定登録するために、予め、制御部26は表示部25で図
9(i)の画面を表示する。オペレータは、その画面上
で表示文字とその文字色と背景色等を選択して設定す
る。このように設定しておけば、「黒枠検出エラー」に
対応する文字は、例えば図9(ii)のようになり、本来
のリジェクト文字とは異なる。この表示例では、「黒枠
検出エラー」に対応する文字を白色の“E”とし、その
周囲を黒色に設定している。
【0013】図10は、メッセージを伴う認識結果表示
例を示す図である。帳票1における記入文字の品質によ
って発生した誤読或いは不読文字なのか、スキュー或い
は伸縮によって生じた誤読なのかを、オペレータに一早
く知らせるために、表示部25で表示する認識結果の周
辺に、規格外のスキュー或いは伸縮が発生した意のメッ
セージを表示すさせるようにしてもよい。図10の例で
は、認識結果の表示の下側に、確認メッセージとして、
スキュー或いは伸縮が発生した意のメッセージが表示さ
れている。例えば、該当する文字にカーソルがある場合
にそのメッセージを表示することで、オペレータは一早
くその情報を得ることができる。以上の例のように文字
認識結果を表示するようにすると、規格外のスキューや
伸縮が発生したことが、容易にオペレータに理解でき
る。ここで、一帳票分或いは複数枚の帳票に渡って、
「黒枠検出エラー」に対応する文字が発生した場合、オ
ペレータが規格外のスキューや伸縮が発生したことを理
解しても、それらに対する修正作業が完全に無くなるわ
けではない。以後の修正作業時間を短縮するために、制
御部26は1帳票分或いは複数枚の帳票分の「黒枠検出
エラー」の発生率をカウントしておく。そして、制御部
26は次の図11及び図12に示す画面を、修正作業の
最初に表示手段25に表示させる。
【0014】図11は、黒枠検出エラー情報の画面を示
す図であり、図12(i),(ii),(iii)は、図11
のメッセージ例である。修正作業の最初の画面では、カ
ウントした全体の「黒枠検出エラー」の発生率を表示す
る。表示方法としては、例えば図11のように、帳票の
通過率(何枚中、何枚エラーが発生したか?)とか、全
文字数中何文字で「黒枠検出エラー」が発生したかを示
す。さらに、最初の画面は、帳票単位での「黒枠検出エ
ラー」の発生率と、オペレータに対するメッセージとを
表示する。帳票単位での「黒枠検出エラー」の発生率を
示すことで、例えば、その発生率の経時変化がオペレー
タに理解される。メッセージは、全体の「黒枠検出エラ
ー」の発生率と帳票単位での「黒枠検出エラー」の発生
率とに基づき、選択されて表示される。図12(iii)の
ように、「黒枠検出エラー」の発生率が高い帳票は、修
正を行なわず、スキャナ部21から再入力させること
で、全体の作業時間が短縮する。また、図12(ii)の
ように、入力装置の清掃、消耗品の確認、入力方法の確
認、媒体の確認等を促すことで、入力装置の異常、消耗
品の減耗、入力方法の誤り、または媒体異常を発見でき
ることも考えられる。図11と図12(i),(ii),
(iii)のような画面に表示することで、全体の処理時間
が、大幅に短縮される。
【0015】次に、修正作業の短縮をするために、図1
のOCRに備えられた機能を説明する。前述のように、
規格外のスキュー或いは伸縮が発生したことが、オペレ
ータに理解されたとしても、それに対応する文字認識結
果を修正する時間が完全に無くなるわけではない。した
がって、修正時間をいかに短縮させるかが問題となる。
スキュー或いは伸縮により、「黒枠検出エラー」が1帳
票または1フィールドで全体で発生することも考えられ
る。本実施形態のOCRでは、制御部26が表示手段2
5に次の図13の画面を表示させる。図13は、図1の
表示する修正方法選択画面を示す図である。オペレータ
が修正画面上のメニューバーをマウス28で選択する
と、図13のような修正方法選択画面30が表示され
る。この図の例では、修正画面の一部に黒枠エラー修正
と銘された選択用領域31を出現させて修正方法選択画
面30としているが、修正画面とは、独立した画面で表
示してもよい。オペレータは、「黒枠検出エラー」の文
字の認識結果を変換する変換文字をキーボード27で入
力する。例えば“φ(スペース)”が入力される。そし
て、オペレータは、修正方法選択画面中で変換単位をマ
ウス28でクリックし、“了解”をクリックする。変換
単位としては、(1)1帳票すべてと、(2)フィール
ド単位と、(3)文字単位とが用意されている。
【0016】(1)1帳票すべてを選択した場合 “了解”をマウス28でクリックした時点で、対象帳票
1における「黒枠検出エラー」に対応するすべての文字
認識結果が変換され、例えば“φ”となる。 (2)フィールド単位を選択した場合 “了解”をマウス28でクリックした時点で、制御部2
6の指示により、表示部25の画面に、帳票1の文字認
識結果が表示される。そして、最初の「黒枠検出エラ
ー」発生フィールドの先頭に、カーソルが移される。オ
ペレータが(Ctrl+リターンキー)を押下すると、
その最初の「黒枠検出エラー」発生フィールド内の文字
認識結果が、すべて指定された変換文字に変換される。
最初の「黒枠検出エラー」発生フィールドの変換が終了
すると、カーソルは次の「黒枠検出エラー」発生フィー
ルドの先頭の文字認識結果に移される。以下、順に同じ
動作が、繰返し実施される。仮に、「黒枠検出エラー」
発生フィールドにおける認識結果を、変換文字以外の文
字に修正する場合には、キーボード27またはマウス2
8でカーソルを移動させた後、通常と同様にキー入力す
る。フィールド内の最終文字にカーソルを合わせてオペ
レータが(Ctrl+リターンキー)を押下すると、次
の「黒枠検出エラー」発生フィールドの先頭の文字認識
結果に、カーソルが移動する。
【0017】(3)文字単位を選択した場合 “了解”をマウス28でクリックした時点で、制御部2
6の指示により、表示部25の画面に、帳票1の文字認
識結果が表示される。そして、最初の「黒枠検出エラ
ー」の発生した文字の文字認識結果にカーソルが移る。
そして、オペレータの意思に基づきその文字認識結果が
変換文字に変換される。オペレータが(Ctrl+リタ
ーンキー)を押下すると、次の「黒枠検出エラー」の発
生した文字の文字認識結果にカーソルが移り、その文字
認識結果が変換文字に変換される。以下、同様にして、
最後の「黒枠検出エラー」の発生した文字の文字認識結
果まで、変換文字に変換される。図14は、帳票の記入
例とそれに対する認識結果を示す図である。帳票1中の
あるフィールドの黒枠11の6番目の文字に、リジェク
ト文字“?”と同様の「?」が記載されている場合で、
1番目から6番目の文字の文字認識結果がすべて“?”
となることもある。ここで、その6番目の文字が正しく
黒枠を検出して文字認識された結果で、6番目の文字の
文字認識結果が“?”となっいれば、例えば(1)の選
択で、その文字は指定文字の“φ”に変換されない。と
ころが、それが「黒枠検出エラー」の文字であったた
め、文字認識結果が“?”となっいた場合、(1)の選
択で、その文字は指定文字の“φ”に変換されてしま
う。つまり、切出し処理は正しくなくても、結果的に文
字認識結果が正しい文字が、変換されることになる。
(2),(3)の選択を行なうことで、このような場合
にも、対応がとれることになる。以上のように、本実施
形態では、次の(I)〜(VI)ような利点を有するOC
Rを実現できる。
【0018】(I) 黒枠11の線を検出できない「黒
枠検出エラー」に対応する文字に対して、リジェクト文
字を文字認識結果の代わりに表示部25で表示するよう
にしているので、規格外のスキュー或いは伸縮の発生で
誤読となる文字を、いちいち帳票1と見比べて発見する
必要がなくなる。即ち、オペレータの負担が低減される
と共に、OCRにおける処理時間の短縮が可能となって
いる。 (II) さらに、図4のように、本来のリジェクト文字
と区別する方策をとれば、規格外のスキュー或いは伸縮
が原因で読取り不可能となったことが、オペレータに容
易に判断できるようになる。 (III) 「黒枠検出エラー」が発生し場合、それに対応
する文字の文字認識結果の周辺に、規格外のスキュー或
いは伸縮が発生したことを示すメッセージを表示するこ
とで、不読文字等の発生原因が、オペレータに理解でき
るようになる。 (IV) 「黒枠検出エラー」の発生状況を踏まえ、例え
ば、帳票1を再入力した方がよいというようなッセージ
を画面に表示することで、OCR全体の処理時間を短縮
することができる。 (V) 修正方法を選択して行うことができるので、修
正に要する時間を短縮できる (VI) 「黒枠検出エラー」が発生した場合、それに対
応する文字の文字認識を行わない構成であるので、文字
認識部24での無駄な認識処理を省略でき、OCR全体
の処理時間が短縮できる。 なお、本発明は、上記実施形態に限定されず種々の変形
が可能である。例えば、表示選択部23は、文字切出部
22に組込まれたハード構成としてもよい。この場合に
は、制御部26を介して「黒枠検出エラー」の情報を表
示部25に与える。
【0019】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、文字切出部で文字枠をサーチした結果、該文
字枠を検出できなかった場合には検出エラーを示す情報
を出力する構成とし、表示部では、検出エラーとなった
文字枠に記入された文字に対して、読取り不可能を示す
文字を文字認識結果の代わりに表示するので、規格外の
スキュー或いは伸縮の発生で誤読となった文字を、いち
いち帳票と見比べて発見する必要がなくなる。即ち、オ
ペレータの負担が低減されると共に、OCRにおける処
理時間の短縮が可能となっている。第2の発明によれ
ば、検出エラーとなった文字枠に記入された文字に対し
て、予め表示文字とその文字色と背景色字が設定された
指定文字を文字認識結果の代わりに表示する構成にして
いるので、規格外のスキュー或いは伸縮が原因で読取り
不可能となった文字が、オペレータに容易に判断できる
ようになる。第3の発明によれば、第1または第2の発
明における文字切出部において前記文字枠を検出できな
かった場合、表示部には、規格外のスキュー或いは伸縮
が発生したことを示すメッセージを表示する構成にして
いるので、不読文字等の発生原因が、オペレータに理解
できるようになる。
【0020】第4の発明によれば、規格外のスキュー或
いは伸縮の発生状況とそれに応じたメッセージとを前記
表示部で表示する構成にしているので、帳票に対する処
理が合理化され、OCR全体の処理時間を短縮すること
ができる。第5の発明によれば、文字認識結果を修正す
る段階で、その修正方式を選択できる構成にしているの
で、修正に要する時間を短縮できる。第6の発明によれ
ば、文字枠を検出できなかった場合には、文字認識部が
その文字枠に記入された文字に対する文字認識を行わな
い構成であるので第1〜第5の発明のOCRにおける不
要な文字認識が省略される。即ち、OCRの文字認識処
理に要する時間が短縮できる。
【図面の簡単な説明】
【図1】本発明の実施形態を示すOCRの構成ブロック
図である。
【図2】従来のOCRの構成ブロック図である。
【図3】図2の帳票中の文字枠を示す図である。
【図4】表示部に表示された図2の認識結果を説明する
図である。
【図5】黒枠の検出方法の説明図である。
【図6】文字切出しとその結果と文字認識結果の表示例
を示す図(その1)である。
【図7】文字切出しとその結果と文字認識結果の表示例
を示す図(その2)である。
【図8】規格外のスキュー/伸縮が発生した場合の表示
例を示す図である。
【図9】他の認識結果表示例を示す図である。
【図10】メッセージを伴う認識結果表示例を示す図で
ある。
【図11】黒枠検出エラー情報の画面を示す図である。
【図12】図11のメッセージ例である。
【図13】図1の表示する修正方法選択画面を示す図で
ある。
【図14】帳票の記入例とそれに対する認識結果を示す
図である。
【符号の説明】
1 帳票 10 フィールド 11 黒枠(文字枠) 21 スキャナ部 22 文字切出部 23 表示選択部 24 文字認識部 25 表示部 26 制御部 27 キーボード 28 マウス 30 修正方法選択画面

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文字を記入する文字枠を有した帳票の画
    像から、その文字に対応する画像を1文字単位で順次切
    出す文字切出部と、 前記切出した画像に対する文字認識を行ない、前記文字
    枠内に記載された文字を求める文字認識部と、 前記文字認識結果を表示する表示部と、 前記表示された文字認識結果を修正する修正手段とを、
    備えた光学式文字読取装置において、 前記文字切出部は、前記帳票上の文字枠に関する情報を
    有したフォーマット定義情報に基づき前記文字枠をサー
    チし、該サーチ結果で該文字枠を検出した場合には該文
    字枠内の前記1文字単位の画像を切出して前記文字認識
    部に与え、該サーチ結果で該文字枠を検出できなかった
    場合には検出エラーを示す情報を出力する構成とし、 前記表示部では、前記検出エラーとなった文字枠に記入
    された前記文字に対して、読取り不可能を示す文字を前
    記文字認識結果の代わりに表示する構成としたことを特
    徴とする光学式文字読取装置。
  2. 【請求項2】 文字を記入する文字枠を有した帳票の画
    像から、その文字に対応する画像を1文字単位で順次切
    出す文字切出部と、 前記切出した画像に対する文字認識を行ない、前記文字
    枠内に記載された文字を求める文字認識部と、 前記文字認識結果を表示する表示部と、 前記表示された文字認識結果を修正する修正手段とを、
    備えた光学式文字読取装置において、 前記文字切出部は、前記帳票上の文字枠に関する情報を
    有したフォーマット定義情報に基づき前記文字枠をサー
    チし、該サーチ結果で該文字枠を検出した場合には該文
    字枠内の前記1文字単位の画像を切出して前記文字認識
    部に与え、該サーチ結果で該文字枠を検出できなかった
    場合には検出エラーを示す情報を出力する構成とし、 前記表示部では、前記検出エラーとなった文字枠に記入
    された前記文字に対して、予め表示文字とその文字色と
    背景色字が設定された指定文字を前記文字認識結果の代
    わりに表示する構成にしたことを特徴とする光学式文字
    読取装置。
  3. 【請求項3】 前記文字切出部において前記文字枠を検
    出できなかった場合、前記表示部には、前記文字認識結
    果の代わりに表示する文字のほかに、その文字の周辺
    に、前記帳票の画像の読取りで規格外のスキュー或いは
    伸縮が発生したことを示すメッセージを表示する構成に
    したことを特徴とする請求項1または2記載の光学式文
    字読取装置。
  4. 【請求項4】 前記文字認識結果を修正する最初の段階
    で、前記規格外のスキュー或いは伸縮の発生状況とそれ
    に応じたメッセージとを前記表示部で表示する構成にし
    たことを特徴とする請求項1、2または3記載の光学式
    文字読取装置。
  5. 【請求項5】 前記文字認識結果を修正する段階で、そ
    の修正を帳票単位で行うか、フィールド単位で行うか、
    または文字単位で行うかを選択させる画面を表示部に表
    示して選択させ、その結果選択された単位で、前記文字
    認識結果の代わりに表示された文字を一括して変換文字
    に変換していく構成にしたことを特徴とする請求項1、
    2、3または4記載の光学式文字読取装置。
  6. 【請求項6】 前記サーチ結果で該文字枠を検出できな
    かった場合には、前記文字認識部がその文字枠に記入さ
    れた文字に対する文字認識を行わないように制御する構
    成にしたことを特徴とする請求項1、2、3、4または
    5記載の光学式文字読取装置。
JP7269795A 1995-10-18 1995-10-18 光学式文字読取装置 Withdrawn JPH09114918A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7269795A JPH09114918A (ja) 1995-10-18 1995-10-18 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7269795A JPH09114918A (ja) 1995-10-18 1995-10-18 光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPH09114918A true JPH09114918A (ja) 1997-05-02

Family

ID=17477277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7269795A Withdrawn JPH09114918A (ja) 1995-10-18 1995-10-18 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPH09114918A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5661214B1 (ja) * 2014-09-02 2015-01-28 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP2016066302A (ja) * 2014-09-25 2016-04-28 公立大学法人公立はこだて未来大学 プログラム
US9449223B2 (en) 2014-05-27 2016-09-20 Kyocera Document Solutions Inc. Image processing device and image forming apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9449223B2 (en) 2014-05-27 2016-09-20 Kyocera Document Solutions Inc. Image processing device and image forming apparatus
JP5661214B1 (ja) * 2014-09-02 2015-01-28 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP2015185157A (ja) * 2014-09-02 2015-10-22 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP2016066302A (ja) * 2014-09-25 2016-04-28 公立大学法人公立はこだて未来大学 プログラム

Similar Documents

Publication Publication Date Title
US5025484A (en) Character reader device
JP6472218B2 (ja) 文字認識システム及び文字認識方法
JP2835178B2 (ja) 文書読取装置
CN113378839A (zh) 信息处理装置、信息处理方法及计算机可读介质
JPH1021326A (ja) 認識結果表示方法および文字認識システムおよび情報記録媒体
JP2010061471A (ja) 文字認識装置およびプログラム
US5233672A (en) Character reader and recognizer with a specialized editing function
JP2006277001A (ja) 入力イメージ表示方法および入力イメージ表示プログラム
JPH09114918A (ja) 光学式文字読取装置
WO2002003240A1 (en) Proofreading system of chinese characters by means of one-to-one comparison
JPH08329187A (ja) 文書読取装置
JPH08137987A (ja) 光学式文字読取装置
JPH0363895A (ja) 文字認識方式
JPH0388086A (ja) 文書読取装置
JPS594358Y2 (ja) 文字修正における文字制御装置
JPH06223221A (ja) 文字認識装置
JP3221969B2 (ja) 文字認識装置
JPS61198376A (ja) 光学的文字読取装置
JPH096903A (ja) フォーマット情報生成方法
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP3077580B2 (ja) 文字読取装置
JPH05298474A (ja) 光学的文字読取装置
JPH01189788A (ja) 文字読取装置
JPS61198375A (ja) 光学的文字読取装置
JPH01134584A (ja) 文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030107