JPH07160814A - 光学式文字認識方法 - Google Patents

光学式文字認識方法

Info

Publication number
JPH07160814A
JPH07160814A JP5310255A JP31025593A JPH07160814A JP H07160814 A JPH07160814 A JP H07160814A JP 5310255 A JP5310255 A JP 5310255A JP 31025593 A JP31025593 A JP 31025593A JP H07160814 A JPH07160814 A JP H07160814A
Authority
JP
Japan
Prior art keywords
character
mode
character recognition
format information
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5310255A
Other languages
English (en)
Inventor
Yoshitaka Yamamoto
美貴 山本
Masato Teramoto
正人 寺本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5310255A priority Critical patent/JPH07160814A/ja
Publication of JPH07160814A publication Critical patent/JPH07160814A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 印刷基準の異なる複数の文字列をもつ帳票の
文字を高精度に読み取ることができるようにして、帳票
仕様の制限緩和を図る。 【構成】 文字認識対象領域ごとに文字切り出しモード
を変更することによって、同一帳票上に印刷基準の異な
る複数の文字認識領域を有する帳票の文字を、精度良く
読み取る。帳票の書式情報および切り出しモード選択フ
ラグをフォーマット情報内に設定し、このフラグを読み
出すことによって、文字列の切り出しモードを帳票エッ
ジからの絶対位置によって切り出す方法と、予めフォー
マット情報で設定した印刷を基準とする相対位置によっ
て切り出す方法とを選択する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、帳票毎に文字記入位置
にばらつきが大きいものや、同一帳票内で文字記入位置
の精度が高い部分と低い部分とが混在するものを精度よ
く認識することができるように、領域毎に認識対象文字
の切り出しモードを切り替えて行う光学式文字認識方法
に関する。
【0002】
【従来の技術】従来の文字認識装置においては、いわゆ
るOCR帳票のように、文字列が帳票エッジを基準とし
て精度よく印刷されている帳票の場合、文字列を帳票エ
ッジからの絶対位置により切り出す方法が一般的であっ
た。具体的には、帳票のエッジを検出し、エッジによる
傾き角の検出、エッジ間距離とフォーマット情報の帳票
長、帳票幅の比較により求めた縦/横長さ伸縮補正値を
用いて、文字列の正確な位置を確定している。一方、帳
票エッジからの印刷精度の低い帳票に対しては、帳票内
の非ドロップアウトカラーで印刷されたマーク、線分等
を予め位置の基準として指定しておき、この基準からの
相対位置により文字を切り出す方法が提案されている。
なお、ドロップカラーとは、人間の目には見えるが、光
学式文字認識装置では読み取れない色素を用いて帳票上
に記入するものである。これに対して、非ドロップアウ
トカラーでは、人間の目にも見えるが、光学式認識装置
でも読み取れる色素を用いて帳票上に記入するものであ
る。帳票上に印刷されたマークを基準として文字の位置
を指定する方法には、例えば特開平2−39387号公
報に記載された方法がある。この方法では、帳票用紙の
予め定めた場所に参照用マークを設けて、印刷された文
字列とこの参照用マーク間の距離を算出して、文字記入
枠の帳票上の本来の位置と実際に登録された位置との差
を補正することにより、読み取り精度の向上を図ってい
る。
【0003】
【発明が解決しようとする課題】従来の文字認識装置で
使用されている帳票は、次の2種類に分類することがで
きる。その1つは、いわゆるOCR帳票のように、認識
対象とする文字列が帳票エッジを基準として高い印刷精
度で印刷されている帳票である。この種の帳票上の文字
列を認識する場合、文字列の位置はフォーマット情報に
より指定されている帳票エッジからの距離により正確に
与えられる。他の1つは、ワードプロセッサ等の簡易印
刷により作成された印刷精度の低い帳票である。この帳
票は、印刷精度が低いために、文字列の位置を帳票エッ
ジからの距離により正確に与えることができない。しか
しながら、ワードプロセッサの印刷からも明らかなよう
に、帳票エッジに対する印刷ずれは大きいときがある
が、印刷相互間のずれは意外に小さい。このような性質
に着目して、前述の公報に記載された方法が提案され
た。すなわち、帳票内の線分等を位置の基準として予め
指定しておき、そこからの相対位置により文字列の位置
を確定する方法である。しかしながら、いずれの方法に
おいても、同一帳票上には同じ基準で印刷された文字列
しか存在しないことを前提にしているので、帳票上の全
ての文字列に対して同一の文字切り出し方法を用いるの
が通常である。これに対して、同一帳票上に異なる基準
で印刷された文字列が複数存在する場合に、先に述べた
文字切り出し方法のいずれか一方を使用して、文字の位
置を確定することは、文字認識率の点で問題であった。
このような帳票の具体例としては、次のようなものがあ
る。
【0004】例えば、帳票を印刷する際に既に確定して
いるデータと確定していないデータが同一帳票内に存在
する場合である。例えば、前者については帳票の種類を
識別するIDや帳票使用者を特定するナンバーなどが挙
げられる。これらのデータは、OCR文字などを用いて
プレ印刷することができるため、高い印刷精度で印刷す
ることが可能である。一方、後者については、帳票上に
印刷された記入枠に人間が後から記入したり、予め印刷
された文字位置を示すマークにあわせてゴム印などで押
印する場合がある。例えば、商品の申し込み等をする場
合に、申し込み用紙に記入する個数や金額などである。
このように、人間が後から帳票に文字を記入するために
印刷された記入枠やマークは、文字を記入する際のおお
よその位置を示すものであるため、帳票のエッジからの
位置について外れることが多い。このような帳票上の全
ての文字列に対して、帳票エッジからの絶対位置で文字
を切り出すことは文字認識率の低下につながる。また、
異なる基準で印刷または記入された文字列間には、位置
の相互関係が保持されていない。そのため、帳票内のあ
る基準からの相対位置によって、全ての文字列を正確に
切り出すのは不可能である。本発明の目的は、このよう
な従来の課題を解決し、印刷基準の異なる複数の文字列
を有する帳票の文字を、精度よく認識することが可能な
光学式文字認識方法を提供することにある。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明の光学式文字認識方法は、(イ)帳票のイメ
ージデータを画像メモリに格納し、格納されたイメージ
データ内の指定文字を切り出し、切り出された指定文字
に対して文字認識辞書とのマッチングにより文字認識処
理を行う光学式文字認識方法において、先ずフォーマッ
ト情報を入力する際に、予め設定してある文字認識領域
毎の切り出しモード選択フラグを入力し、各認識領域毎
に切り出しモード選択フラグを読み出して、切り出しモ
ード選択フラグに従って文字切り出しモードを変更する
ことを特徴としている。また、(ロ)文字切り出しモー
ドとして、帳票エッジを基準とした絶対位置により文字
の位置を確定し、文字を切り出す第1のモードと、予め
フォーマット情報により指定された、帳票内の非ドロッ
プアウトカラーの印刷を基準とした相対位置により文字
の位置を確定する第2のモードとを有することも特徴と
している。
【0006】
【作用】本発明においては、先ずフォーマット情報を文
字認識装置に入力する際に、そのフォーマット情報内に
従来の文字認識対象フィールドの位置情報に加え、帳票
に非ドロップアウトカラーで印刷された文字列および線
分(表枠等)の位置情報(書式情報)と共に、各文字列
毎の切り出しモード選択フラグを含ませる。文字認識装
置は、これらの位置情報および切り出しモード選択フラ
グをメモリに格納する。文字認識装置が帳票内の各文字
列を認識する際に、その認識領域毎に切り出しモード選
択フラグを読み出して、帳票エッジからの絶対位置によ
る文字切り出しモード(第1のモード)か、帳票内で予
め指定しておいた印刷を基準とした相対位置による文字
切り出しモード(第2のモード)のいずれか一方を選択
する。これにより、文字列の印刷基準に応じて切り出し
モードを選択することができるので、印刷基準の異なる
複数の文字列をもつ帳票の高精度による文字認識が可能
となる。
【0007】
【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図1は、本発明の一実施例を示す光学式文字
認識装置のブロック図である。図1において、10は光
学文字認識装置、11は帳票のフォーマット位置情報や
モードを選択するフラグを含むフォーマット情報、12
は帳票を入力するためのスキャナ部、13はイメージデ
ータを格納するための画像メモリ、14は帳票エッジ検
出、文字枠検出、文字列検出等の処理を行う認識プロセ
ッサ、15は基準の文字が登録されている認識辞書、1
6は全ての処理部を制御する制御プロセッサ、17は処
理結果を格納する等のワークメモリである。先ず最初に
文字認識を行う帳票のフォーマット情報11を文字認識
装置10にダウンロードする。このフォーマット情報1
1の内容は、図示していないが、前述のように文字認識
対象フィールドの位置情報に加え、帳票に非ドロップア
ウトカラーで印刷された文字列および線分(表枠等)の
位置情報(書式情報)と共に、各文字列毎の切り出しモ
ード選択フラグを含ませる。この情報は、画像メモリ1
3あるいはその他のメモリに格納しておく。次に、スキ
ャナ部12により帳票を入力して光電変換を行い、帳票
イメージデータを画像メモリ13に格納する。認識プロ
セッサ14は、フォーマット情報11より入力した文字
列の切り出しモード選択フラグにより、画像メモリ13
に格納されたイメージ画像に対して帳票エッジ検出また
は文字枠検出、文字列検出等の処理を行って文字を切り
出し、認識辞書15により文字認識処理を行なった後、
結果をワークメモリ17に格納する。
【0008】図2は、本発明で使用される帳票フォーマ
ット情報の例を示す図であり、図3は、本発明における
印刷ずれがある帳票の例を示す図である。以下、図2お
よび図3により認識対象文字の切り出しを実施する際の
動作を述べる。なお、本実施例で説明する文字切り出し
モードは、第1のモードおよび第2のモードとして
次のような方法を用いる。 帳票エッジを基準とするもの・・・図2では、帳票の
左上の縦横エッジ(端縁)を基準としている。 非ドロップアウトカラーで印刷された文字枠を基準と
するもの・・・図2では、帳票の文字枠24を基準とし
ている。 また、フォーマット情報11で指定された位置情報は、
帳票の左上端を原点とした情報であり、認識対象の各文
字列の切り出しモード選択フラグもフォーマット情報1
1により与える。この切り出しモード選択フラグは、該
当する文字列がどの基準から印刷されているかを表わす
ものである。すなわち、第1のモードであれば、帳票エ
ッジを基準に印刷されていること、第2のモードであれ
ば、非ドロップアウトカラーで印刷された文字枠を基準
に印刷されていること、を示している。
【0009】この切り出しモード選択フラグを作成する
ためには、次のような方法がある。基準とする帳票と複
数の入力帳票を比較し、認識対象とする文字列ごとに基
準帳票とのずれが最も少ない位置(帳票エッジ、線分な
ど)を検出する。また、この時のずれの最大値(ε1
ε2,ε3,ε4)を記憶しておく。このずれの最大値
(ε1,ε2,ε3,ε4)は、それぞれ文字列の(左方
向,上方向,右方向,下方向)のずれを表すものとす
る。このようにして検出した位置が、帳票エッジで、か
つずれの最大値が文字認識可能な位置のずれである基準
値(α1,α2,α3,α4)よりも小さい場合に、基準を
帳票エッジにする。つまり、第1のモードでの切り出し
を行う領域である。これ以外の場合には、ずれの最も少
ない位置を基準とする。つまり、第2のモードでの切り
出しを行う領域である。基準値(α1,α2,α3,α4
については、使用する文字認識処理(後述の図4のステ
ップ46参照)に固有の値であるため予めパラメータな
どで設定しておく。こうして検出した基準を、フラグに
設定する。本実施例では、この切り出しモード選択フラ
グを表現する一例として、帳票エッジを基準とするもの
を1、文字枠を基準とするものを0とする形式を挙げ
る。
【0010】図2は、図1におけるスキャナ部12で読
み取った帳票イメージ画像21であり、この外側に位置
する入力イメージ画像20は黒背景とする。図2におい
て、22は帳票原点、23は帳票における1番目の認識
領域内の文字列、24は帳票における2番目の認識領域
内の文字枠、50,56,57,52,53はそれぞれ
横方向エッジから帳票イメージ画像21までの距離、帳
票イメージ画像21から文字枠24までの距離、文字枠
24の左右の寸法、帳票原点22と1番目の認識領域2
3との距離、1番目の認識領域23の左右の寸法であ
り、51,54,55,58,59はそれぞれ縦方向エ
ッジから帳票イメージ画像21までの距離、帳票イメー
ジ画像21の上端から1番目の認識領域23の上端まで
の距離、1番目の認識領域23の縦横の寸法、帳票イメ
ージ画像21の上端から文字枠24の上端までの距離、
文字枠24の縦横の寸法である。なお、図2に示した認
識対象となる文字列23や文字枠24の帳票原点22か
らの位置(52〜59)は、フォーマット情報11で与
えられた値からのずれはない。
【0011】図3も、図2と同様に帳票イメージ画像の
一例であるが、文字枠34に印刷ずれがある場合を示し
ている。すなわち、この場合には、左方向および下方向
の各ずれの最大値ε1とε4がそれらの標準値α1とα4
りも大であるため、第2のモードにより切り出しを行う
ようにモード選択フラグは形式0となる。図4は、本発
明の一実施例を示す光学式文字認識方法の動作フローチ
ャートである。認識対象文字列の切り出しモードの選択
処理および文字認識処理は、以下のようにして実施され
る。先ず、帳票エッジ検出を行った後(ステップ4
0)、認識対象文字列のフォーマット情報11を入力し
(ステップ41)、入力された文字列の切り出しモード
選択フラグが1の場合には、帳票エッジによる文字切り
出しモードを選択する(ステップ42,43)。これ
は、図2、図3における文字列23、33に示す1番目
の認識領域に該当する。文字列の切り出し範囲は、エッ
ジ座標22(50,51)とフォーマット情報11よ
り、左上点が(50+52,51+54)、右下点が
(50+52+53,51+54+55)となる。文字
の検出は、この範囲内で連続した黒画素の追跡をX、Y
方向それぞれについて実施し、黒画素の固まりである黒
画素連結矩形を作成することによって行えば良い(ステ
ップ45)。
【0012】帳票エッジについては文字切り出し処理の
前に、求めておく必要がある(ステップ40)。その方
法の一つとして、まず帳票の左側エッジを求めるため
に、入力イメージ画像20を原点22からX方向にスキ
ャンし、黒から白に最初に変化する点を数箇所検出し、
これらの点を解とする直線の方程式を求める。これらの
点を求める際に、帳票が傾いていると、黒から白への最
初の変化点がエッジにならないことがある。そのため、
スキャンする位置は、帳票の傾きによる原点の位置ずれ
の影響を受けない帳票の中央部分とする。以上の処理を
Y方向についても行ない、帳票の上側エッジを表す直線
の方程式を求め、左側、上側エッジを表す2本の直線の
交点により帳票エッジの座標を検出するものとする。
【0013】一方、入力した切り出し方式選択フラグが
0の場合には、文字枠検出による文字切り出しモードを
選択する(42,44)。これは、図2、図3における
文字枠24、34、つまり2番目の認識領域に該当す
る。この文字枠を検出するために、フォーマット情報1
1で指定された文字枠の位置情報(56〜59)と文字
枠の位置ずれの最大値(ε1,ε2,ε3,ε4)を基に、
図3に示す文字枠検出領域35を設定する。文字枠検出
領域35の左上点は(50+56−ε1,51+58−
ε2)、右下点(50+56+57+ε3,51+58+
59+ε4)となる。この領域内で黒画素の固まりであ
る黒画素連結矩形を作成する。作成された矩形の中か
ら、縦、横の長さなどを用いて縦線、横線を検出し、検
出された線分を接続することによって文字枠34を検出
する(ステップ44)。次に、フォーマット情報11で
指定された文字の大きさ情報を用いて、先程検出した黒
画素連結矩形から文字のみを抽出する(ステップ4
5)。このようにして検出した文字矩形を文字認識処理
(ステップ46)に渡すことによって、文字の認識を実
現する。全ての文字列の認識処理が終了すれば(ステッ
プ47)、処理は終了となる。まだ、認識処理すべき文
字が残っていれば(ステップ47)、ステップ41に戻
って認識対象文字列のフォーマット情報を入力する。
【0014】以上の処理を全文字列について行なうこと
よって、帳票内の全文字の読み取りが可能となる。な
お、本実施例に加えて、帳票エッジより帳票イメージの
傾き角や検出された帳票幅、長さとフォーマット情報よ
り入力された値を比較することによって求められる長さ
補正値を使用すれば、帳票が大きく傾いた場合に有効で
ある。また、本実施例では、帳票エッジを基準とするモ
ードと文字枠を基準とするモードの組合せを取り上げた
が、これ以外にも帳票上に印刷されたマークや線分を基
準とするモードなど複数の文字切り出しモードを切り換
えて使用することも可能である。さらに、本処理を、左
右、又は左、又は右にタイミングマークを付した帳票や
文字入力枠に適用することにより、タイミングマークを
検出する必要のない位置を予め求めることができるた
め、処理の高速化を図ることができる。
【0015】
【発明の効果】以上説明したように、本発明によれば、
異なる基準によって印刷された複数の文字認識領域を有
する帳票の文字を、文字切り出しモードを切り替えるこ
とにより精度良く読み取ることが可能になるという効果
がある。
【図面の簡単な説明】
【図1】本発明が適用される光学式文字認識装置のブロ
ック構成図である。
【図2】本発明におけるフォーマット情報が示す帳票の
例の図である。
【図3】本発明における印刷ずれのある帳票の例を示す
図である。
【図4】本発明の一実施例を示す光学式文字認識方法の
動作フローチャートである。
【符号の説明】
10 文字認識装置 11 フォーマット情報 12 スキャナ部 13 画像メモリ 14 認識プロセッサ 15 認識辞書 16 制御プロセッサ 17 ワークメモリ 20,30 入力イメージ画像 21,31 帳票イメージ画像 23,33 1番目の認識領域の文字列 24,34 2番目の認識領域の文字枠 35 文字枠検出領域 22,32 帳票原点 50〜59,60〜65 距離、寸法

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 帳票のイメージデータを画像メモリに格
    納し、格納されたイメージデータ内の指定文字を切り出
    し、切り出された指定文字に対して文字認識辞書とのマ
    ッチングにより文字認識処理を行う光学式文字認識方法
    において、 先ずフォーマット情報を入力する際に、予め設定してあ
    る文字認識領域毎の切り出しモード選択フラグを入力
    し、各認識領域毎に該切り出しモード選択フラグを読み
    出して、該切り出しモード選択フラグに従って文字切り
    出しモードを変更することを特徴とする光学式文字認識
    方法。
  2. 【請求項2】 請求項1に記載の光学式文字認識方法に
    おいて、前記文字切り出しモードとして、帳票エッジを
    基準とした絶対位置により文字の位置を確定し、該文字
    を切り出す第1のモードと、予めフォーマット情報によ
    り指定された、帳票内の非ドロップアウトカラーの印刷
    を基準とした相対位置により文字の位置を確定する第2
    のモードとを有することを特徴とする光学式文字認識方
    法。
JP5310255A 1993-12-10 1993-12-10 光学式文字認識方法 Pending JPH07160814A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5310255A JPH07160814A (ja) 1993-12-10 1993-12-10 光学式文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5310255A JPH07160814A (ja) 1993-12-10 1993-12-10 光学式文字認識方法

Publications (1)

Publication Number Publication Date
JPH07160814A true JPH07160814A (ja) 1995-06-23

Family

ID=18003049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5310255A Pending JPH07160814A (ja) 1993-12-10 1993-12-10 光学式文字認識方法

Country Status (1)

Country Link
JP (1) JPH07160814A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008262368A (ja) * 2007-04-11 2008-10-30 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2009069951A (ja) * 2007-09-11 2009-04-02 Hitachi Computer Peripherals Co Ltd 文字認識装置及び文字認識装置における文字認識方法
JP2018163474A (ja) * 2017-03-24 2018-10-18 大日本印刷株式会社 照合装置、カード発行機

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008262368A (ja) * 2007-04-11 2008-10-30 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2009069951A (ja) * 2007-09-11 2009-04-02 Hitachi Computer Peripherals Co Ltd 文字認識装置及び文字認識装置における文字認識方法
JP2018163474A (ja) * 2017-03-24 2018-10-18 大日本印刷株式会社 照合装置、カード発行機

Similar Documents

Publication Publication Date Title
US5123062A (en) OCR for sequentially displaying document layout according to recognition process
JPH113430A (ja) 入力画像を基準画像に対応付ける方法、そのための装置、及びその方法を実現するプログラムを記憶した記憶媒体
JPH07160814A (ja) 光学式文字認識方法
JP3378439B2 (ja) 帳票画像作成装置
US7142733B1 (en) Document processing method, recording medium recording document processing program and document processing device
JPS6337487A (ja) 文字認識装置
JP4194301B2 (ja) 文字認識システムおよび文字認識プログラム
JPH03263282A (ja) 文字読取装置の文字切出し方法
JP2002230480A (ja) 文字認識装置および文字認識結果修正方法
KR100226804B1 (ko) 문서형식 판별방법
JP2636866B2 (ja) 情報処理方法
JPH07210628A (ja) 免許証読み取り装置
JPH08129607A (ja) 光学式文字認識方法
JP2001126025A (ja) Ocr用フォーマットパラメータ作成方法
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH0488488A (ja) 光学文字読取装置
JPH07192087A (ja) 光学文字読取装置
JPS6337488A (ja) 文字認識方法
JPS6219990A (ja) 文字認識装置
JP2954218B2 (ja) 画像処理方法及び装置
JPH0793479A (ja) 光学的文字読取装置
JP2003110845A (ja) 画像処理装置及びその制御方法並びにコンピュータプログラム及び記録媒体
JPH0962791A (ja) 文字認識装置及び文字認識方法
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JPH0916716A (ja) 文字認識方法及び文字認識装置並びに文字正規化方法及び文字正規化装置