JPH11353412A - 文字記入座標の補正方法、フォーマット選択方法及び光学式文字読取装置 - Google Patents

文字記入座標の補正方法、フォーマット選択方法及び光学式文字読取装置

Info

Publication number
JPH11353412A
JPH11353412A JP10158984A JP15898498A JPH11353412A JP H11353412 A JPH11353412 A JP H11353412A JP 10158984 A JP10158984 A JP 10158984A JP 15898498 A JP15898498 A JP 15898498A JP H11353412 A JPH11353412 A JP H11353412A
Authority
JP
Japan
Prior art keywords
image
line segment
coordinates
format
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10158984A
Other languages
English (en)
Inventor
Katsumi Fukuchi
克己 福地
Mitsuru Takiguchi
充 瀧口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10158984A priority Critical patent/JPH11353412A/ja
Publication of JPH11353412A publication Critical patent/JPH11353412A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 入力帳票にずれがあっても精度の高い文字認
識が可能な文字読取装置を実現する。 【構成】 基準帳票のイメージI0 を入力手段11を介
して取込み、線分抽出部13を用いて該イメージI0
ら線分を抽出し、その座標を予め「線分フォーマット」
0 として線分フォーマットメモリ14に格納してお
く。線分抽出部13は、入力帳票のイメージI1 から線
分を抽出し、その「線分情報」S1 として比較部15に
与える。比較部15により、「線分フォーマット」S0
と「線分情報」S1 とが比較され、入力帳票のずれに対
応する誤差ex ,ey が求められる。切出し部17がイ
メージI1 から切出して認識部18で文字認識される文
字記入位置の座標が、補正部16によって誤差ex ,e
y 分だけ補正される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像イメージにお
ける文字記入位置の座標を補正する文字記入座標の補正
方法と、入力帳票に対応するフォーマットを選択するフ
ォーマット選択方法と、それらを用いる光学式文字読取
装置(以下、OCRという)とに関するものである。
【0002】
【従来の技術】図2(a),(b)は、従来の文字記入
位置の座標を示す説明図である。帳票1には、文字を記
入するための文字記入位置2が決まっているものが多数
ある。このような帳票1に記載された文字を認識するO
CR等では、予め、文字記入位置2の座標をフォーマッ
ト情報として登録し、実際の認識対象の帳票1のイメー
ジを取得したときに、そのイメージから、フォーマット
情報の文字記入位置2の座標に基づいて該文字記入位置
2に対応する領域を切出して文字認識を行う。このよう
に文字記入位置2に対応する領域を切出して文字認識を
行うことにより、文字認識の速度と精度が向上する。
【0003】従来のOCR等では、予め文字記入位置2
の座標を登録する場合には、図2(a)のように、基準
となる帳票1のイメージにおいて、横辺を水平座標軸X
に合わせると共に、帳票1の左上隅を垂直座標軸Yと水
平座標軸Xとの交点座標(0,0)とし、このときの文
字記入位置2の座標(x1 ,y1 )を求める。これに対
し、実際の認識対象の帳票1をイメージリーダ等の入力
手段で取得すると、その帳票1のイメージでは、図2
(b)のように、該入力手段の機械的誤差等により、帳
票1の左上隅の座標が、誤差分ex ,ey だけずれて
(ex ,e y )になる。この場合、帳票1の文字記入位
置2の座標は、(x1 +ex ,y1+ey )になる。
【0004】そのため、従来のOCRでは、次の(i)
または(ii)の方法によって、誤差ex ,ey を求め
る。 (i) 背景が黒であるイメージリーダを使用して帳票
1のイメージを取得し、該イメージにおける背景の黒と
帳票1の白との差から、該帳票の辺を抽出して左上隅の
座標を算出する。 (ii) 帳票1の特定の位置の例えば4隅に基準となる
マークを予め印刷しておき、イメージにおける各マーク
の位置の座標から帳票1の左上隅の座標(ex,ey
を算出する。上記(i)または(ii)で求めたex ,e
y を、フォーマット情報として登録された座標(x1
1 )に加算して補正し、その領域を切出して文字に認
識を行う。即ち、誤差ex ,ey に対応する平行移動を
行って、領域を切出すのである。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
文字記入座標の補正方法では、次のような課題があっ
た。汎用のイメージリーダは、背景が白であり、前記
(i)の方法を採用する場合には、特製のイメージリー
ダが入力手段として必要になり、OCRのコスト低減が
制約されていた。また、ファクシミリ装置を入力手段と
する場合には、該ファクシミリ装置が入力するイメージ
の背景は白であり、やはり(i)の方法は採用できなか
った。一方、前記(ii)の方法では、基準となるマーク
が印刷されていることが前提であり、一般のマークのな
い帳票1には適用できなかった。
【0006】
【課題を解決するための手段】前記課題を解決するため
に、本発明のうちの第1の発明は、逐次与えられる入力
帳票のイメージを取込み、予めフォーマットに登録され
ている座標を参照して該各入力帳票のイメージ中の文字
記入位置の文字パターンを認識するOCRに対し、前記
入力帳票毎に前記参照する座標の補正を行う文字記入座
標の補正方法において、次のような方法を講じている。
【0007】即ち、予め、前記逐次与えられる入力帳票
に対して基準となる基準帳票のイメージを取込み該イメ
ージ中の複数の線分を抽出して該各線分の座標を前記フ
ォーマットに登録する線分フォーマット登録処理を行っ
ておき、前記与えられた入力帳票のイメージ中の複数の
線分を抽出して該各線分の座標を線分情報として抽出す
る線分情報抽出処理と、前記基準帳票の線分のうちの1
本を基準線分として選択する選択処理と、前記入力帳票
のイメージ中の複数の線分のうちの1本の線分を前記基
準線分に対応する線分と仮定して前記基準帳票のイメー
ジまたは該入力帳票のイメージにおける残りの線分の座
標を平行移動して比較し、該基準帳票のイメージ及び入
力帳票のイメージにおける残りの線分の座標の一致具合
を求る処理を該仮定を換えて繰り返し、該各一致具合に
基づき該基準線分に相当する該入力帳票の線分を特定す
る比較処理と、前記比較処理の結果で特定された線分の
前記入力帳票のイメージにおける座標と前記基準線分の
前記基準帳票のイメージにおける座標との間の誤差を算
出し、該算出した誤差に基づき、前記OCRが参照する
座標を補正する補正処理とを、行うようにしている。
【0008】このような構成を採用したことにより、基
準帳票の基準線分に相当する入力帳票の線分が、比較処
理によって特定されると共に、その基準線分と、特定さ
れた入力帳票の線分との座標差が誤差として算出され
る。補正処理により、誤差に基づき、OCRが認識で参
照する文字記入位置の座標が補正される。
【0009】第2の発明では、第1の発明の文字記入座
標の補正方法において、次のような方法を講じている。
即ち、前記基準帳票のイメージ中の複数の線分の傾きを
それぞれ求めると共にその平均値を求め、該平均値から
一定以上傾きが離れた線分は前記フォーマットから除外
し、前記入力帳票のイメージ中の複数の線分の傾きをそ
れぞれ求めると共にその平均値を求め、該平均値から一
定以上傾きが離れた線分は、前記線分情報から除外する
除外処理を前記選択処理及び前記比較処理の前に行うよ
うにしている。このような構成を採用したことにより、
入力帳票或いは基準帳票のイメージが傾いていても、該
入力帳票或いは基準帳票の中でフォーマット或いは線分
情報としてふさわしくない線分が、除去処理で除去され
る。
【0010】第3の発明は、逐次与えられる複数種類の
入力帳票のイメージを取込み、予め複数種類のフォーマ
ットに登録されている座標を参照して該各入力帳票のイ
メージ中の文字記入位置の文字パターンを認識するOC
Rに対し、該各入力帳票にそれぞれ対応する前記フォー
マットを選択するフォーマット選択方法において、次の
ような方法を講じている。即ち、予め、前記入力帳票の
種類毎の基準となる基準帳票のイメージを取込み該イメ
ージ中の複数の線分を抽出して該各線分の座標を該種類
毎の前記フォーマットにそれぞれ登録する線分フォーマ
ット登録処理と、第1の発明における線分情報抽出処理
とを行っておく。そして、前記与えられた入力帳票に対
し前記複数種類のフォーマットのうちから順に1つのフ
ォーマットを選択し、該選択したフォーマット毎に、請
求項1記載の選択処理と、前記入力帳票のイメージ中の
複数の線分のうちの1本の線分を前記基準線分に対応す
る線分と仮定して前記基準帳票のイメージまたは該入力
帳票のイメージにおける残りの線分の座標を平行移動し
て比較し、該基準帳票のイメージ及び入力帳票のイメー
ジにおける残りの線分の座標の一致具合を求める処理と
を該線分の仮定を換えて繰り返すフォーマット評価処理
を行う。さらに、前記フォーマット毎の一致具合に基づ
き、前記入力帳票の種類に対応する前記フォーマットを
特定するようにしている。
【0011】このような構成を採用したことにより、複
数種類の入力帳票がある場合に、各種類毎の基準帳票の
基準線分と入力帳票の仮定された線分とが比較されて、
フォーマット評価処理により、それらの一致具合が求め
られる。その一致具合から、力帳票に対応したフォーマ
ットが特定される。
【0012】第4の発明は、第3の発明のフォーマット
選択方法において、次のような方法を講じている。即
ち、前記フォーマット評価処理を行う前に、前記基準帳
票のイメージ中の複数の線分の傾きをそれぞれ求めると
共にその平均値を求め、該平均値から一定以上傾きが離
れた線分は前記フォーマットから除外し、前記入力帳票
のイメージ中の複数の線分の傾きをそれぞれ求めると共
にその平均値を求め、該平均値から一定以上傾きが離れ
た線分は、前記線分情報から除外する除外処理を行うよ
うにしている。このような構成を採用したことにより、
入力帳票或いは基準帳票のイメージが傾いていても、該
入力帳票或いは基準帳票の中で線分フォーマット或いは
線分情報にふさわしくない線分が、除去処理で除去され
る。
【0013】第5の発明は、逐次与えられる入力帳票の
イメージを取込み、予めフォーマットに登録されている
座標を参照して該各入力帳票のイメージ中の文字記入位
置の文字パターンを認識するOCRにおいて、次のよう
な構成にしている。即ち、前記入力帳票に先立って与え
られた該入力帳票の基準となる基準帳票のイメージ及び
逐次与えられる該入力帳票のイメージを取得する入力手
段と、
【0014】前記基準帳票のイメージにおける複数の線
分の座標を求めて前記フォーマットに登録すると共に、
前記入力帳票のイメージにおける複数の線分の座標を線
分情報として抽出する線分抽出部と、前記基準帳票の線
分のうちの1本を基準線分として選択し、前記入力帳票
のイメージ中の複数の線分のうちの1本の線分を該基準
線分に対応する線分と仮定して前記基準帳票のイメージ
または該入力帳票のイメージにおける残りの線分の座標
を平行移動して比較し、該基準帳票のイメージ及び該入
力帳票のイメージにおける残りの線分の座標の一致具合
を求める処理を該仮定を換えて繰り返し、該各一致具合
から、該基準線分に相当する該入力帳票の線分を特定す
る比較部と、前記比較部で特定された線分の前記入力帳
票のイメージにおける座標と前記基準線分の前記基準帳
票のイメージにおける座標との間の誤差を算出し、該算
出した誤差に基づき、前記参照する座標を補正する補正
部と、前記補正された座標を参照して前記入力帳票に記
載された文字を認識する認識部とを、設けている。
【0015】このような構成を採用したことにより、線
分抽出部により、基準帳票のイメージにおける複数の線
分の座標が求められてフォーマットに登録されると共
に、入力帳票のイメージにおける複数の線分の座標が線
分情報として抽出される。比較部により、基準帳票の線
分のうちの1本が基準線分として選択され、入力帳票の
イメージ中の複数の線分のうちの1本の線分が基準線分
に対応する線分と仮定されて基準帳票のイメージまたは
入力帳票のイメージにおける残りの線分の座標の座標の
一致具合が求められる。この処理は、仮定を換えて繰り
返し行われる。仮定を換えた繰り返しによって得られる
各一致具合から、基準線分に相当する該入力帳票の線分
が特定される。補正部により、その特定された線分の入
力帳票における座標と基準線分の座標との間の誤差が算
出され、該算出した誤差に基づき、参照する座標が補正
される。認識部により、補正された座標が参照されて入
力帳票に記載された文字が認識される。
【0016】第6の発明は、逐次与えられる複数種類の
入力帳票のイメージを取込み、予め複数種類のフォーマ
ットに登録されている座標を参照して該各入力帳票のイ
メージ中の文字記入位置の文字パターンを認識するOC
Rにおいて、次のような構成にしている。即ち、前記複
数種類の入力帳票に先立って与えられた該各入力帳票の
基準となる複数種類の基準帳票のイメージ及び逐次与え
られる該入力帳票のイメージを取得する入力手段と、前
記複数種類の基準帳票のイメージにおける複数の線分の
座標を求め、該種類毎の前記フォーマットにそれぞれ登
録すると共に、前記各入力帳票のイメージにおける複数
の線分の座標を線分情報として抽出する線分抽出部と、
前記入力手段に与えられた入力帳票に対し、前記複数種
類のフォーマットのうちから順に1つのフォーマットを
選択し、該選択したフォーマット毎に、前記基準帳票の
線分のうちの1本を基準線分として選択し、該入力帳票
のイメージ中の複数の線分のうちの1本の線分を該基準
線分に対応する線分と仮定して前記基準帳票のイメージ
または該入力帳票のイメージにおける残り線分の座標を
平行移動して比較し、該基準帳票のイメージ及び該入力
帳票のイメージにおける残り線分の座標の一致具合を求
める処理を該仮定を換えて繰り返し、該各一致具合か
ら、入力帳票の種類に対応する前記フォーマットを特定
する比較部と、前記特定されたフォーマットに基づき、
前記入力帳票に記載された文字を認識する認識部とを、
設けている。
【0017】このような構成を採用したことにより、比
較部によって、入力帳票と各種類ごとのフォーマットの
基準線分との間の一致具合が求められ、入力帳票に対応
するフォーマットが特定される。特定されたフォーマッ
トに基づき入力帳票の認識が行われる。
【0018】第7の発明では、第5及び第6の発明にお
ける前記線分抽出部が、前記各基準帳票のイメージ中の
複数の線分の傾きをそれぞれ求めると共にその平均値を
求め、該平均値から一定以上傾きが離れた線分は前記フ
ォーマットから除外し、前記入力帳票のイメージ中の複
数の線分の傾きをそれぞれ求めると共にその平均値を求
め、該平均値から一定以上傾きが離れた線分は、前記線
分情報から除外する構成にしている。このような構成を
採用したことにより、入力帳票或いは基準帳票のイメー
ジが傾いていても、該入力帳票或いは基準帳票の中でフ
ォーマット或いは線分情報としてふさわしくない線分
が、除去される。
【0019】
【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示すOCRの構成図
である。このOCRは、ファクシミリ装置或いはイメー
ジスキャナ等で構成された入力手段11と、該入力手段
11に接続され、帳票のイメージを格納するイメージメ
モリ12と、該イメージメモリ12に接続され、帳票の
イメージから線分を抽出する線分抽出部13と、該線分
抽出部13で抽出された線分の座標を線分フォーマット
として格納する線分フォーマットメモリ14とを備えて
いる。線分抽出部13及び線分フォーマットメモリ14
の出力側には、比較部15と補正部16とが順に接続さ
れ、該補正部16及びイメージメモリ12の出力側に
は、切出し部17が接続されている。切出し部17の出
力側に、文字認識を行う認識部18が接続されている。
【0020】次に、図1のOCRの概略の動作を説明す
る。このOCRでは、認識対象の入力帳票のイメージI
1 を入力する前に、予め、線分フォーマット登録処理を
行う。この線分フォーマット登録処理では、入力手段1
1を用い、入力帳票に対して基準となる基準帳票のイメ
ージI0 をイメージメモリ12に取込み、線分抽出部1
3を用いて該イメージ中の線分の座標を求め、この座標
を「線分フォーマット」S0 として線分フォーマットメ
モリ14に登録する。このとき、例えば、図2における
文字記入位置2の座標等もフォーマットデータとして登
録しておく。
【0021】実際に、認識対象となる入力帳票のイメー
ジI1 は、線分フォーマット登録処理が終了してから、
入力手段11によって取込まれてイメージメモリ12に
格納される。線分抽出部13は、線分情報抽出処理によ
り、認識対象の入力帳票のイメージI1 から線分を抽出
し、該線分の座標を比較部15に出力する。比較部15
は、線分フォーマットメモリ14に登録された線分の座
標を読出し、比較処理により、イメージI1 の線分の座
標との比較を行って、両者の間の誤差ex 及びey を抽
出する。さらに、補正部16は、フォーマットによって
指定された文字記入位置2の座標から、誤差ex 及びe
y を加算或いは減算することで、実際に切出す文字記入
位置2の座標を補正する。切出し部17は、イメージメ
モリ12に格納されたイメージI1 から、座標が補正さ
れた文字記入位置2の領域を切出して認識部18に送
り、認識部18が文字認識を行う。
【0022】ここで、線分抽出部13、比較部15及び
補正部16における動作を、以下の図3〜図9を参照し
つつ、詳しく説明する。図3は、基準帳票のイメージI
0 の例を示す図である。図4は、図3から抽出した横方
向の線分を示す図である。図5は、図3から抽出した縦
方向の線分を示す図である。
【0023】逐次入力される入力帳票の基準となる基準
帳票のイメージI0 が、入力手段11を介して入力さ
れ、イメージメモリ12に格納される。線分抽出部13
は、イメージI0 に対して、横方向に所定の幅を有する
複数の短冊状の小領域を設定し、該各小領域内の黒点の
分布から小領域を通過する線分候補を抽出する処理を該
イメージ全体に施し、線分候補を連結することで、図4
のようにイメージI0 のX(横)方向の線分を抽出す
る。ただし、各線分は、閾値a1以上の長さを有するも
のだけを抽出する。ここで、閾値a1は、帳票における
枠線以外の文字等の図形に含まれる線分の長さの最大値
であり、例えば10mmに設定される。線分抽出部13
は、さらに、縦方向に所定の幅を有する短冊状の小領域
を設定し、該各小領域内の黒点の分布から領域を通過す
る線分候補を抽出する処理を該イメージ全体に施し、線
分候補を連結することで、図5のようにイメージI0
Y(縦)方向の線分を抽出する。
【0024】抽出された横方向の線分は、図3のよう
に、線分番号i(=0〜9)が付与されてその座標と共
に線分フォーマットメモリ14に「線分フォーマット」
0 として登録される。抽出された縦方向の横方向の線
分は、図5のように、線分番号k(=0〜20)が付与
されてその座標と共に線分フォーマットメモリ14に
「線分フォーマット」S0 として格納される。ここで、
登録される各線分の座標は、該各線分の一端のx座標及
びy座標と、各線分の他端のx座標及びy座標の合計4
座標値である。基準となる帳票は、未記入のものが望ま
しい。これは、余分な線分が抽出されないようにするた
めである。
【0025】図6は、入力帳票のイメージI1 の例を示
す図であり、図7は、図6の帳票から抽出した横方向の
線分を示す図である。「線分フォーマット」S0 の登録
が終了した後、認識対象の帳票のイメージI 1 が入力手
段11を介して入力され、イメージメモリ12に格納さ
れる。線分抽出部13は、図6のイメージI1 に対し
て、横方向に所定の幅を有する短冊状の小領域を設定
し、該小領域内の黒点の分布から領域を通過する線分候
補を抽出する処理を該イメージ全体に施し、線分候補を
連結することで、図7のようにイメージI1 のX方向の
線分を抽出する。線分抽出部13は、同様に、図6のイ
メージI1 に対して、縦方向に所定の幅を有する短冊状
の小領域を設定し、該小領域内の黒点の分布から領域を
通過する線分候補を抽出する処理を該イメージ全体に施
し、線分候補を連結することで、Y方向の線分を抽出す
る。ただし、各線分は、閾値a2以上の長さを有するも
のだけを抽出する。ここで、閾値a2は、閾値a1から
印刷のばらつき等を差し引いた値で、例えば5mmに設
定される。
【0026】イメージI1 から抽出された横方向の線分
は、例えば図7のように番号j(=0〜11)が付さ
れ、座標と共に「線分情報」S1として比較部15に与
えられる。図6のイメージI1 に対して縦方向の線分
も、線分抽出部13によって同様に抽出され、座標と共
に「線分情報」S1 として比較部15に与えられる。
【0027】図8は、図1中の比較部15及補正部16
が行う比較処理及び補正処理の全体を示すフローチャー
トである。この図8を参照しつつ、図1で行う文字記入
座標の補正方法を説明する。比較部15は、図8のステ
ップST10の初期化で、「線分フォーマット」S 0
おける一本の線分を基準線分として選択した上で、ステ
ップST20〜ST60で線分抽出部13から与えられ
た例えば横方向の「線分情報」S1 と、線分フォーマッ
トメモリ14から与えられた横方向の「線分フォーマッ
ト」S0 とを比較し、ステップST70で誤差ey を求
める。補正部16は、ステップST80で、誤差ey
基づき文字記入位置2のy座標を補正する。比較部15
は、縦方向に関しても同様に、ステップST10〜ST
70で誤差ex を求める。補正部16は、ステップST
80で、誤差ex に基づき文字記入位置2のx座標を補
正する。
【0028】以下に、ステップSTS10〜S80で文
字記入位置2のy座標を補正する処理例を詳細に説明す
る。但し、この説明に用いる記号は、次の意味を持つも
のとする。 fxs(i) ;基準帳票のイメージI0 の横線の「線
分フォーマット」のi番目の線分の左端のx座標 fys(i) ;基準帳票のイメージI0 の横線の「線
分フォーマット」のi番目の線分の左端のy座標 fxe(i) ;基準帳票のイメージI0 の横線の「線
分フォーマット」のi番目の線分の左端のy座標 imax ;基準帳票のイメージI0 の横線の「線
分フォーマット」の線分の最大番号 xs(j) ;入力帳票のイメージI1 の横線の「線
分情報」のj番目の線分の左端のx座標
【0029】ys(j) ;入力帳票のイメージI1
の横線の「線分情報」のj番目の線分の左端のy座標 xe(j) ;入力帳票のイメージI1 の横線の「線
分情報」のj番目の線分の右端のx座標 ch(j) ;入力帳票のイメージI1 の横線の「線
分情報」のj番目の線分が、「線分フォーマット」の線
分と組み合わせ済みであることを示すフラグ jmax ;入力帳票のイメージI1 の横線の「線
分情報」の線分の最大番号 io ;基準帳票のイメージI0 の「線分フォ
ーマット」内の基準線分の番号 miss(j);基準線分と「線分情報」内のj番目の
線分を組み合わせたときに、「線分フォーマット」内の
残りの線分がマッチングに失敗した度合 diss(j);基準線分と「線分情報」内のj番目の
線分を組み合わせたときに、「線分フォーマット」内の
残りの線分がマッチングに成功したときの度合である距
離値の合計 Sum ;「線分フォーマット」の線分の長さの
合計
【0030】図9は、図8中のステップST10の詳細
を示すフローチャートである。図8のステップST10
では、次のような処理S11〜S14からなる初期化を
行う。初期化の最初の処理S11において、比較部15
は、基準帳票のイメージI0の「線分フォーマット」S
0 の各線分の長さを合計してSumとして格納する。処
理S11の後の処理S12において、比較部15は、
「線分情報」S1 におけるj=0からj=jmax番目
までのすべての線分のmiss(j)に初期値の“0”
を代入すると共に、該miss(j)の取りうる最大値
を越える値a3を、例えば1000mmに設定する。処
理S12の後の処理S13において、比較部15は、
「線分情報」S1 におけるj=0からj=jmax番目
までのすべての線分のdiss(j)に初期値の“0”
を代入する。処理S13の後の処理S14において、比
較部15は、「線分フォーマット」S0 の各線分の長さ
(fxe(i)−fxs(i))を計算し、該各線分の
うちで最長の線分を基準線分として選択する。そして、
長さ(fxe(i)−fxs(i))が最大となるiの
番号を基準線分の番号ioに代入する。
【0031】図8のステップS10の後のステップST
20,ST30及ST60は、「線分情報」S1 におけ
るn番目の線分を変化させるための繰り返しの制御ステ
ップである。ステップS20,ST30の後のステップ
ST40では、比較部15が近接判定を行う。
【0032】ステップST40の近接判定は、「線分情
報」S1 内のn番目の線分の座標と、基準線分の座標と
を比較し、近接していれば、次のステップST50に処
理を移し、遠隔ならば処理をステップST30へ移すた
めの判定であり、具体的には、以下の(1)〜(3)式
の条件をすべて満たす「線分情報」S1 内のn番目の線
分を近接と判定する。 abs(ys(n)−fys(io))<a4 ・・・(1) (xs(n)−fxs(io))<a5 ・・・(2) (fxe(io)−xe(n))<a5 ・・・(3) 但し、absは絶対値を表している。値a4は、誤差e
y の絶対値の最大値であり、入力帳票のイメージI1
取得するイメージリーダ等の精度を考慮して設定され、
例えばa4=25mmに設定されている。値a5は、入
力帳票のイメージI1 の横方向の誤差ex に、線分検出
の検出位置誤差を加えた値の最大値であり、例えばa5
=35mmに設定されている。
【0033】図10は、図8中のステップST50の詳
細を示すフローチャートである。ステップST40の後
のステップST50は、後述するステップST70と相
俟って比較処理を構成するものであり、このステップS
T50は、選択された基準線分と、「線分情報」S1
のj番目の線分とが対応すると仮定し、その位置が一致
がするように、「線分情報」S1 内の各線分の座標を平
行移動させたときに、「線分フォーマット」S0 内の残
りの線分と一致する線分が、「線分情報」S1 内に存在
するかを調べる一連の処理である。このステップST5
0は、複数の処理S51,S52a〜S52c,S5
3,S55a〜S55c,S56〜S59で構成されて
いる。
【0034】このステップST50の最初の処理S51
では、入力帳票のイメージI1 の横線の「線分情報」S
1 の線分が「線分フォーマット」S0 の線分と組み合わ
せ済みであることを示すフラグch(j)のすべて線分
に関して0を代入し、さらに、ch(n)に1を代入す
る。処理S51の次の処理S52a及びS52bは、後
述する処理S52cと相俟って、「線分フォーマット」
0 の線分の番号iについて0から最大値のimaxま
でインクリメントする繰り返しループである。処理S5
3では、繰り返しループにおいて、「線分フォーマッ
ト」S0 の線分の番号iが、基準線分の番号ioになっ
たとき(Yes)に、後続する処理を回避するために、
処理を処理S52cに進めて線分の番号iをインクリメ
ントする。
【0035】「線分フォーマット」S0 の線分の番号i
が、基準線分の番号ioでない場合(No)には、処理
S54が行われる。処理S54では、フラグfに0を代
入して初期化する。このフラグfは、「線分フォーマッ
ト」S0 内に線分番号iの線分に位置座標が近似してい
る線分が「線分情報」S1 内に存在したかどうかを表す
フラグであり、0のときには存在しなかったことを示
し、1のときには存在することを示すものである。処理
S54では、さらに、変数minに値a6を代入して初
期化すると共に、miss(n)に0を代入して初期化
する。ここで、変数minとは、位置座標が近似してい
る線分が存在したときに、その距離を表すものであり、
値a6は、最小値検索の初期値で、充分に大きな値の例
えば1000mmが用いられる。
【0036】処理S54の後の処理S55a,S55b
は、後述する処理S55cと相俟って、「線分情報」S
1 内の線分の番号jについて、0から最大値のjmax
までインクリメントする繰り返しループであり、このル
ープのうちの処理S55bは、線分の番号jが最大値の
jmaxを越えたか否かを判断する処理である。線分の
番号jが最大値jmaxを越えていないとき(Yes)
には、「線分情報」S1 内の番号jの線分が組み合わせ
済みであるかどうかを判定する処理S56が行われる。
番号jの線分が組み合わせ済みの場合(Yes)には、
処理55cによって線分の番号jがインクリメントされ
て処理S55bに処理が移される。番号jの線分が組み
合わせ済みでない(No)には、処理S57の判定処理
が行われる。
【0037】処理S57の判定処理は、「線分フォーマ
ット」S0 内の番号iの線分と「線分情報」S1 内の番
号jの線分の位置が近似しているかどうかを、次の4つ
の(4)〜(7)式を満たすかどうかで判定する。 (fxe(i)−xe(j))<a7 ・・・(4) (xs(j)−fxs(i))<a7 ・・・(5) ((fxe(i)−fxs(i))−(xe(j)−xs(j))<a8 ・・・(6) abs(ys(j)+fys(io)−ys(n)−fys(i))<a9 ・・・(7) 但し、値a7は、横方向の誤差ex と線分検出の検出誤
差とを加えた最大値であって、例えばa7=35mmに
設定される。値a8は、線分検出の誤差であり、例えば
a8=20mmに設定される。値a9は、帳票の印刷誤
差等のマージンであり、例えばa9=2mmに設定され
る。
【0038】(4)及び(5)式は同一の線分であれ
ば、線分の右端と左端がほぼ同一の位置に存在するはず
であるということを条件に表したものである。(6)式
は、同一の線分であれば、線分の長さは近い値を示すと
いうことを条件に表したものである。ここで、各(4)
〜(6)式は、「線分情報」S1 の線分が「線分フォー
マット」S0 の線分よりも長い場合も成立するようにな
っているが、これらは、「線分情報」S1 の元になる入
力帳票には文字等が記入されており、その記入状態によ
ってはイメージI1 における線分が長くなる可能性があ
ることが理由になっている。
【0039】図11は、線間の距離を示す説明図であ
り、この図11を参照して(7)式の意味を説明する。
「線分フォーマット」S0 で選択された基準線分Ls、
該基準線分Lsのy座標をfys(io)、基準線分L
sに近似していると判定された「線分情報」S 1 内のn
番目の線分Lnのy座標をys(n)、「線分フォーマ
ット」S0 内のi番目の線分Lfiのy座標をfys
(i)、及び「線分情報」S1 内のj番目の線分Ljの
y座標ys(j)とすると、入力帳票のイメージI
1 は、縦方向に関して、基準帳票のイメージI0 を誤差
y 分だけ平行移動したものであるので、線分Ls及び
Lnと、線分Lfi及びLjとが、互いに対応するもの
であれば、これらの間のy座標に関する距離l1 及びl
2 が近い値になる筈である。よって、次の(8)で条件
化できる。 abs(l1 −l2 )<a8 ・・・(8)
【0040】(7)式は、この(8)式のl1 及びl2
を展開したものである。処理S57の判定で、近似して
いない(No)と判定された場合には、処理S55cに
よって番号jがインクリメントされ、処理S55bに処
理が戻される。処理S57の判定で近似している(Ye
s)と判定された場合には、処理S58が行われる。
【0041】処理S58は、線分の近似度合を設定する
処理であり、処理S54で初期化したフラグに1を代入
すると共に、次の(9)式で近似度合dyを計算する。 dy=(ys(j)+fys(io)−ys(n)−fys(i)) ・・・(9) この(9)式の右辺は、(7)式の左辺と同様であり、
距離の差分abs(l 1 −l2 )に相当する。計算の結
果、dyが処理S54で初期化したminの値よりも小
さければ、次の(10)及び(11)式のように、変数
minにdyの値を代入すると共に、dyの値が最小を
示した線分の番号をminjとして、線分の番号jを記
録する。 min=dy ・・・(10) minj=j ・・・(11)
【0042】処理S58の後には、処理S55cで番号
jがインクリメントされ、処理S55bに処理が戻され
る。処理S55bで「線分情報」S1 の線分の番号jが
最大値jmaxを越えた(No)と判断したときには、
処理S59が行われる。処理S59は、処理S54で初
期化されて処理S58で更新されたフラグfの値を調べ
る。ここで、フラグfの値が、更新されておらず、0の
ままであたった時には、次の(12)式を用い、mis
s(n)に「線分フォーマット」S0 のi番目の線分の
長さを加算する。 miss(n)=miss(n)+(fxe(i)−fxs(i)) ・・・(12) フラグfが1になっているときには、次の(13)式を
用い、dist(n)にminの値を加算する。 dist(n)=dist(n)+min ・・・(13) これらmiss(n)及びdist(n)は、基準帳票
と入力帳票との間の一致具合を示すものである。
【0043】さらに、この処理S58では、番号がmi
njの線分が組み合わせ済みであること示すために、フ
ラグch(minj)を1に設定する。処理S58の
後、処理S52cによって、番号iがインクリメントさ
れ、処理が処理S52bに戻される。そして、処理S5
2bで、「線分フォーマット」S0 におけるすべての番
号iの線分に対するS54〜S59の処理が終了した
(No)と判断された段階で、ステップST50が終了
し、図8のステップST60に処理が移される。ステッ
プST60では、基準線分に相当すると仮定した「線分
情報」S1 内の線分の番号nをインクリメントし、処理
をステップST30に戻す。ステップST30におい
て、「線分情報」S1 内のすべての線分に対してステッ
プST40〜ST60の処理が終了した(No)と判断
した場合に、ステップST70及びステップST80に
移行する。
【0044】図12は、図8中のステップST70,S
T80を示すフローチャートである。ステップST70
では、次のような一連の処理S71〜S76を行って誤
差e y を求め、ステップST80では、文字記入位置2
の座標を変換する。まず、ステップST70の最初の処
理S71では、基準線分と「線分情報」S 1 内の番号n
の線分とが一致すると仮定して上で、ステップST50
の処理S59で得られた0番からjmax番目までのm
iss(n)の値のなかから、最小値を抽出する。
【0045】処理S71の後の処理S72では、mis
s(n)が最小値となる線分の番号の中から、さらに、
dist(n)が最小となるような番号nを抽出する。
処理S72の後の処理S73では、「線分フォーマッ
ト」S0 の線分の長さの総合計Sumを参照し、次の
(14)式により、miss(n)に対する判断を行
う。 miss(n)<(a9×Sum) ・・・(14) 但し、a9は比率であり、例えばa9=0.125に設
定される。このようにすると、マッチングをミスした線
分の長さが、総合計Sumのa9の比率まで許される。
(14)式が満たされる(Yes)場合には、処理S7
4において、抽出した番号nに基づき、次の(15)式
により、誤差ey を算出する。 ey =ys(n)−fys(io) ・・・(15) 処理S74の後のステップST80において、文字記入
位置2の座標に誤差e y を加算することで、実際にイメ
ージI1 に対する文字認識を行う際の座標を補正する。
【0046】処理S73において(14)式を満たさな
い(No)場合には、処理S76に処理が進められる。
この処理S76に至るのは、基準帳票のイメージI0
ら作成された「線分フォーマット」S0 にヒットとしな
かったときであり、例えば、入力帳票が異種の帳票の場
合等が考えられる。エラー処理では特に座標の補正等を
行わず、文字認識を行わないようにエラーが発生したこ
とをOCRの制御部等に通報する。以上が誤差ey を求
めて文字記入位置座標を補正するフローあるが、誤差e
xを求めて文字記入位置座標を補正するフローも、縦線
と横線、及びx座標とy座標を入れ替えた点だけが異な
る同様のステップST10〜ST80で行う。
【0047】以上のように、この第1の実施形態では、
OCRに線部抽出部13、線分フォーマットメモリ1
4、比較部15及び補正部16を設け、予め、基準帳票
のイメージI0 を取込み、該イメージI0 中の各線分を
抽出してその座標を「線分フォーマット」S0 として登
録する線分フォーマット登録処理を行っておき、入力帳
票のイメージI1 中の各線分を抽出してその座標を「線
分情報」S1 として抽出する線分情報抽出処理と、基準
帳票の線分のうちの1本を基準線分として選択する選択
処理S14と、ステップST50及びステップST70
で構成され、入力帳票のイメージI1 中の複数の線分の
うちの1本の線分を基準線分Lsに対応する線分と仮定
して残り線分の座標を平行移動して比較し、基準帳票の
イメージI 0 及び入力帳票のイメージI1 の一致具合m
iss(n)及びdist(n)を求ることを該仮定を
換えて繰り返して行い、基準線分に相当する入力帳票の
線分を特定する比較処理と、比較処理の結果で特定され
た線分の座標と基準線分の間の誤差ey ,ex を算出
し、該誤差ey ,ex に基づき、OCRが参照する座標
を補正するステップST80の補正処理とを行うように
したので、入力帳票にずれがあっても、特別な入力手段
を必要とせずに、文字記入位置2の座標を補正でき、文
字認識の精度が確保できる。
【0048】第2の実施形態 図13は、本発明の第2の実施形態を示す文字記入座標
の補正方法のフローチャートであり、図8中の要素と共
通の要素には共通の符号が付されている。第1の実施形
態では、図1の入力手段11に入力される基準帳票及び
入力帳票には傾きがないことを想定していたが、この第
2の実施形態では、それらの帳票に傾きがある場合にも
適用可能な文字記入座標の補正方法である。この文字記
入座標の補正方法の特徴は、第1の実施形態の図8のス
テップST10を行う前に、2つの除外処理ステップS
T90,ST91を実施するようにしたことであり、他
のステップST10〜ST80は、第1の実施形態と同
様に行われる。OCRの構成も、第1の実施形態の図1
と同様になっている。
【0049】図14は、傾きのある帳票を示す図であ
り、図15は、図13中のステップST90,ST91
の詳細を示すフローチャートである。これらの図14及
び図15を参照しつつ、ステップST90,ST91の
処理手順を説明する。基準帳票或いは入力帳票に傾きθ
があると、基準帳票のイメージI0 及び入力帳票のイメ
ージI1 は、図14のようになり、X軸及びY軸に対し
て図示しない各線分が傾きTANを持つようになる。ス
テップST90は、「線分フォーマット」S0 の線分の
うち、傾きが異常な線分を除外し、残りの線分の座標に
回転補正を施すものであり、処理S90a〜S90eで
構成されている。
【0050】このステップST90の最初の処理S90
aにおいて、比較部15は、除外された線分の本数を計
数するための変数CNTを0に初期化する。処理S90
aの後の処理S90bにおいて、比較部15は、各線分
の傾きTANに線分の長さLENを乗じて重み付けし、
次の(16)〜(18)式によって傾きの平均値AVR
を求める。 AVR=Σ(TAN・LEN)/ΣLEN ・・・(16) TAN=(ye−ys)/(xe−xs) ・・・(17) LEN=xe−xs ・・・(18)
【0051】処理S90cにおいて、比較部15は、す
べての線分について各傾きの平均値AVRと、線分の傾
きTANとの差分abs(AVR−TAN)を計算し、
該差分が次の(19)式を満たさない線分を、「線分フ
ォーマット」S0 から除外する。 abs(AVR−TAN)<a10 ・・・(19) ここで、a10は、例えば0.03に設定されている。
線分を除外したときには、変数CNTに1を加算する。
処理S90cの後の処理S90dにおいて、残った線分
の座標に対して次の(20)式により、回転補正を行
う。 ys=ys−(TAN×xs) ye=ye−(TAN×xe) xs=xs−(TAN×ys) xe=xe−(TAN×ye) ・・・(20)
【0052】処理S90dの後の処理S90eにおい
て、比較部15は、除外した線分の本数を変数CNTの
値から求め、該除外した線分があった場合(No)に
は、処理をS90aに戻して、処理S90a〜S90e
を繰り返す。これにより、「線分フォーマット」S0
するにはふさわしくない線分がすべて除去されると共
に、残りの線分が回転補正される。ステップST91
も、ステップST90と同様の処理であり、「線分情
報」S 1 の線分のうち、傾きθが異常な線分を除外し、
残りの線分の座標に回転補正を施す。ステップST90
及びST91の後に、第1の実施形態のステップST1
0からステップST80が行われる。
【0053】以上のように、この第2の実施形態では、
ステップST90,ST91の除外処理を行うことによ
り、「線分情報」S1 と「線分フォーマット」S0 にお
ける傾きが異常な線分を除去すると共に、残った線分の
回転補正を行うようにしたので、傾きの有る帳票のイメ
ージI0 ,I1 に対しても第1の実施形態と同様に、文
字記入座標を補正でき、高い認識精度を確保できる。
【0054】第3の実施形態 図16は、本発明の第3の実施形態を示すフォーマット
選択方法のフローチャートである。第1及び第2の実施
形態では、図1のOCRで入力帳票のイメージI1 の文
字記入位置2の座標を補正する方法を説明したが、この
第3の実施形態では、複数種類の入力帳票がある場合
に、図1のOCRで、その入力帳票に対応したフォーマ
ットを選択するフォーマット選択方法を説明する。
【0055】図17は、入力帳票の種類の説明図であ
る。図17の帳票と図3の帳票とは、明らかに記載形態
が異なり、帳票の種類が異なる。入力手段11に例えば
m種類の異なる帳票が混在して逐次入力される場合に
は、線分フォーマット登録処理において、このOCR
は、予め該入力手段11とイメージメモリ12と線分抽
出部13とを用いて各入力帳票の種類に対応する基準帳
票のイメージI0 を取り込み、m種類の各イメージI0
の線分の座標を抽出し、種類毎の「線分フォーマット」
01〜S0mとして線分フォーマットメモリ14に格納し
ておく。そして、逐次入力される入力帳票に対して、第
1の実施形態と同様の線分情報抽出処理を行う。つま
り、入力帳票のイメージI1 を取り込み、該イメージI
1 の線分の座標を「線分情報」S1 として抽出する。
【0056】線分情報抽出処理が終了した後、比較部1
5は、次のような図16のステップST100−1〜S
T100−mからなる線分フォーマット評価処理を行
う。最初のステップST100−1では、帳票の種類の
うちの1番目の種類の帳票に対応する基準帳票の「線分
フォーマット」S01と、入力された入力帳票の「線分情
報」S1 とに対して、図8のステップST10〜ST7
0が行われる。ステップST100−2では、帳票の種
類のうちの2番目の種類の帳票に対応する基準帳票の
「線分フォーマット」S02と、入力された入力帳票の
「線分情報」S1とに対して、図8のステップST10
〜ST70が行われる。以下同様に、各ステップST1
00−3〜ST100−mでは、帳票の種類のうちの各
3〜m番目の種類の帳票にそれぞれ対応する基準帳票の
「線分フォーマット」と、入力された入力帳票の「線分
情報」S1 とに対して、図8のステップST10〜ST
70がそれぞれ行われる。即ち、複数の「線分フォーマ
ット」S01〜S0mのうちから順に1つのフォーマットを
選択する選択処理と、該選択した「線分フォーマット」
01〜S0m毎に、基準線分を選択し、入力帳票のイメー
ジ中の複数の線分のうちの1本の線分をその基準線分に
対応する線分と仮定して入力帳票のイメージI 1 におけ
る残り線分の座標を平行移動して比較し、基準帳票のイ
メージI0 及び入力帳票のイメージI1 における残り線
分の座標の一致具合を求める処理とを該線分の仮定を換
えて繰り返す。これにより、「線分情報」S1 と「線分
フォーマット」S01〜S0mとが比較される。但し、比較
部15は、第1の実施形態で説明した処理S73におい
て、各「線分フォーマット」S01〜S0mの線分の長さの
総合計Sumを参照した判断の判断結果を保持する共
に、該判断で使用したmiss(n)の値、及び線分番
号nを引数としたdist(n)を保持しておく。
【0057】ステップST100−1〜ST100−m
からなる線分フォーマット評価処理の後のステップST
110において、比較部15は、保持した情報に基づ
き、次のようにして、入力帳票の種類に対応する「線分
フォーマット」を特定する。先ず、m回の処理S73の
判断結果を参照し、判断結果がNoになる種類の「線分
フォーマット」を棄却する。次に、保持したmiss
(n)の値が、最小値を示す帳票の「線分フォーマッ
ト」を残し、他を棄却する。さらに、保持したdist
(n)の値が最小となる帳票の「線分フォーマット」を
選択し、入力帳票の種類に対応する「線分フォーマッ
ト」S0 として特定する。この特定された「線分フォー
マット」S0 と共に格納された文字記入位置2の座標に
基づき、認識部18が文字認識を行う。以上のように、
この第3の実施形態では、予め、m種類毎の「線分フォ
ーマット」S01〜S0mを線分フォーマットメモリ14に
格納しておき、比較部15でステップST100−1〜
100−mからなるフォーマット評価処理を行って、入
力帳票の種類に対応した「線分フォーマット」S01〜S
0mを特定するようにしたので、座標を参照して文字認識
を行うOCRでも、複数種類の入力帳票に対処できる。
【0058】なお、本発明は、上記実施形態に限定され
ず、種々の変形が可能である。例えば、第3の実施形態
でも、m種類の基準帳票の線分及び入力帳票の線分に対
して第2の実施形態のステップST90,ST91を行
い、傾きに対処できるようにしてもよい。また、第1の
実施形態では、入力帳票の線分の平行移動を行っている
が、基準帳票の線分のほうを平行移動させて、一致具合
miss(n)及びdist(n)を求めてもよい。
【0059】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、予め、基準帳票のイメージ中の線分を抽出し
てその座標を線分フォーマットとして登録する線分フォ
ーマット登録処理を行っておき、入力帳票のイメージ中
の線分を抽出してその座標を線分情報として抽出する線
分情報抽出処理と、基準帳票の線分のうちの1本を基準
線分として選択する選択処理と、入力帳票の複数の線分
のうちの1本の線分を基準線分に対応する線分と仮定し
て残りの線分の座標を平行移動して比較し、基準帳票の
イメージ及び入力帳票のイメージの一致具合を求る処理
を該仮定を換えて繰り返して行い、基準線分に相当する
入力帳票の線分を特定する比較処理とを行い、誤差を算
出し、誤差に基づきOCRが参照する座標を補正するよ
うにしたのでので、入力帳票にずれがあっても、特殊な
入力手段を用いずとも文字記入位置の座標を補正でき、
文字認識の精度を確保できる。第2の発明によれば、基
準帳票及び入力帳票の複数の線分の傾きをそれぞれ求め
ると共にその平均値を求め、該平均値から一定以上傾き
が離れた線分はフォーマット及び線分情報から除外する
ので、基準帳票及び入力帳票が傾いていても、フォーマ
ット及び線分情報にふさわしくない線分が除去でき、第
1の発明における文字認識の精度が向上できる。
【0060】第3の発明によれば、予め、種類毎の基準
帳票のイメージの複数の線分を抽出してその座標を該種
類毎のフォーマットにそれぞれ登録する線分フォーマッ
ト登録処理と線分情報抽出処理とを行っておき、与えら
れた入力帳票に対し複数種類のフォーマットのうちから
順に1つのフォーマットを選択し、フォーマット毎に、
基準線分を選択する選択処理と、入力帳票のイメージ中
の線分のうちの1本を基準線分に対応する線分と仮定し
て基準帳票のイメージまたは入力帳票のイメージにおけ
る残りの線分の座標を平行移動して比較し、基準帳票の
イメージ及び入力帳票のイメージにおける残りの線分の
座標の一致具合を求める処理とを仮定を換えて繰り返す
フォーマット評価処理を行い、フォーマット毎の一致具
合から、入力帳票の種類に対応するフォーマットを特定
するようにしたので、座標を参照して文字認識を行うO
CRでも、複数種類の帳票に対して文字認識が行えるよ
うになる。第4の発明によれば、基準帳票及び入力帳票
の複数の線分の傾きをそれぞれ求めると共にその平均値
を求め、該平均値から一定以上傾きが離れた線分はフォ
ーマット及び線分情報から除外するので、基準帳票及び
入力帳票が傾いていても、フォーマット及び線分情報に
ふさわしくない線分が除去でき、第3の発明における文
字認識の精度が向上できる。
【0061】第5の発明によれば、入力手段及び認識部
だけでなく、線分抽出部、比較部及び補正部をOCRに
設け、第1の発明と同様に、フォーマット登録を行うと
共に線分情報を抽出し、記基準帳票の線分のうちの1本
を基準線分として選択し、入力帳票のイメージ中の線分
のうちの1本を基準線分に対応する線分と仮定して基準
帳票のイメージまたは入力帳票のイメージにおける残り
の線分の座標を平行移動して比較し、基準帳票のイメー
ジ及び該入力帳票のイメージにおける残り線分の座標の
一致具合を求める処理を該仮定を換えて繰り返し、各一
致具合から、基準線分に相当する入力帳票の線分を特定
し、その特定された線分の座標から誤差を算出し、誤差
に基づき、OCRで参照する座標を補正するようにした
ので、入力手段を特殊な構成にしなくても、入力帳票に
ずれがあっても文字認識が可能なOCRが実現できる。
【0062】第6の発明によれば、入力手段及び認識部
だけでなく、線分抽出部、比較部及び補正部をOCRに
設け、第3の発明と同様に、種類毎のフォーマット登録
を行うと共に線分情報の抽出とを行っておき、入力帳票
に対し複数のフォーマットのうちから順に1つのフォー
マットを選択し、フォーマット毎に、基準線分を選択
し、入力帳票のイメージ中の線分のうちの1本を基準線
分に対応する線分と仮定して基準帳票のイメージまたは
入力帳票のイメージにおける残りの線分の座標を平行移
動して比較し、基準帳票のイメージ及び入力帳票のイメ
ージにおける残りの線分の座標の一致具合を求める処理
を仮定を換えて繰り返し、フォーマット毎の一致具合か
ら、入力帳票の種類に対応するフォーマットを特定する
ようにしたので、複数種類の帳票に対して文字認識が行
えるOCRが実現できる。
【0063】第7の発明によれば、第5及び第6の発明
における比較部が、基準帳票及び入力帳票のイメージ中
の複数の線分の傾きの平均値を求め、これらの平均値か
ら一定以上傾きが離れた線分はフォーマット及び線分情
報から除外するようにしたので、基準帳票及び入力帳票
が傾いていても、フォーマット及び線分情報にふさわし
くない線分が除去でき、第5または第6の発明における
文字認識の精度が向上できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示すOCRの構成図
である。
【図2】従来の文字記入位置の座標を示す説明図であ
る。
【図3】基準帳票のイメージI0 の例を示す図である。
【図4】図3から抽出した横方向の線分を示す図であ
る。
【図5】図3から抽出した縦方向の線分を示す図であ
る。
【図6】入力帳票のイメージI1 の例を示す図である。
【図7】図6の帳票から抽出した横方向の線分を示す図
である。
【図8】図1中の比較部15及補正部16が行う比較処
理及び補正処理の全体を示すフローチャートである。
【図9】図8中のステップST10の詳細を示すフロー
チャートである。
【図10】図8中のステップST50の詳細を示すフロ
ーチャートである。
【図11】線間の距離を示す説明図である。
【図12】図8中のステップST70,ST80を示す
フローチャートである。
【図13】本発明の第2の実施形態を示す文字記入座標
の補正方法のフローチャートである。
【図14】傾きのある帳票を示す図である。
【図15】図13中のステップST90,ST91の詳
細を示すフローチャートである。
【図16】本発明の第3の実施形態を示すフォーマット
選択方法のフローチャートである。
【図17】入力帳票の種類の説明図である。
【符号の説明】
11 入力手段 12 イメージメモリ 13 線分抽出部 14 線分フォーマットメモリ 15 比較部 16 補正部 17 切出し部 18 認識部 I0 基準帳票のイメージ I1 入力帳票のイメージ S0 線分フォーマット S1 線分情報 ex ,ey 誤差

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 逐次与えられる入力帳票のイメージを取
    込み、予めフォーマットに登録されている座標を参照し
    て該各入力帳票のイメージ中の文字記入位置の文字パタ
    ーンを認識する光学式文字読取装置に対し、前記入力帳
    票毎に前記参照する座標の補正を行う文字記入座標の補
    正方法において、 予め、前記逐次与えられる入力帳票に対して基準となる
    基準帳票のイメージを取込み該イメージ中の複数の線分
    を抽出して該各線分の座標を前記フォーマットに登録す
    る線分フォーマット登録処理を行っておき、 前記与えられた入力帳票のイメージ中の複数の線分を抽
    出して該各線分の座標を線分情報として抽出する線分情
    報抽出処理と、 前記基準帳票の線分のうちの1本を基準線分として選択
    する選択処理と、 前記入力帳票のイメージ中の複数の線分のうちの1本の
    線分を前記基準線分に対応する線分と仮定して前記基準
    帳票のイメージまたは該入力帳票のイメージにおける残
    りの線分の座標を平行移動して比較し、該基準帳票のイ
    メージ及び入力帳票のイメージにおける残りの線分の座
    標の一致具合を求る処理を該仮定を換えて繰り返し、該
    各一致具合に基づき該基準線分に相当する該入力帳票の
    線分を特定する比較処理と、 前記比較処理の結果で特定された線分の前記入力帳票の
    イメージにおける座標と前記基準線分の前記基準帳票の
    イメージにおける座標との間の誤差を算出し、該算出し
    た誤差に基づき、前記光学式文字読取装置が参照する座
    標を補正する補正処理とを、行うことを特徴とする文字
    記入座標の補正方法。
  2. 【請求項2】 前記基準帳票のイメージ中の複数の線分
    の傾きをそれぞれ求めると共にその平均値を求め、該平
    均値から一定以上傾きが離れた線分は前記フォーマット
    から除外し、前記入力帳票のイメージ中の複数の線分の
    傾きをそれぞれ求めると共にその平均値を求め、該平均
    値から一定以上傾きが離れた線分は、前記線分情報から
    除外する除外処理を前記選択処理及び前記比較処理の前
    に行うことを特徴とする請求項1記載の文字記入座標の
    補正方法。
  3. 【請求項3】 逐次与えられる複数種類の入力帳票のイ
    メージを取込み、予め複数種類のフォーマットに登録さ
    れている座標を参照して該各入力帳票のイメージ中の文
    字記入位置の文字パターンを認識する光学式文字読取装
    置に対し、該各入力帳票にそれぞれ対応する前記フォー
    マットを選択するフォーマット選択方法において、 予め、前記入力帳票の種類毎の基準となる基準帳票のイ
    メージを取込み該イメージ中の複数の線分を抽出して該
    各線分の座標を該種類毎の前記フォーマットにそれぞれ
    登録する線分フォーマット登録処理と、請求項1記載の
    線分情報抽出処理とを行っておき、 前記与えられた入力帳票に対し前記複数種類のフォーマ
    ットのうちから順に1つのフォーマットを選択し、該選
    択したフォーマット毎に、請求項1記載の選択処理と、
    前記入力帳票のイメージ中の複数の線分のうちの1本の
    線分を前記基準線分に対応する線分と仮定して前記基準
    帳票のイメージまたは該入力帳票のイメージにおける残
    りの線分の座標を平行移動して比較し、該基準帳票のイ
    メージ及び入力帳票のイメージにおける残りの線分の座
    標の一致具合を求める処理とを該線分の仮定を換えて繰
    り返すフォーマット評価処理を行い、 前記フォーマット毎の前記一致具合から、前記入力帳票
    の種類に対応する前記フォーマットを特定することを特
    徴とするフォーマット選択方法。
  4. 【請求項4】 前記フォーマット評価処理を行う前に、
    前記基準帳票のイメージ中の複数の線分の傾きをそれぞ
    れ求めると共にその平均値を求め、該平均値から一定以
    上傾きが離れた線分は前記フォーマットから除外し、前
    記入力帳票のイメージ中の複数の線分の傾きをそれぞれ
    求めると共にその平均値を求め、該平均値から一定以上
    傾きが離れた線分は、前記線分情報から除外する除外処
    理を行うことを特徴とする請求項3記載のフォーマット
    選択方法。
  5. 【請求項5】 逐次与えられる入力帳票のイメージを取
    込み、予めフォーマットに登録されている座標を参照し
    て該各入力帳票のイメージ中の文字記入位置の文字パタ
    ーンを認識する光学式文字読取装置において、 前記入力帳票に先立って与えられた該入力帳票の基準と
    なる基準帳票のイメージ及び逐次与えられる該入力帳票
    のイメージを取得する入力手段と、 前記基準帳票のイメージにおける複数の線分の座標を求
    めて前記フォーマットに登録すると共に、前記入力帳票
    のイメージにおける複数の線分の座標を線分情報として
    抽出する線分抽出部と、 前記基準帳票の線分のうちの1本を基準線分として選択
    し、前記入力帳票のイメージ中の複数の線分のうちの1
    本の線分を該基準線分に対応する線分と仮定して前記基
    準帳票のイメージまたは該入力帳票のイメージにおける
    残りの線分の座標を平行移動して比較し、該基準帳票の
    イメージ及び該入力帳票のイメージにおける残りの線分
    の座標の一致具合を求める処理を該仮定を換えて繰り返
    し、該各一致具合から、該基準線分に相当する該入力帳
    票の線分を特定する比較部と、 前記比較部で特定された線分の前記入力帳票のイメージ
    における座標と前記基準線分の前記基準帳票のイメージ
    における座標との間の誤差を算出し、該算出した誤差に
    基づき、前記参照する座標を補正する補正部と、 前記補正された座標を参照して前記入力帳票に記載され
    た文字を認識する認識部とを、 備えたことを特徴とする文字読取装置。
  6. 【請求項6】 逐次与えられる複数種類の入力帳票のイ
    メージを取込み、予め複数種類のフォーマットに登録さ
    れている座標を参照して該各入力帳票のイメージ中の文
    字記入位置の文字パターンを認識する光学式文字読取装
    置において、 前記複数種類の入力帳票に先立って与えられた該各入力
    帳票の基準となる複数種類の基準帳票のイメージ及び逐
    次与えられる該入力帳票のイメージを取得する入力手段
    と、 前記複数種類の基準帳票のイメージにおける複数の線分
    の座標を求め、該種類毎の前記フォーマットにそれぞれ
    登録すると共に、前記各入力帳票のイメージにおける複
    数の線分の座標を線分情報として抽出する線分抽出部
    と、 前記入力手段に与えられた入力帳票に対し、前記複数種
    類のフォーマットのうちから順に1つのフォーマットを
    選択し、該選択したフォーマット毎に、前記基準帳票の
    線分のうちの1本を基準線分として選択し、該入力帳票
    のイメージ中の複数の線分のうちの1本の線分を該基準
    線分に対応する線分と仮定して前記基準帳票のイメージ
    または該入力帳票のイメージにおける残りの線分の座標
    を平行移動して比較し、該基準帳票のイメージ及び該入
    力帳票のイメージにおける残りの線分の座標の一致具合
    を求める処理を該仮定を換えて繰り返し、該フォーマッ
    ト毎の一致具合から、該入力帳票の種類に対応する前記
    フォーマットを特定する比較部と、 前記特定されたフォーマットに基づき、前記入力帳票に
    記載された文字を認識する認識部とを、備えたことを特
    徴とする光学式文字読取装置。
  7. 【請求項7】 前記比較部は、前記各基準帳票のイメー
    ジ中の複数の線分の傾きをそれぞれ求めると共にその平
    均値を求め、該平均値から一定以上傾きが離れた線分は
    前記フォーマットから除外し、前記入力帳票のイメージ
    中の複数の線分の傾きをそれぞれ求めると共にその平均
    値を求め、該平均値から一定以上傾きが離れた線分は、
    前記線分情報から除外する構成にしたことを特徴とする
    請求項5または6記載の光学式文字読取装置。
JP10158984A 1998-06-08 1998-06-08 文字記入座標の補正方法、フォーマット選択方法及び光学式文字読取装置 Withdrawn JPH11353412A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10158984A JPH11353412A (ja) 1998-06-08 1998-06-08 文字記入座標の補正方法、フォーマット選択方法及び光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10158984A JPH11353412A (ja) 1998-06-08 1998-06-08 文字記入座標の補正方法、フォーマット選択方法及び光学式文字読取装置

Publications (1)

Publication Number Publication Date
JPH11353412A true JPH11353412A (ja) 1999-12-24

Family

ID=15683682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10158984A Withdrawn JPH11353412A (ja) 1998-06-08 1998-06-08 文字記入座標の補正方法、フォーマット選択方法及び光学式文字読取装置

Country Status (1)

Country Link
JP (1) JPH11353412A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626738B2 (en) 2014-03-05 2017-04-18 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and storage medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626738B2 (en) 2014-03-05 2017-04-18 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and storage medium

Similar Documents

Publication Publication Date Title
EP1598770B1 (en) Low resolution optical character recognition for camera acquired documents
JP6143111B2 (ja) 物体識別装置、物体識別方法、及びプログラム
JP2020527260A (ja) テキスト検出分析方法、装置及びデバイス
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20010051965A1 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
WO2020008629A1 (ja) 画像処理システム、画像処理方法、及びプログラム
WO2020008628A1 (ja) 画像処理システム、画像処理方法、及びプログラム
KR101016544B1 (ko) 단어 인식 방법 및 기록 매체
WO2006080568A1 (ja) 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム
JP2007060417A (ja) 図形認識方法
CN115497114A (zh) 一种卷烟物流收货票据的结构化信息提取方法
JPH11353412A (ja) 文字記入座標の補正方法、フォーマット選択方法及び光学式文字読取装置
Kumar et al. Line based robust script identification for indianlanguages
JP4651876B2 (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP3730073B2 (ja) テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体
JP3930466B2 (ja) 文字認識装置、文字認識プログラム
JP2004280530A (ja) 帳票処理システム及び帳票処理方法
JP3998439B2 (ja) 画像処理装置、画像処理方法およびこれらの方法をコンピュータに実行させるプログラム
JP2913103B2 (ja) パターン認識装置
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
JP2006330873A (ja) 指紋照合装置、方法およびプログラム
JPH09293122A (ja) 文書読み取り方法及び装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP3162419B2 (ja) 認識辞書更新方法
Steinke et al. Recognition of humboldt's handwriting in complex surroundings

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050906