JP2001229341A - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法

Info

Publication number
JP2001229341A
JP2001229341A JP2000035779A JP2000035779A JP2001229341A JP 2001229341 A JP2001229341 A JP 2001229341A JP 2000035779 A JP2000035779 A JP 2000035779A JP 2000035779 A JP2000035779 A JP 2000035779A JP 2001229341 A JP2001229341 A JP 2001229341A
Authority
JP
Japan
Prior art keywords
image
character
feature point
extracted
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000035779A
Other languages
English (en)
Inventor
Takashi Hirano
敬 平野
Yasuhiro Okada
康裕 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000035779A priority Critical patent/JP2001229341A/ja
Publication of JP2001229341A publication Critical patent/JP2001229341A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 フィールドの抽出に必要不可欠な十字点が存
在しない帳票や、逆に膨大な数の十字点が存在する場合
は、フィールドの抽出ができなかったり、フィールド抽
出に誤差が生じて正確な文字認識を行うことができない
という課題があった。 【解決手段】 帳票の画像から文字認識の対象とする領
域を特定する特徴点を抽出し、文字を記入した帳票の画
像である文字記入画像と、この文字記入画像と同一の帳
票の画像であって文字を記入していない文字未記入画像
とから抽出した各特徴点を対応付けて、文字未記入画像
に対する文字記入画像の位置関係を補正し、位置関係の
補正の結果に基づいて文字記入画像上の文字認識の対象
とする領域を抽出しこの文字認識の対象とする領域内の
画像に対して文字認識処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は文字を記入した画
像から文字を認識する文字認識装置及び文字認識方法に
係り、特に帳票の画像から文字認識の対象とする領域を
抽出し、この領域内の文字を認識する文字認識装置及び
文字認識方法に関するものである。
【0002】
【従来の技術】入力された帳票の画像上から文字認識の
対象とする領域(以下、フィールドと称する)を抽出
し、フィールド内に記入された文字の認識を行う文字認
識装置において、入力された画像が傾いていたり拡大縮
小されていても、正しくフィールドを抽出することがで
きるものが提案されている。このような従来の文字認識
装置として特開平10−91783号公報に開示される
ものがある。
【0003】図18は特開平10−91783号公報に
開示された従来の文字認識装置の構成を示すブロック図
であり、図において、180は帳票などの文字が記入さ
れた画像を文字認識装置で処理可能な形態の入力画像と
して取り込む画像入力部で、181は入力画像の位置ず
れ、回転、変倍の検出に用いる十字点を抽出する十字点
抽出部である。ここで、十字点とは基本的に表などに出
現する罫線のような比較的長い線分が十字に交差した点
を指す。182は入力画像と参照画像との十字点の対応
付けを行って両画像の対応点を検出する対応点検出部、
183は画像補正部であって、入力画像と参照画像の対
応点間のずれを算出し、そのずれを補正するための補正
関数を求める。184は文字画像領域メモリ187に予
め格納された参照画像に対応するデータに基づいて補正
画像からフィールドを切り出す文字画像切り出し部、1
85は文字画像切り出し部184から入力された画像デ
ータより個々の文字を切り出して文字認識し、文字コー
ドをデータ番号とともに出力する文字認識部、186は
参照画像における十字点の座標、十字点番号、十字線の
縦線及び横線の太さ情報を格納する参照画像パターンメ
モリ、187はフィールドの番号、属性、座標からなる
フィールド切り出しのためのデータを予め格納する文字
画像領域メモリである。
【0004】図19は十字点の対応付けを説明する図で
あり、190は入力画像192と同一の入力形式を有
し、文字が記入されていない帳票の画像である参照画
像、191は参照画像190から抽出した十字点、19
2は参照画像190と同一の入力形式を有し、文字が記
入された帳票の画像である入力画像、193は入力画像
192から抽出した十字点である。
【0005】次に動作について説明する。先ず、画像入
力部180は文字の記入された帳票をスキャナ等で読み
取ることで入力画像192を作成する。
【0006】次に、十字点抽出部181はマスク処理に
より入力画像192から罫線が十字型に交差する交差点
である十字点193を求める。例えば、図19では入力
画像192上から8個の十字点193が得られる。な
お、同じ処理を用いて文字が記入されていない帳票の画
像である参照画像190から抽出した十字点191の位
置を、予め参照画像パターンメモリ186に格納してお
く。
【0007】対応点検出部182は、入力画像192か
ら抽出した十字点193と参照画像190から抽出した
十字点191を対応付ける。ここでは、参照画像190
から抽出した十字点191に対して、その位置から所定
の範囲内に存在する入力画像192から抽出した十字点
193を対応付ける。
【0008】画像補正部183は、対応点検出部182
で得た十字点191と十字点193との間の対応付け結
果を基に、対応点間のずれ(平行移動、回転、変倍)を
算出し、そのずれを補正するための補正関数を求める。
具体的には、補正関数として式(1)に示すアフィン変
換を用い、最小二乗法等の既存の方法によって十字点1
91と十字点193との間の対応付け結果からアフィン
変換係数a11,a12,a21,a22,b1 ,b2 を得る。
【数1】 ここで、(Xt,Yt)は入力画像192上の座標点、
(Xi,Yi)は補正後の座標点を示す。画像補正部1
83では上記補正関数を入力画像192における全ての
画素に適用することでずれを補正した補正画像を作成す
る。
【0009】文字画像切り出し部184は補正画像から
文字認識の対象とするフィールドを抽出する。フィール
ドを抽出するためのデータは文字画像領域メモリ187
に格納されている。このデータは、上述したように例え
ばフィールドの座標(フィールドを表わす矩形の左上点
と右下点座標値)からなる。
【0010】最後に、文字認識部185は文字画像切り
出し部184で抽出したフィールド内に記入された文字
を認識して外部に出力する。これにより帳票などの画像
のフィールド内に記入された文字の読み取り処理が終了
する。
【0011】
【発明が解決しようとする課題】従来の文字認識装置及
び文字認識方法は以上のような構成を有しているので、
フィールドの抽出に必要不可欠な十字点が存在しない帳
票や、逆に膨大な数の十字点が存在する場合は、フィー
ルドの抽出ができなかったり、フィールド抽出に誤差が
生じて正確な文字認識を行うことができないという課題
があった。
【0012】具体的に説明すると、一般に使用されてい
る既存の帳票にはダイレクトメールから伝票まで様々な
形式のものがあるが、その多くは文字認識処理を意識せ
ず、記入の容易さや美しさ等を考慮してデザインされて
いる。このため、十字点が存在しない場合、従来の文字
認識装置では参照画像190と入力画像192の十字点
間の対応付けが実施できないことから、入力画像192
の補正関数を求めることができず、フィールド抽出をす
ることができない。また、逆に膨大な数の十字点が存在
する場合では、誤った十字点間の対応付けが生じて補正
関数に誤差が含まれ、これにより、誤った(位置のずれ
た)フィールドが抽出されて正確な文字認識を行うこと
ができない可能性がある。
【0013】この発明は上記のような課題を解決するた
めになされたもので、文字認識処理を意識せずに作成さ
れた帳票(対応付けに適当な数の十字点を持たないもの
や特徴点として抽出することのできる図形や記号のない
もの)に対しても、正しくフィールドを抽出することが
できる文字認識装置及び文字認識方法を得ることを目的
とする。
【0014】
【課題を解決するための手段】この発明に係る文字認識
装置は、帳票の画像を読み取る画像入力手段と、この画
像入力手段が読み取った帳票の画像から文字認識の対象
とする領域を特定する特徴点を抽出する特徴点抽出手段
と、画像入力手段が読み取った帳票の画像のうち、文字
を記入した帳票の画像である文字記入画像と、この文字
記入画像と同一の帳票の画像であって文字を記入してい
ない文字未記入画像とから特徴点抽出手段が抽出した各
特徴点を対応付けて、文字未記入画像に対する文字記入
画像の位置関係を補正する位置補正手段と、この位置補
正手段による位置関係の補正の結果に基づいて、文字記
入画像上の文字認識の対象とする領域を抽出するフィー
ルド抽出手段と、このフィールド抽出手段が抽出した文
字認識の対象とする領域内の画像に対して文字認識処理
を行う文字認識手段とを備えるものである。
【0015】この発明に係る文字認識装置は、任意の文
字、図形、記号若しくはこれらの組み合わせに係る特徴
点フィルタを特徴点抽出手段が備え、この特徴点フィル
タと所定の整合性を示す文字記入画像及び文字未記入画
像上の部位、及び/若しくは、文字記入画像及び文字未
記入画像上の罫線の端点及び交点を特徴点として抽出す
るものである。
【0016】この発明に係る文字認識装置は、特徴点抽
出手段が罫線の端点の位置、交点を構成する各罫線がな
す形状、及び/若しくは、特徴点を抽出するのに使用し
た特徴点フィルタを特定する情報を、特徴点の種類とし
て規定するものである。
【0017】この発明に係る文字認識装置は、位置補正
手段が文字記入画像と文字未記入画像とから抽出した各
特徴点から対応確率を算出し、この対応確率を基にし
て、文字記入画像と文字未記入画像とから抽出した各特
徴点の対応付けを行い、この対応付けの結果から文字未
記入画像に対する文字記入画像の位置関係を補正するた
めのアフィン変換係数を推定し、このアフィン変換係数
を基にして文字未記入画像から抽出した特徴点の位置座
標値を補正するものである。
【0018】この発明に係る文字認識装置は、位置補正
手段が特徴点の位置座標値及び種類を基にして対応確率
を算出するものである。
【0019】この発明に係る文字認識装置は、位置補正
手段がアフィン変換係数の推定誤差が所定値以下になる
まで補正した文字未記入画像から抽出した特徴点の位置
座標値を用いて、対応確率算出手段が対応確率を算出
し、この対応確率を基にして、対応付け、アフィン係数
推定、及び特徴点の座標値補正を繰り返すものである。
【0020】この発明に係る文字認識装置は、文字未記
入画像から抽出した特徴点と文字未記入画像とを重ねて
ユーザに表示し、ユーザが文字未記入画像上で指定した
領域を文字認識の対象とする領域として抽出するフィー
ルド指定手段と、特徴点のうちユーザが不要と判断した
特徴点を除去する特徴点選択手段とを備え、フィールド
指定手段が抽出した文字認識の対象とする領域、及び/
若しくは、特徴点選択手段が除去しなかった特徴点を有
する文字未記入画像である帳票フォーマットを作成する
ものである。
【0021】この発明に係る文字認識装置は、位置補正
手段が文字未記入画像と文字記入画像とから抽出した各
特徴点を対応付ける際、対応確率が所定値より小さい対
応付け、及び/若しくは、文字記入画像から抽出した一
個の特徴点が文字未記入画像から抽出した複数個の特徴
点と対応付く場合、この対応付け結果を除外するもので
ある。
【0022】この発明に係る文字認識装置は、ユーザが
指定した文字未記入画像上の領域内の画像から、特徴抽
出手段が使用する特徴点フィルタを作成する特徴点フィ
ルタ生成手段を備えるものである。
【0023】この発明に係る文字認識装置は、特徴点抽
出手段が文字未記入画像から抽出した特徴点の数が所定
値以下となると、特徴点フィルタ生成手段がユーザに対
して警告を行うものである。
【0024】この発明に係る文字認識方法は、帳票の画
像を読み取る画像入力ステップと、この画像入力ステッ
プで読み取った帳票の画像から文字認識の対象とする領
域を特定する特徴点を抽出する特徴点抽出ステップと、
画像入力ステップにて読み取った帳票の画像のうち、文
字を記入した帳票の画像である文字記入画像から抽出し
た特徴点と、文字記入画像と同一の帳票の画像であって
文字を記入していない文字未記入画像から予め抽出して
おいた特徴点とを対応付けて、文字未記入画像に対する
文字記入画像の位置関係を補正する位置補正ステップ
と、この位置補正ステップにおける位置関係の補正の結
果に基づいて、文字記入画像上の文字認識の対象とする
領域を抽出するフィールド抽出ステップと、このフィー
ルド抽出ステップが抽出した文字認識の対象とする領域
内の画像に対して文字認識処理を行う文字認識ステップ
とを備えるものである。
【0025】この発明に係る文字認識方法は、特徴点抽
出ステップにて、任意の文字、図形、記号若しくはこれ
らの組み合わせに係る特徴点フィルタと所定の整合性を
示す文字記入画像及び文字未記入画像上の部位、及び/
若しくは、文字記入画像及び文字未記入画像上の罫線の
端点及び交点を特徴点として抽出するものである。
【0026】この発明に係る文字認識方法は、特徴点抽
出ステップにて、罫線の端点の位置、交点を構成する各
罫線がなす形状、及び/若しくは、特徴点を抽出するの
に使用した特徴点フィルタを特定する情報を、特徴点の
種類として規定するものである。
【0027】この発明に係る文字認識方法は、文字記入
画像と文字未記入画像とから抽出した各特徴点から対応
確率を算出する対応確率算出ステップと、対応確率を基
にして、文字記入画像と文字未記入画像とから抽出した
各特徴点の対応付けを行う対応付けステップと、この対
応付けの結果から文字未記入画像に対する文字記入画像
の位置関係を補正するためのアフィン変換係数を推定す
るアフィン係数推定ステップと、このアフィン係数推定
ステップで推定したアフィン変換係数を基にして、文字
未記入画像から抽出した特徴点の位置座標値を補正する
座標値更新ステップとから位置補正ステップが構成され
るものである。
【0028】この発明に係る文字認識方法は、対応確率
算出ステップにて特徴点の位置座標値及び種類を基にし
て対応確率を算出するものである。
【0029】この発明に係る文字認識方法は、アフィン
変換係数値の推定誤差が所定値以下になるまで、座標値
更新ステップにて補正した文字未記入画像から抽出した
特徴点の位置座標値を用いて、対応確率算出ステップか
らの処理を繰り返すものである。
【0030】この発明に係る文字認識方法は、文字未記
入画像から抽出した特徴点と文字未記入画像とを重ねて
ユーザに表示し、ユーザが文字未記入画像上で指定した
領域を文字認識の対象とする領域として抽出するフィー
ルド指定ステップと、特徴点のうちユーザが不要と判断
した特徴点を除去する特徴点選択ステップとを備え、フ
ィールド指定ステップにてユーザが指定した文字認識の
対象とする領域、及び/若しくは、特徴点選択ステップ
にてユーザが除去しなかった特徴点の情報を有する文字
未記入画像である帳票フォーマットを作成するものであ
る。
【0031】この発明に係る文字認識方法は、対応付け
ステップにて文字未記入画像と文字記入画像とから抽出
した各特徴点とを対応付ける際、対応確率が所定値より
小さい対応付け、及び/若しくは、文字記入画像から抽
出した一個の特徴点が文字未記入画像から抽出した複数
個の特徴点と対応付く場合、この対応付け結果を除外す
るものである。
【0032】この発明に係る文字認識方法は、ユーザが
指定した文字未記入画像上の領域内の画像から、特徴点
抽出ステップにて使用する特徴点フィルタを作成する特
徴点フィルタ生成ステップを備えるものである。
【0033】この発明に係る文字認識方法は、特徴点フ
ィルタ生成ステップにて、特徴点抽出ステップで文字未
記入画像から抽出した特徴点の数が所定値以下となる
と、ユーザに対して警告を行うものである。
【0034】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1による文
字認識装置を示す構成図である。図において、1は画像
入力部(画像入力手段)で、文字を記入した帳票の画像
(文字記入画像)を本発明の文字認識装置で処理可能な
形態の入力画像として入力する。この画像入力部1とし
ては画像を光学的に読み取るイメージリーダであるスキ
ャナ、ファクシミリ、及びこのファクシミリと本発明の
文字認識装置とを接続する通信回線、モデムなどの通信
装置なども含んでいる。また、画像入力部1が読み取っ
た帳票の画像のうち、文字を記入した帳票の画像を入力
画像(文字記入画像)とし、この入力画像と同一の帳票
の画像であって文字を記入していない帳票の画像を参照
画像(文字未記入画像)とする。2は画像入力部1が入
力した入力画像から文字認識の対象とする領域(フィー
ルド)を特定する特徴点の情報を抽出する特徴点抽出部
(特徴点抽出手段)、3は位置補正部(位置補正手段)
であって、画像入力部1が入力した入力画像と、画像入
力部1が予め入力しておいた参照画像とから、特徴点抽
出部2が抽出した各特徴点を対応付けて、読み取り時の
傾きや平行移動などの参照画像に対する入力画像の位置
関係を補正する。4は位置補正部3による読み取り時の
傾きや平行移動などの参照画像に対する入力画像の位置
関係の補正結果に基づいて、入力画像のフィールドを抽
出するフィールド抽出部(フィールド抽出手段)、5は
フィールド抽出部4が抽出したフィールド内の画像に対
して文字認識処理を行う文字認識部(文字認識手段)で
ある。6は入力画像及び参照画像における任意の文字、
図形、記号若しくはこれらの組み合わせに係るフィルタ
(特徴点フィルタ)を予め記憶しておくフィルタ情報メ
モリ、7は帳票フォーマットメモリであって、フィール
ドや特徴点を有する参照画像である帳票フォーマットが
予め記憶されている。
【0035】図2は実施の形態1による文字認識装置に
使用する参照画像を示す図で、図3は実施の形態1によ
る文字認識装置に使用する入力画像を示す図である。図
において、8は参照画像(文字未記入画像)であり、例
として応募はがきの帳票画像を示している。9は入力画
像(文字記入画像)、10,11は入力画像9上の部分
領域である。
【0036】次に動作について説明する。画像入力部1
は文字を記入した帳票をスキャナなどのイメージリーダ
又はファクシミリで通信回線を介して読み取り、本発明
の文字認識装置で処理可能な形態の入力画像9を作成す
る(画像入力ステップ)。具体的には、図2に示す参照
画像8のような未記入の帳票に文字を記入して、画像入
力部1であるスキャナやファクシミリ等で読み取り、図
3に示すような入力画像9を得る。図3の例では、画像
入力部1による読み取り時に、読み取るべき帳票がスキ
ャナやファクシミリ等の読み取り面に対して傾いていた
り、ずれがあったために、入力画像9に傾きや平行移動
が加わっている。
【0037】次に特徴点抽出部2は、入力画像9内の文
字認識の対象とする領域であるフィールドを特定する特
徴点の情報を抽出する(特徴点抽出ステップ)。この特
徴点の抽出は下記の二種類の処理で行う。一つは帳票に
記載された罫線から特徴点を抽出する処理、もう一つは
フィルタで特徴点を抽出する処理である。
【0038】先ず、帳票に記載された罫線から特徴点を
抽出する処理について説明する。図4は図3における部
分領域11の拡大図である。図において、12は入力画
像9上で黒画素が横方向に一定長以上連続する領域であ
る横ラスタ、13は入力画像9上で黒画素が縦方向に一
定長以上連続する領域である縦ラスタ、14は横ラスタ
12と縦ラスタ13との重なり部分、15は図3におけ
る入力画像9の部分領域11を拡大したイメージ画像で
ある。この処理では入力画像9から縦罫線と横罫線とを
抽出し、その交点及び端点を特徴点とする。罫線の抽出
は、例えば特開平7−282193号公報に開示される
従来技術で実現する。
【0039】具体的には、入力画像9上で黒画素が横方
向に一定長以上連続する領域を横ラスタ12として抽出
し、隣接した横ラスタ12の集合を一本の横罫線と認識
する。また、縦罫線も同様にして隣接した縦ラスタ13
の集合を一本の縦罫線とする。縦横罫線の交点は横ラス
タ12と縦ラスタ13との重なり部分14として求め
る。図4の例では、3本の横ラスタ12と2本の縦ラス
タ13が検出されている。このとき、横ラスタ12の集
合が横罫線、縦ラスタ13の集合が縦罫線と認識され、
横ラスタ12と縦ラスタ13とが重なる重なり部分14
が縦横罫線の交点として求まる。なお、ラスタとみなす
画素数や罫線とみなすラスタ数は、ユーザが適宜設定を
変更することができるようにしてもよい。このようにす
ることで、罫線と誤認されるような線が誤って記入され
ていてもユーザが適宜対応することができる。
【0040】これとは別に、罫線の端点は罫線を構成す
るラスタの端点位置から求める。例えば、横罫線の場合
は横ラスタ12の最も右の位置を右端点とし、最も左の
位置を左端点として抽出し、これらを横罫線の端点とす
る。縦罫線の端点も同様にして縦ラスタ13の最も上の
位置を上端点とし、最も下の位置を下端点として抽出
し、これらを縦罫線の端点とする。
【0041】以上の処理で得た罫線の交点と端点を特徴
点として抽出する。ここで、特徴点は、各特徴点の位置
座標値と種類にて表現される。罫線の交点や端点からな
る特徴点の種類には、例えば交点を構成する各罫線がな
す形状(9個;┌、┐、┘、└、├、┬、┤、┴、
┼)、端点の位置(4個;横罫線の左端点、右端点、縦
罫線の上端点、下端点)がある。
【0042】次にフィルタで特徴点を抽出する処理につ
いて説明する。図5はフィルタによる特徴点の抽出を説
明する図である。図において、16〜19は7×7画素
の大きさを持つフィルタ(特徴点フィルタ)で、それぞ
れ異なる位置における4×4画素の大きさの矩形を抽出
する。20は図3中の部分領域10を拡大したイメー
ジ、21a,21bは抽出された特徴点である。ここ
で、フィルタによる特徴点の抽出処理にはフィルタ情報
メモリ6に予め記憶しておいたフィルタを用い、このフ
ィルタを入力画像9に重畳させてフィルタからの出力値
が閾値以上となる画素を特徴点とする。
【0043】具体的に説明すると、図5に示した7×7
画素の大きさを持つフィルタ16〜19において、4×
4画素の大きさの矩形を構成する黒い小矩形を値+1の
画素とし、それ以外の白い小矩形を値−1の画素とす
る。フィルタ16〜19の中心点を入力画像9上の位置
座標値(Ix,Iy)の画素に合わせて、フィルタ16
〜19と入力画像9とを重畳した際、フィルタ16〜1
9からの出力値V(Ix,Iy)を下記の式(2)を用
いて求める。
【数2】 但し、式(2)において、F(i,j)はフィルタ16
〜19上の画素(i,j)が持つ値(つまり、黒い小矩
形であるならば+1、白い小矩形であるならば−1)、
Q(Ix,Iy)は入力画像9上の画素(Ix,Iy)
が持つ値を示す。ここで、Q(Ix,Iy)は入力画像
9上の画素(Ix,Iy)が黒画素の場合は値+1を、
白画素の場合は値−1を持つ。
【0044】上記処理を入力画像9上の全画素に対して
行い、V(Ix,Iy)の値が閾値以上の画素(Ix,
Iy)を特徴点とする。例えば、イメージ20は図3に
示す入力画像9の部分領域10を拡大したものであり、
式(2)から分かるようにフィルタ16〜19に係る4
×4画素の大きさの矩形と最も良く整合する入力画像9
上の部位が、出力値V(Ix,Iy)が大きくなる。こ
れより、イメージ20からは、フィルタ17により特徴
点21aが、フィルタ19により特徴点21bが抽出さ
れる。各特徴点21a,21bは位置座標値と種類で表
現し、種類として抽出に使用したフィルタを特定する情
報(例えば、フィルタ16を特定する番号としてフィル
タNO.1、フィルタ17を特定する番号としてフィル
タNO.2等)を持つ。
【0045】図6は特徴点を抽出した入力画像9を示す
図であり、図7は入力画像9から抽出した特徴点の情報
を示す図である。図において、21は入力画像9から抽
出された特徴点、21cは罫線の交点及び端点以外に入
力画像9上の文字に関連して抽出された特徴点である。
上述した特徴点抽出処理により特徴点抽出部2では、例
えば入力画像9に対して図6に示す特徴点21を得る。
ここで各特徴点21は、図7に示すような特徴点の位置
座標値と種類で表現される。
【0046】また、図6に示す特徴点21cは、罫線の
交点及び端点以外に入力画像9上の文字に係るフィルタ
から抽出している。このように本発明の文字認識装置
は、文字に係るフィルタを用意することによっても特徴
点を抽出することができ、文字認識処理を意識せずに作
成された帳票(対応付けに適当な数の十字点を持たない
ものや特徴点として抽出することのできる図形や記号の
ないもの)に対しても、正しくフィールドを抽出するこ
とができる。
【0047】特徴点抽出部2によって入力画像9から特
徴点が抽出されると、位置補正部3は上記と同様な処理
により特徴点抽出部2が参照画像8から抽出した特徴点
と、入力画像9から抽出された特徴点とを対応付け、入
力画像9の読み取り時におけるずれ(回転、傾き、平行
移動、変倍)を補正する(位置補正ステップ)。ここ
で、参照画像8から抽出した特徴点について説明する
と、特徴点抽出部2が予め参照画像8から抽出しておい
た特徴点は、参照画像8とともに帳票フォーマットとし
て帳票フォーマットメモリ7に格納してある。これによ
り、位置補正部3は、特徴点抽出部2によって入力画像
9から特徴点が抽出されると、帳票フォーマットメモリ
7から帳票フォーマットを適宜読み出して使用すること
ができる。図8は帳票フォーマットを示す図であり、2
2は参照画像8から抽出した特徴点である。図9は図8
の帳票フォーマットにおける特徴点の情報を示す図であ
る。例えば、図8に示すように、特徴点抽出部2によっ
て参照画像8から抽出した特徴点22の情報(図9に示
すような各特徴点の位置座標値と種類)が帳票フォーマ
ットメモリ7に格納されている。
【0048】図10は位置補正処理を示すフロー図であ
り、図10に従って位置補正処理を説明する。先ず、位
置補正部3は参照画像8と入力画像9とから抽出された
各特徴点を対応付けるために対応確率を算出する(ステ
ップST1、対応確率算出ステップ)。具体的には、参
照画像8から抽出したN個の特徴点Ri(i=1〜N)
と、入力画像9から抽出したM個の特徴点Ij(j=1
〜M)との対応関係から対応確率Pijを求める。ここ
では、特徴点RiとIjとの対応関係として類似度Si
jを求め、その後で下記の式(3)により対応確率Pi
jを計算する。
【数3】 類似度Sijの算出は、互いの特徴点Ri,Ijが有す
る位置座標が近く、且つ、上述した特徴点の種類が同じ
である場合に高い値を与え、逆に位置座標が離れてお
り、特徴点の種類が異なる場合には小さな値を与えるよ
うにする。このようにして各特徴点Ri,Ijに対して
類似度Sijを求め、上記式(3)によって各特徴点R
i,Ijに対する対応確率を算出する。
【0049】式(3)によれば、類似度Sijの値が高
い特徴点の対応付けに対しては、高い対応確率Pijの
値が得られる。また、式(3)の括弧内の演算により、
例えば参照画像8から抽出した特徴点Riが、入力画像
9から抽出した特徴点Ijに対してのみ高い類似度Si
jを示す場合、つまり、一つの特徴点Riに対して一つ
の特徴点Ijが高い類似度Sijを示す場合に対応確率
Pijの値が高くなり、逆に特徴点Riが入力画像9か
ら抽出された複数の特徴点Ijに対して高い類似度Si
jを示して正しい対応付けが判断できない場合は対応確
率Pijの値が低くなる(複数の特徴点Ijに対して高
い類似度を示すと、式(3)の括弧内における分母の値
が大きくなる)。
【0050】次に位置補正部3はステップST1で算出
した対応確率Pijの値を基にして、特徴点Riと特徴
点Ijとの対応付け処理を行う(ステップST2、対応
付けステップ)。ここでは、参照画像8から抽出した特
徴点Riに対して、対応確率Pijの値が最大となる特
徴点Ijを対応付ける。
【0051】しかしながら、上記のようにして求めた各
特徴点Ri,Ijの対応付けには、入力画像9の読み取
り時において読み取るべき帳票がかすれた状態で入力さ
れていたり、機械的な振動や電気的なノイズが重畳した
り、読み取り時における位置ずれ、特徴点と誤認される
ように記入された文字等の影響により、誤った対応付け
が含まれている可能性が高い。図11は特徴点の対応付
け誤りを説明する図であり、図11の例では特徴点R1
とI1、R2とI2は正しく対応付いているが、特徴点
R3は近くにある特徴点I4と誤って対応付いている。
このような誤った対応付けは、後にずれの補正式を算出
する際の誤差要因となるため除去する必要がある。
【0052】そこで、信頼性の低い対応付け結果を取り
除く。具体的には、対応確率Pijに閾値を設け、対応
確率Pijの値がある閾値以下となる場合に対応付け結
果を除去する。また、対応付けの結果が一対多(入力画
像9から得た一個の特徴点Ijが、参照画像8から得た
複数個の特徴点Riと対応付く)となる場合も、その対
応付け結果を除外する。なお、上記閾値はユーザが適宜
設定できるようにしてもよく、後述するアフィン変換係
数を推定する繰り返し処理にて最終的に得られた対応確
率を閾値の決定の基準としてもよい。
【0053】次にステップST2で得た対応付け結果を
基にして、位置補正部3は対応付いた特徴点Ri,Ij
間の位置ずれ(平行移動、回転、変倍)を算出し、その
ずれを補正するための補正式を求める(ステップST
3、アフィン係数推定ステップ)。具体的には、補正式
としてアフィン変換(式(4))を用い、ずれを補正す
るためのアフィン変換係数a11,a12,a21,a22,b
1 ,b2 を最小二乗法等の既存の手法により求める。式
(4)は参照画像8から抽出した特徴点の位置座標(X
0,Y0)が入力画像9上の位置座標(X1,Y1)に
対応することを示す。
【数4】 従来の文字認識装置(例えば、特開平10−91783
号公報に開示されるもの)では、アフィン変換係数を求
めた後、直ちに式(4)を用いて特徴点の位置ずれを補
正してフィールドを抽出していたが、文字認識処理を意
識しないで作成した帳票(対応付けに適当な数の十字点
を持たないものや特徴点として抽出することのできる図
形や記号のないもの)を読み取る場合、ステップST2
において誤った対応付け結果が除去しきれず、アフィン
変換係数の推定誤差が残る可能性がある。そこで、本発
明の文字認識装置では、以降で説明する繰り返し演算で
アフィン変換係数の推定精度を高める処理を行ってい
る。
【0054】先ず、ステップST3にて求めたアフィン
変換による補正式(式(4))に基づいて、位置補正部
3は参照画像8から抽出した全ての特徴点の位置座標値
を更新する(ステップST5、座標値更新ステップ)。
具体的には、参照画像8から抽出した特徴点Riの位置
座標値を式(4)のX0,Y0に代入し、補正後の位置
座標値X1,Y1を得る。ここで、以降、再びステップ
ST1からステップST4までの処理を繰り返すが、こ
のとき、ステップST1では、上記補正後の位置座標値
X1,Y1の値を、参照画像8から抽出した特徴点Ri
の位置座標値として対応確率Pijを計算する。このよ
うに繰り返して演算を行うことで、徐々に正確な対応付
けが得られるようになり、推定誤差の少ないアフィン変
換係数が求まってゆく。
【0055】図12は繰り返し処理によって特徴点の対
応付けが変化する過程を説明する図である。図におい
て、23は参照画像8を入力画像9上に重畳したときの
参照画像8から抽出した特徴点を示している。このよう
に上記演算を繰り返すことで、図12中の左図から右図
に示すように補正後の特徴点23の位置座標値が入力画
像9上の正しい位置(フィールドを特定する位置)へ移
動する。
【0056】上記繰り返し処理は、前回の繰り返し処理
で求めたアフィン変換係数値と現段階で求めたアフィン
変換係数値との差が閾値より小さくなった場合、つま
り、アフィン変換係数値の推定誤差が閾値以下になる
と、アフィン変換係数の推定が終了したと判定し、繰り
返し処理を終える(ステップST4)。以上が位置補正
部3による位置補正処理である。なお、上記閾値はユー
ザが文字を認識すべき帳票の種類などを考慮して適宜設
定できるようにしてもよい。
【0057】位置補正部3による位置補正処理が終了す
ると、フィールド抽出部4は位置補正部3で得られたア
フィン変換係数を用いて入力画像9上にあるフィールド
の位置を求める。具体的には、帳票フォーマットメモリ
7に格納されている参照画像8上のフィールドの位置
(例えば、フィールドを囲う矩形の角の位置座標値)を
読み込む。次に、読み込んだフィールドを囲う矩形の角
の位置座標値を式(4)のX0,Y0に代入し、補正し
た位置座標値X1,Y1を求める。この処理を上記矩形
の四隅の位置座標値に対して行い、補正した位置座標値
を有する4点を線で結んだ矩形を入力画像9から抽出
し、これをフィールド(文字認識の対象とする領域)と
する(フィールド抽出ステップ)。
【0058】図13はフィールド抽出の結果を説明する
図である。図において、8は参照画像、24aは予め参
照画像8上で指定したフィールド、9は入力画像、24
bは入力画像9から抽出したフィールドである。上述の
処理を施すことで、例えば図13に示すように参照画像
8上でフィールド24aが指定されている場合、フィー
ルド24aの位置座標値が補正されて入力画像9からフ
ィールド24bが抽出される。
【0059】上記のようにしてフィールド24bが抽出
されると、文字認識部5はフィールド24b内に記入さ
れた文字を認識して外部に出力する(文字認識ステッ
プ)。これにより、入力された帳票上に対する文字の読
み取り処理を終了する。
【0060】以上のように、この実施の形態1によれ
ば、読み取った帳票の画像からフィールドを特定する特
徴点を抽出し、帳票の画像のうち、文字を記入した帳票
の画像である入力画像9と、入力画像9と同一の帳票の
画像であって文字を記入していない参照画像8とから抽
出した各特徴点を対応付けて、参照画像8に対する入力
画像9の位置関係を補正し、この位置関係の補正の結果
に基づいて、入力画像9上のフィールド24bを抽出
し、このフィールド24bに対して文字認識を行うの
で、入力した帳票などに十字点が存在しなくてもフィー
ルドを抽出することができることにより、文字認識処理
を意識せずに作成された既存の帳票(対応付けに適当な
十字点を持たない帳票)に対しても正しくフィールドを
抽出することが可能となる。
【0061】また、この実施の形態1によれば、任意の
文字、図形、記号若しくはこれらの組み合わせに係るフ
ィルタと所定の整合性を示す入力画像9及び参照画像8
上の部位、及び/若しくは、入力画像9及び参照画像8
上の罫線の端点及び交点を特徴点として抽出するので、
対応付けに適当な十字点や特徴点として抽出できる図形
や記号がない帳票に対しても、適当なフィルタを用意す
ることで正しくフィールドを抽出することができる。
【0062】さらに、この実施の形態1によれば、罫線
の端点の位置、交点を構成する各罫線がなす形状、及び
/若しくは、特徴点を抽出するのに使用したフィルタを
特定する情報を特徴点の種類として規定するので、上記
段落0061と同様の効果を奏する。
【0063】さらに、この実施の形態1によれば、入力
画像9と参照画像8とから抽出した各特徴点から対応確
率を算出し、この対応確率を基にして入力画像9と参照
画像8とから抽出した各特徴点の対応付けを行い、この
対応付けの結果から参照画像8に対する入力画像9の位
置関係を補正するためのアフィン変換係数を推定し、こ
のアフィン変換係数を基にして、参照画像8から抽出し
た特徴点の位置座標値を補正するので、参照画像8に対
して入力画像9の位置ずれが生じている場合でも、参照
画像8の特徴点に対応する特徴点を正確に入力画像9か
ら抽出することができる。
【0064】さらに、この実施の形態1によれば、特徴
点の位置座標値及び種類を基にして対応確率を算出する
ので、上記段落0063と同様の効果を奏する。
【0065】さらに、この実施の形態1によれば、参照
画像8と入力画像9とから抽出した各特徴点とを対応付
ける際、対応確率が所定値より小さい対応付け、及び/
若しくは、入力画像9から抽出した一個の特徴点が参照
画像8から抽出した複数個の特徴点と対応付く場合、こ
の対応付け結果を除外するので、読み取るべき帳票がか
すれた状態で入力されていたり、機械的な振動や電気的
なノイズが重畳したり、読み取り時における位置ずれ、
特徴点と誤認されるように記入された文字等の影響によ
り、誤って対応付けられた結果が除外され、参照画像8
の特徴点に対応する特徴点を正確に入力画像9から抽出
することができる。
【0066】さらに、この実施の形態1によれば、アフ
ィン変換係数値の推定誤差が所定値以下になるまで、補
正した参照画像8から抽出した特徴点の位置座標値を用
いて、対応確率を算出し、この対応確率を基にして、対
応付け、アフィン係数推定、及び特徴点の座標値補正を
繰り返すので、文字を認識すべき帳票上に膨大な数の十
字点(特徴点)が存在して、参照画像8と入力画像9と
から抽出した各特徴点の対応付けを誤った場合でも、繰
り返し演算により徐々にアフィン変換係数の推定精度を
高めることができ、正しくフィールドを抽出することが
できる。
【0067】実施の形態2.上記実施の形態1では、入
力された帳票画像上の文字を認識する処理について説明
したが、この実施の形態2はユーザが帳票フォーマット
を作成することができるようにし、この際、抽出された
特徴点が所望のものでなかった場合はユーザが除去でき
るようにしたものである。
【0068】図14はこの発明の実施の形態2による文
字認識装置を示す構成図、図15は帳票フォーマットの
作成を説明する図である。図において、22はフィール
ド24を特定する特徴点、24はフィールド指定部25
によって抽出されたフィールド、25はユーザが参照画
像9上で指定したフィールドを抽出するフィールド指定
部(フィールド指定手段)、26は特徴点21のうちユ
ーザが不要と判断した特徴点22を除去する特徴選択部
(特徴点選択手段)、27は特徴選択部26によってユ
ーザが不要と判断して特徴点を除去すべき領域である。
なお、図1と同一構成要素には同一符号を付して重複す
る説明を省略する。
【0069】次に動作について説明する。先ず、上記実
施の形態1と同様にして、画像入力部1が未記入の帳票
を読み取り参照画像8を作成する。参照画像8が作成さ
れると特徴抽出部2は上記実施の形態1と同様にして参
照画像8から特徴点22を抽出する。
【0070】次に、フィールド指定部25は参照画像8
と特徴点抽出部2で参照画像8から抽出した特徴点22
とを重ねてユーザに表示し、参照画像8上で文字認識の
対象とするフィールドの位置をユーザに指定させる(フ
ィールド指定ステップ)。具体的には、ユーザがマウス
操作で参照画像8上に矩形を描かせ、この矩形で囲まれ
た領域をフィールドの位置とする。これにより、例えば
図15に示すような住所と氏名を読み取るフィールド2
4を作成する。
【0071】次に、特徴点選択部26は参照画像8と特
徴点抽出部2で参照画像8から抽出した特徴点22とを
重ねてユーザに表示し、必要な特徴点を選択(不必要な
特徴点を除去)させる(特徴点選択ステップ)。例え
ば、図15において参照画像8から抽出された多くの特
徴点22の中で、切手を貼り付ける領域内で検出された
特徴点は、実際に入力画像9を処理する際に特徴点が検
出されないことが考えられる。そこで、特徴選択部26
は、切手を貼り付ける領域のような特徴点を除去すべき
領域27からユーザがマウス等で選択して不必要な特徴
点を除去する。なお、ユーザが誤って選択すべき特徴点
を除去してしまった場合は、該特徴点を適宜復元できる
ようにしてもよい。
【0072】最後に、フィールド指定部25でユーザが
指定したフィールド24と、特徴選択部26で除去され
ずに残った特徴点22の情報を有する参照画像8を、帳
票フォーマットとして帳票フォーマットメモリ7に保存
する。
【0073】以上のように、この実施の形態2によれ
ば、参照画像8から抽出した特徴点22と参照画像8と
を重ねてユーザに表示し、ユーザが参照画像8上で指定
した領域をフィールド24として抽出し、特徴点22の
うちユーザが不要と判断した特徴点22を除去して、ユ
ーザが指定したフィールド24、及び/若しくは、ユー
ザが除去しなかった特徴点22の情報を有する参照画像
8である帳票フォーマットを作成するので、対応付けを
誤る要因となる余計な特徴点を排除した帳票フォーマッ
トを作成することができる。その結果、特徴点の対応付
け誤りが減少して正確なフィールド抽出が可能となる。
【0074】実施の形態3.上記実施の形態2では、文
字未記入画像から帳票フォーマットを作成する処理を述
べたが、この実施の形態3は文字未記入画像から新たな
特徴点フィルタを作成することができるものである。
【0075】図16はこの発明の実施の形態3による文
字認識装置を示す構成図、図17はフィルタ生成部の動
作を説明する図である。図において、28はユーザが指
定した参照画像8上の領域内の画像から、特徴点の抽出
に使用するフィルタを作成するフィルタ生成部(特徴点
フィルタ生成手段)、29は新たなフィルタに用いる画
像を有する領域、30は生成したフィルタである。な
お、図1と同一構成要素には同一符号を付して重複する
説明を省略する。
【0076】次に動作について説明する。先ず、画像入
力部1による参照画像8の作成、特徴点抽出部2による
参照画像8からの特徴点の抽出動作は上記実施の形態1
と同様であるので重複する説明を省略する。
【0077】フィルタ生成部28は、特徴抽出部2が検
出した特徴点の数が所定値以下であった場合、ユーザに
警告を発生して新たなフィルタの生成を促す。このフィ
ルタ生成部28によるフィルタの生成は、参照画像8を
ユーザに表示し、フィルタとして使用したい形状をユー
ザに指定させる。ユーザがマウスなどでフィルタとして
使用したい形状を囲む矩形を指定すると、矩形内の画像
を調べて黒画素が値+1、白画素が値−1を有するフィ
ルタを生成する(特徴点フィルタ生成ステップ)。例え
ば、図17に示すように参照画像8上にある記号◆を囲
む領域を、新たなフィルタに用いる画像を有する領域2
9として指定すると、記号◆の形状を抽出するためのフ
ィルタ30が作成される。このフィルタ30において黒
い矩形は値+1、白い矩形は値−1を有する画素を示
す。
【0078】最後に、フィルタ生成部28で作成した新
たなフィルタ30のデータをフィルタ情報メモリ6に格
納する。以上の処理により作成した新たなフィルタ30
は特徴点抽出部2が適宜読み出して使用することができ
る。
【0079】以上のように、この実施の形態3によれ
ば、ユーザが指定した参照画像8上の領域内の画像か
ら、特徴点の抽出に使用するフィルタを作成することが
できるので、特徴点が全く抽出されない帳票において、
その帳票に含まれる図形からフィルタを作成して特徴点
の抽出が可能となり、フィールドの抽出を行うことがで
きる。
【0080】また、特徴点を抽出するのに適当な図形や
記号がない帳票に対しても、文字の記載があればこれを
用いて新たなフィルタを作成することで、文字認識処理
を全く意識していない帳票に対してもフィールドの抽出
を行うことができる。
【0081】さらに、この実施の形態3によれば、参照
画像8から抽出した特徴点22の数が所定値以下となる
と、ユーザに対して警告を行うので、文字認識すべき帳
票における特徴点の状態を容易に知ることができ、上記
帳票に対する柔軟なフィールドの抽出を行うことができ
る。
【0082】なお、上記実施の形態3を上記実施の形態
2の構成に適用してもよく、これにより、上記実施の形
態2及び3における効果を得ることができる。
【0083】
【発明の効果】以上のように、この発明によれば、帳票
の画像から文字認識の対象とする領域を特定する特徴点
を抽出し、文字を記入した帳票の画像である文字記入画
像と、この文字記入画像と同一の帳票の画像であって文
字を記入していない文字未記入画像とから抽出した各特
徴点を対応付けて、文字未記入画像に対する文字記入画
像の位置関係を補正し、位置関係の補正の結果に基づい
て、文字記入画像上の文字認識の対象とする領域を抽出
し、この文字認識の対象とする領域内の画像に対して文
字認識処理を行うので、入力した帳票などに十字点が存
在しなくても文字認識の対象とする領域を抽出すること
ができることから、文字認識処理を意識せずに作成され
た既存の帳票(対応付けに適当な十字点を持たない帳
票)に対しても正しく文字認識の対象とする領域を抽出
することができる効果がある。
【0084】この発明によれば、任意の文字、図形、記
号若しくはこれらの組み合わせに係る特徴点フィルタを
備え、この特徴点フィルタと所定の整合性を示す文字記
入画像及び文字未記入画像上の部位、及び/若しくは、
文字記入画像及び文字未記入画像上の罫線の端点及び交
点を特徴点として抽出するので、対応付けに適当な十字
点や特徴点として抽出できる図形や記号がない帳票に対
しても、適当な特徴点フィルタを用意することで正しく
文字認識の対象とする領域を抽出することができる効果
がある。
【0085】この発明によれば、罫線の端点の位置、交
点を構成する各罫線がなす形状、及び/若しくは、特徴
点を抽出するのに使用した特徴点フィルタを特定する情
報を、特徴点の種類として規定するので、上記段落00
84と同様の効果を奏する。
【0086】この発明によれば、文字記入画像と文字未
記入画像とから抽出した各特徴点から対応確率を算出
し、この対応確率を基にして文字記入画像と文字未記入
画像とから抽出した各特徴点の対応付けを行い、対応付
けた結果から文字未記入画像に対する文字記入画像の位
置関係を補正するためのアフィン変換係数を推定し、こ
のアフィン変換係数を基にして文字未記入画像から抽出
した特徴点の位置座標値を補正するので、文字未記入画
像に対して文字記入画像の位置ずれが生じている場合で
も、文字未記入画像の特徴点に対応する特徴点を正確に
文字記入画像から抽出することができる効果がある。
【0087】この発明によれば、特徴点の位置座標値及
び種類を基にして対応確率を算出するので、上記段落0
086と同様の効果を奏する。
【0088】この発明によれば、アフィン変換係数値の
推定誤差が所定値以下になるまで、補正した特徴点の位
置座標値を用いて対応確率を算出し、この対応確率を基
にして対応付け処理、アフィン係数推定処理、及び座標
値更新処理を繰り返すので、入力すべき帳票上に膨大な
数の十字点(特徴点)が存在して、文字未記入画像と文
字記入画像とから抽出した各特徴点の対応付けを誤った
場合でも、繰り返し演算により徐々にアフィン変換係数
の推定精度を高めることができ、正しく文字認識の対象
とする領域を抽出することができる効果がある。
【0089】この発明によれば、文字未記入画像から抽
出した特徴点と文字未記入画像とを重ねてユーザに表示
し、ユーザが文字未記入画像上で指定した領域を文字認
識の対象とする領域として抽出するフィールド指定や、
特徴点のうちユーザが不要と判断した特徴点を除去する
特徴点選択を行い、ユーザが指定した文字認識の対象と
する領域、及び/若しくは、ユーザが除去しなかった特
徴点を有する文字未記入画像である帳票フォーマットを
作成するので、対応付けを誤る要因となる余計な特徴点
を排除した帳票フォーマットを作成することができる。
その結果、特徴点の対応付け誤りが減少して、正確な文
字認識の対象とする領域の抽出を行うことができる効果
がある。
【0090】この発明によれば、文字未記入画像と文字
記入画像とから抽出した各特徴点を対応付ける際、対応
確率が所定の値より小さい対応付け、及び/若しくは、
文字記入画像から抽出した一個の特徴点が文字未記入画
像から抽出した複数個の特徴点と対応付く場合、この対
応付け結果を除外するので、読み取るべき帳票がかすれ
た状態で入力されていたり、機械的な振動や電気的なノ
イズが重畳したり、読み取り時における位置ずれ、特徴
点と誤認されるように記入された文字等の影響により、
誤って対応付けられた結果が除外され、文字未記入画像
の特徴点に対応する特徴点を正確に文字記入画像から抽
出することができる効果がある。
【0091】この発明によれば、ユーザが指定した文字
未記入画像上の領域内の画像から、特徴抽出手段で使用
する特徴点フィルタを作成するので、特徴点が全く抽出
されない帳票において、その帳票に含まれる任意の文
字、図形、記号若しくはこれらの組み合わせから特徴点
フィルタを作成して特徴点の抽出が可能となり、文字認
識の対象とする領域の抽出を行うことができる効果があ
る。
【0092】また、特徴点を抽出するのに適当な図形や
記号がない帳票に対しても、文字の記載があればこれを
用いて新たな特徴点フィルタを作成することで、文字認
識処理を全く意識していない帳票に対しても文字認識の
対象とする領域の抽出を行うことができる効果がある。
【0093】この発明によれば、文字未記入画像から抽
出した特徴点の数が所定の値以下となると、ユーザに対
して警告を行うので、文字認識すべき帳票における特徴
点の状態を容易に知ることができ、上記帳票に対して柔
軟に文字認識の対象とする領域の抽出を行うことができ
る効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による文字認識装置
を示す構成図である。
【図2】 実施の形態1による文字認識装置に使用する
参照画像を示す図である。
【図3】 実施の形態1による文字認識装置に使用する
入力画像を示す図である。
【図4】 図3における部分領域の拡大図である。
【図5】 フィルタによる特徴点の抽出を説明する図で
ある。
【図6】 特徴点を抽出した入力画像を示す図である。
【図7】 入力画像から抽出した特徴点の情報を示す図
である。
【図8】 帳票フォーマットを示す図である。
【図9】 図8の帳票フォーマットにおける特徴点の情
報を示す図である。
【図10】 位置補正処理を示すフロー図である。
【図11】 特徴点の対応付け誤りを説明する図であ
る。
【図12】 繰り返し処理によって特徴点の対応付けが
変化する過程を説明する図である。
【図13】 フィールド抽出の結果を説明する図であ
る。
【図14】 この発明の実施の形態2による文字認識装
置を示す構成図である。
【図15】 帳票フォーマットの作成を説明する図であ
る。
【図16】 この発明の実施の形態3による文字認識装
置を示す構成図である。
【図17】 フィルタ生成部の動作を説明する図であ
る。
【図18】 特開平10−91783号公報に開示され
た従来の文字認識装置の構成を示すブロック図である。
【図19】 十字点の対応付けを説明する図である。
【符号の説明】
1 画像入力部(画像入力手段)、2 特徴点抽出部
(特徴点抽出手段)、3位置補正部(位置補正手段)、
4 フィールド抽出部(フィールド抽出手段)、5 文
字認識部(文字認識手段)、6 フィルタ情報メモリ、
7 帳票フォーマットメモリ、8 参照画像(文字未記
入画像)、9 入力画像(文字記入画像)、10,11
部分領域、12 横ラスタ、13 縦ラスタ、14
重なり部分、15 イメージ画像、16〜19 フィル
タ(特徴点フィルタ)、20 イメージ、21,21
a,21b,21c,22,23 特徴点、24,24
a,24b フィールド、25 フィールド指定部(フ
ィールド指定手段)、26特徴選択部(特徴点選択手
段)、27 特徴点を除去すべき領域、28 フィルタ
生成部(特徴点フィルタ生成手段)、29 新たなフィ
ルタに用いる画像を有する領域、30 フィルタ。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06K 9/32 G06F 15/70 365 Fターム(参考) 5B029 AA01 BB02 CC26 CC27 EE04 EE06 5B057 AA11 CD02 CD03 CE09 DA07 DA08 DB05 DC05 5L096 BA17 EA14 EA35 FA10 FA12 FA69 FA76 GA55 9A001 HH22

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 帳票の画像を読み取る画像入力手段と、 この画像入力手段が読み取った上記帳票の画像から文字
    認識の対象とする領域を特定する特徴点を抽出する特徴
    点抽出手段と、 上記画像入力手段が読み取った上記帳票の画像のうち、
    文字を記入した帳票の画像である文字記入画像と、この
    文字記入画像と同一の帳票の画像であって文字を記入し
    ていない文字未記入画像とから上記特徴点抽出手段が抽
    出した各特徴点を対応付けて、上記文字未記入画像に対
    する上記文字記入画像の位置関係を補正する位置補正手
    段と、 この位置補正手段による位置関係の補正の結果に基づい
    て、上記文字記入画像上の上記文字認識の対象とする領
    域を抽出するフィールド抽出手段と、 このフィールド抽出手段が抽出した上記文字認識の対象
    とする領域内の画像に対して文字認識処理を行う文字認
    識手段とを備えた文字認識装置。
  2. 【請求項2】 特徴点抽出手段は、任意の文字、図形、
    記号若しくはこれらの組み合わせに係る特徴点フィルタ
    を備え、この特徴点フィルタと所定の整合性を示す文字
    記入画像及び文字未記入画像上の部位、及び/若しく
    は、上記文字記入画像及び上記文字未記入画像上の罫線
    の端点及び交点を特徴点として抽出することを特徴とす
    る請求項1記載の文字認識装置。
  3. 【請求項3】 特徴点抽出手段は、罫線の端点の位置、
    交点を構成する各罫線がなす形状、及び/若しくは、特
    徴点を抽出するのに使用した特徴点フィルタを特定する
    情報を、上記特徴点の種類として規定することを特徴と
    する請求項1又は請求項2記載の文字認識装置。
  4. 【請求項4】 位置補正手段は、文字記入画像と文字未
    記入画像とから抽出した各特徴点から対応確率を算出
    し、この対応確率を基にして、上記文字記入画像と上記
    文字未記入画像とから抽出した上記各特徴点の対応付け
    を行い、この対応付けの結果から上記文字未記入画像に
    対する上記文字記入画像の位置関係を補正するためのア
    フィン変換係数を推定し、このアフィン変換係数を基に
    して上記文字未記入画像から抽出した特徴点の位置座標
    値を補正することを特徴とする請求項1から請求項3の
    うちのいずれか1項記載の文字認識装置。
  5. 【請求項5】 位置補正手段は、特徴点の位置座標値及
    び種類を基にして対応確率を算出することを特徴とする
    請求項4記載の文字認識装置。
  6. 【請求項6】 位置補正手段は、アフィン変換係数値の
    推定誤差が所定値以下になるまで、補正した文字未記入
    画像から抽出した特徴点の位置座標値を用いて、対応確
    率算出手段が対応確率を算出し、この対応確率を基にし
    て、対応付け、アフィン係数推定、及び特徴点の座標値
    補正を繰り返すことを特徴とする請求項4又は請求項5
    記載の文字認識装置。
  7. 【請求項7】 文字未記入画像から抽出した特徴点と文
    字未記入画像とを重ねて表示し、ユーザが上記文字未記
    入画像上で指定した領域を文字認識の対象とする領域と
    して抽出するフィールド指定手段と、上記特徴点のうち
    ユーザが不要と判断した特徴点を除去する特徴点選択手
    段とを備え、 上記フィールド指定手段が抽出した上記文字認識の対象
    とする領域、及び/若しくは、特徴点選択手段が除去し
    なかった特徴点を有する文字未記入画像である帳票フォ
    ーマットを作成することを特徴とする請求項1から請求
    項6のうちのいずれか1項記載の文字認識装置。
  8. 【請求項8】 位置補正手段は、文字未記入画像と文字
    記入画像とから抽出した各特徴点を対応付ける際、対応
    確率が所定値より小さい対応付け、及び/若しくは、上
    記文字記入画像から抽出した一個の特徴点が上記文字未
    記入画像から抽出した複数個の特徴点と対応付く場合、
    この対応付け結果を除外することを特徴とする請求項1
    から請求項7のうちのいずれか1項記載の文字認識装
    置。
  9. 【請求項9】 ユーザが指定した文字未記入画像上の領
    域内の画像から、特徴抽出手段が使用する特徴点フィル
    タを作成する特徴点フィルタ生成手段を備えたことを特
    徴とする請求項1から請求項8のうちのいずれか1項記
    載の文字認識装置。
  10. 【請求項10】 特徴点フィルタ生成手段は、特徴点抽
    出手段が文字未記入画像から抽出した特徴点の数が所定
    値以下となると、ユーザに対して警告を行うことを特徴
    とする請求項1から請求項9のうちのいずれか1項記載
    の文字認識装置。
  11. 【請求項11】 帳票の画像を読み取る画像入力ステッ
    プと、 この画像入力ステップで読み取った上記帳票の画像から
    文字認識の対象とする領域を特定する特徴点を抽出する
    特徴点抽出ステップと、 上記画像入力ステップにて読み取った上記帳票の画像の
    うち、文字を記入した帳票の画像である文字記入画像か
    ら抽出した特徴点と、上記文字記入画像と同一の帳票の
    画像であって文字を記入していない文字未記入画像から
    予め抽出しておいた特徴点とを対応付けて、上記文字未
    記入画像に対する上記文字記入画像の位置関係を補正す
    る位置補正ステップと、 この位置補正ステップにおける位置関係の補正の結果に
    基づいて、上記文字記入画像上の文字認識の対象とする
    領域を抽出するフィールド抽出ステップと、 このフィールド抽出ステップが抽出した文字認識の対象
    とする領域内の画像に対して文字認識処理を行う文字認
    識ステップとを備えた文字認識方法。
  12. 【請求項12】 特徴点抽出ステップにて、任意の文
    字、図形、記号若しくはこれらの組み合わせに係る特徴
    点フィルタと所定の整合性を示す文字記入画像及び文字
    未記入画像上の部位、及び/若しくは、上記文字記入画
    像及び上記文字未記入画像上の罫線の端点及び交点を特
    徴点として抽出することを特徴とする請求項11記載の
    文字認識方法。
  13. 【請求項13】 特徴点抽出ステップにて、罫線の端点
    の位置、交点を構成する各罫線がなす形状、及び/若し
    くは、特徴点を抽出するのに使用した特徴点フィルタを
    特定する情報を、上記特徴点の種類として規定すること
    を特徴とする請求項11又は請求項12記載の文字認識
    方法。
  14. 【請求項14】 位置補正ステップは、文字記入画像と
    文字未記入画像とから抽出した各特徴点から対応確率を
    算出する対応確率算出ステップと、上記対応確率を基に
    して、上記文字記入画像と上記文字未記入画像とから抽
    出した上記各特徴点の対応付けを行う対応付けステップ
    と、この対応付けの結果から上記文字未記入画像に対す
    る上記文字記入画像の位置関係を補正するためのアフィ
    ン変換係数を推定するアフィン係数推定ステップと、こ
    のアフィン係数推定ステップで推定したアフィン変換係
    数を基にして、上記文字未記入画像から抽出した上記特
    徴点の位置座標値を補正する座標値更新ステップとから
    なることを特徴とする請求項11から請求項13のうち
    のいずれか1項記載の文字認識方法。
  15. 【請求項15】 対応確率算出ステップにて特徴点の位
    置座標値及び種類を基にして対応確率を算出することを
    特徴とする請求項14記載の文字認識方法。
  16. 【請求項16】 位置補正ステップは、アフィン変換係
    数値の推定誤差が所定値以下になるまで、座標値更新ス
    テップにて補正した文字未記入画像から抽出した特徴点
    の位置座標値を用いて、対応確率算出ステップからの処
    理を繰り返すことを特徴とする請求項14又は請求項1
    5記載の文字認識方法。
  17. 【請求項17】 文字未記入画像から抽出した特徴点と
    文字未記入画像とを重ねて表示し、ユーザが上記文字未
    記入画像上で指定した領域を文字認識の対象とする領域
    として抽出するフィールド指定ステップと、上記特徴点
    のうちユーザが不要と判断した特徴点を除去する特徴点
    選択ステップとを備え、 上記フィールド指定ステップにてユーザが指定した上記
    文字認識の対象とする領域、及び/若しくは、上記特徴
    点選択ステップにてユーザが除去しなかった特徴点を有
    する文字未記入画像である帳票フォーマットを作成する
    ことを特徴とする請求項11から請求項16のうちのい
    ずれか1項記載の文字認識方法。
  18. 【請求項18】 位置補正ステップは、対応付けステッ
    プにて文字未記入画像と文字記入画像とから抽出した各
    特徴点とを対応付ける際、対応確率が所定値より小さい
    対応付け、及び/若しくは、上記文字記入画像から抽出
    した一個の特徴点が上記文字未記入画像から抽出した複
    数個の特徴点と対応付く場合、この対応付け結果を除外
    することを特徴とする請求項11から請求項17のうち
    のいずれか1項記載の文字認識方法。
  19. 【請求項19】 ユーザが指定した文字未記入画像上の
    領域内の画像から、特徴点抽出ステップにて使用する特
    徴点フィルタを作成する特徴点フィルタ生成ステップを
    備えたことを特徴とする請求項11から請求項18のう
    ちのいずれか1項記載の文字認識方法。
  20. 【請求項20】 特徴点フィルタ生成ステップにて、特
    徴点抽出ステップで文字未記入画像から抽出した特徴点
    の数が所定値以下となると、ユーザに対して警告を行う
    ことを特徴とする請求項11から請求項19のうちのい
    ずれか1項記載の文字認識方法。
JP2000035779A 2000-02-14 2000-02-14 文字認識装置及び文字認識方法 Pending JP2001229341A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000035779A JP2001229341A (ja) 2000-02-14 2000-02-14 文字認識装置及び文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000035779A JP2001229341A (ja) 2000-02-14 2000-02-14 文字認識装置及び文字認識方法

Publications (1)

Publication Number Publication Date
JP2001229341A true JP2001229341A (ja) 2001-08-24

Family

ID=18559932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000035779A Pending JP2001229341A (ja) 2000-02-14 2000-02-14 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JP2001229341A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007010807A (ja) * 2005-06-28 2007-01-18 Fuji Xerox Co Ltd 情報処理システム、情報処理装置、情報処理方法及びコンピュータ・プログラム
JP2007164770A (ja) * 2005-11-17 2007-06-28 Ricoh Co Ltd 入力支援スキャンソリューションシステム
JP2007265389A (ja) * 2006-03-03 2007-10-11 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
JP2009053080A (ja) * 2007-08-28 2009-03-12 Mitsubishi Precision Co Ltd 3次元位置情報復元装置およびその方法
US8390862B2 (en) 2005-11-17 2013-03-05 Ricoh Company, Ltd. Scan solution system
JP2013150270A (ja) * 2012-01-23 2013-08-01 Ricoh Co Ltd 画像処理装置、プログラム及び画像処理方法
JP2014119908A (ja) * 2012-12-14 2014-06-30 Fuji Xerox Co Ltd 文字認識データ処理装置、文字認識データ処理システム及びプログラム
JP2015169978A (ja) * 2014-03-05 2015-09-28 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2020181290A (ja) * 2019-04-24 2020-11-05 株式会社日立製作所 物品認識システムおよび物品認識方法
JP2020190816A (ja) * 2019-05-20 2020-11-26 京都電子計算株式会社 文字読取装置及び文字読取装置用プログラム
EP3786844A4 (en) * 2018-07-06 2021-05-05 Rakuten, Inc. IMAGE PROCESSING SYSTEM, IMAGE PROCESSING METHOD AND PROGRAM
US11430241B2 (en) 2018-01-30 2022-08-30 Mitsubishi Electric Corporation Entry field extraction device and computer readable medium
US11881043B2 (en) 2018-07-06 2024-01-23 Rakuten Group, Inc. Image processing system, image processing method, and program

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007010807A (ja) * 2005-06-28 2007-01-18 Fuji Xerox Co Ltd 情報処理システム、情報処理装置、情報処理方法及びコンピュータ・プログラム
JP4729999B2 (ja) * 2005-06-28 2011-07-20 富士ゼロックス株式会社 情報処理システム、情報処理装置、情報処理方法及びコンピュータ・プログラム
JP2007164770A (ja) * 2005-11-17 2007-06-28 Ricoh Co Ltd 入力支援スキャンソリューションシステム
US8390862B2 (en) 2005-11-17 2013-03-05 Ricoh Company, Ltd. Scan solution system
JP2007265389A (ja) * 2006-03-03 2007-10-11 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
JP2009053080A (ja) * 2007-08-28 2009-03-12 Mitsubishi Precision Co Ltd 3次元位置情報復元装置およびその方法
JP2013150270A (ja) * 2012-01-23 2013-08-01 Ricoh Co Ltd 画像処理装置、プログラム及び画像処理方法
JP2014119908A (ja) * 2012-12-14 2014-06-30 Fuji Xerox Co Ltd 文字認識データ処理装置、文字認識データ処理システム及びプログラム
JP2015169978A (ja) * 2014-03-05 2015-09-28 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US9626738B2 (en) 2014-03-05 2017-04-18 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and storage medium
US11430241B2 (en) 2018-01-30 2022-08-30 Mitsubishi Electric Corporation Entry field extraction device and computer readable medium
EP3786844A4 (en) * 2018-07-06 2021-05-05 Rakuten, Inc. IMAGE PROCESSING SYSTEM, IMAGE PROCESSING METHOD AND PROGRAM
US11881043B2 (en) 2018-07-06 2024-01-23 Rakuten Group, Inc. Image processing system, image processing method, and program
JP2020181290A (ja) * 2019-04-24 2020-11-05 株式会社日立製作所 物品認識システムおよび物品認識方法
JP7186128B2 (ja) 2019-04-24 2022-12-08 株式会社日立製作所 物品認識システムおよび物品認識方法
JP2020190816A (ja) * 2019-05-20 2020-11-26 京都電子計算株式会社 文字読取装置及び文字読取装置用プログラム
JP7209161B2 (ja) 2019-05-20 2023-01-20 京都電子計算株式会社 文字読取装置及び文字読取装置用プログラム

Similar Documents

Publication Publication Date Title
JP2001229341A (ja) 文字認識装置及び文字認識方法
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
JP7197971B2 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
US9020214B2 (en) Striped pattern image examination support device, striped pattern image examination support method and program
JP6000992B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
JP2017151916A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2002203207A (ja) 文字認識方法,プログラム及び記録媒体
EP1921582B1 (en) Image processing apparatus, image registering method, program causing computer to execute image registering method, and recording medium on which a program is recorded
JP2000067164A (ja) パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
JP3600380B2 (ja) 画像処理方法及びファクス文字認識装置
CN111079749A (zh) 一种带姿态校正的端到端商品价签文字识别方法和系统
JP2006227824A (ja) 図面認識方法および装置
JP2016009395A (ja) 文書ファイル生成装置及び文書ファイル生成方法
JP7356063B2 (ja) 身長推定方法、身長推定装置及びプログラム
CN113537216A (zh) 一种点阵字体文本行倾斜校正方法及装置
JP3348224B2 (ja) 表枠線の交点補正装置および表認識装置および光学文字読取装置
JP2003296726A (ja) 図面変換方法、図面変換装置、図面変換プログラム及び記録媒体
JP3625245B2 (ja) 画像処理方法及び画像処理装置
WO2023017723A1 (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
JP5146199B2 (ja) 差分抽出装置及び差分抽出プログラム
JP2009193145A (ja) 手書きデータ生成装置、方法およびプログラム
JPH11232382A (ja) 罫線抽出方法及び罫線除去方法
US20240265720A1 (en) Work assistance system and work assistance method
CN113449764A (zh) 信息处理装置、信息处理方法和计算机可读介质
JP2005173940A (ja) 画像処理方法、画像処理装置、及びコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071114

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071114

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080410

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080507