JP3756309B2 - 文字認識装置 - Google Patents
文字認識装置 Download PDFInfo
- Publication number
- JP3756309B2 JP3756309B2 JP02876198A JP2876198A JP3756309B2 JP 3756309 B2 JP3756309 B2 JP 3756309B2 JP 02876198 A JP02876198 A JP 02876198A JP 2876198 A JP2876198 A JP 2876198A JP 3756309 B2 JP3756309 B2 JP 3756309B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- information
- reference image
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
本発明は、帳票類に予め印刷された定型情報(罫線、枠線やプレ印刷文字など)を含む記入領域の画像を参照画像として記憶し、認識対象となる帳票類の記入領域の入力画像を参照画像と対比して該記入領域に記入された記入文字を認識する文字認識装置に関し、特に、解析的な形(パラメータ)で表現できない多種多様な定型情報が、非ドロップアウトカラーで印刷され、画像入力系の機差、帳票搬送時の変動、帳票上の定型情報に印刷ズレが生じた場合でも、処理に要するメモリを少なく、処理時間を低減しつつ、入力画像から正確に定型情報の除去を行い、高い精度の文字認識を行う文字認識装置に関する。
【0002】
【従来の技術】
従来、罫線、枠線又はプレ印刷文字などの非ドロップアウトカラーで予め印刷された定型情報を含む帳票上に記入された文字を読み取る技術が知られている。
【0003】
例えば、特開平9−34995号公報には、黒ランレングス情報に基づき、定型情報の構造を解析し、抽出された定型情報を入力画像から消去した後、残りの画像を用いて文字切り出し及び文字認識を行うよう構成した画像処理装置が開示されている。
【0004】
ところが、かかる従来技術は、解析的な形(パラメータ)で表現できる定型情報を取り扱う場合には有効であるが、パラメータで表現できない定型情報を取り扱う場合には適用が難しい。
【0005】
このため、パラメータで表現できない定型情報を取り扱う場合には、定型情報を参照画像としてあらかじめ準備しておき、入力画像から参照画像を減算することになる。
【0006】
例えば、特開昭58−207184号公報には、定型情報を参照画像として登録保存しておき、その参照画像を入力画像から減算し、残りの画像で文字切り出し及び文字認識を行うよう構成した記録情報認識装置が開示されている。
【0007】
【発明が解決しようとする課題】
しかしながら、この従来技術を用いて例えば定型情報を含む帳票上の文字を読み取る場合には、精密な位置合わせ(照合)を行わないので、定型情報の残骸が生じたり、定型情報に近接した記入文字が非接触にも関わらず消去され、結果的に認識精度が低下するという問題が生ずる。
【0008】
その理由は、伸縮及び傾斜等の画像入力系の機差や、搬送速度のバラツキによる画像の伸縮や回転等の帳票搬送時の変動や、枠線の伸縮、枠線とプレ印刷文字がともに平行移動する変動、枠線とプレ印刷文字の相対位置関係の変動などの帳票上の定型情報の印刷ズレが生じるからである。
【0009】
このため、定型情報を有する参照画像と入力画像とを位置合わせ(照合)する際に、図形相互の回転角と平行移動量を得る一般化ハフ(Hough)変換を用いて、回転角及び平行移動量に限定し、その変動を吸収して位置合わせを行う技術が知られている。
【0010】
しかし、かかる技術を用いるためには、ハフ空間を形成するための膨大なメモリが必要になるという問題が生じる。
【0011】
例えば、平行移動の分解能が1画素、回転角の分解能が1度である場合において、256画素×256画素からなる画像の照合を行う際には、パラメータ空間用に数十メガバイトのメモリ容量が必要となる。
【0012】
また、この一般化ハフ変換では、参照画像と入力画像の各エッジ点間の全ての組み合わせから回転量及び平行移動量を求めるため、エッジ数が増加すれば増加する程処理時間が累増するという問題もある。
【0013】
そこで、本発明では、上記問題点を解決し、解析的な形(パラメータ)で表現できない多種多様な定型情報が、非ドロップアウトカラーで印刷され、画像入力系の機差、帳票搬送時の変動、帳票上の定型情報に印刷ズレが生じた場合でも、処理に要するメモリを少なく、処理時間を低減しつつ、入力画像から正確に定型情報の除去を行い、高い精度の文字認識を行う文字認識装置を提供することを目的とする。また、定型情報が文字で構成され、その文字と記入文字が接触、重畳した場合であっても、定型情報と記入文字との接触箇所を正確に抽出し、接触、重畳による欠損部分を修復することで、文字認識の精度を高める文字認識装置を提供することを目的とする。
【0014】
【課題を解決するための手段】
上記目的を達成するため、第1の発明は、帳票類に予め印刷された定型情報を含む記入領域の画像を参照画像として記憶し、認識対象となる帳票類の記入領域の入力画像を前記参照画像と対比して該記入領域に記入された記入文字を認識する文字認識装置において、画像入力系の光学系設定情報を記憶する記憶手段と、前記記憶手段に記憶した光学系設定情報と帳票の傾き角度に基づいて、入力画像と参照画像とのずれを補正すべく前記参照画像を回転、伸縮又は傾斜する第1の変形手段と、前記第1の変形手段により変形された前記変形画像と前記入力画像との平行移動ずれを補正する平行移動量を算出して、前記変形画像を該算出した平行移動量に基づき平行移動して補正参照画像に変形する第2の変形手段と、前記入力画像から前記補正参照画像の画素情報を除いた差分画像を生成し、前記記入文字と定型情報との接触による欠落を補完して該記入文字を修復する修復手段と、前記修復手段が修復した差分画像から各記入文字を切り出して認識する認識手段とを具備し、前記第2の変形手段は、前記変形画像を2値化処理した2値画像から、連結した黒画素を包含する矩形領域であるブロックを抽出するブロック抽出手段と、前記ブロック抽出手段が抽出したブロックのうち、所定のしきい値よりも小さいブロックをそのまま単位領域とし、該所定のしきい値以上の大きさを有するブロックを所定数のブロックに分割して単位領域とする単位領域抽出手段と、前記単位領域抽出手段が抽出した単位領域ごとに入力画像の対応部分との前記平行移動量を算定し、算定した平行移動量に基づいて前記単位領域をそれぞれ平行移動する平行移動手段とを具備することを特徴とする。
【0015】
また、第2の発明は、第1の発明において、本発明では、前記単位領域抽出手段は、前記ブロック抽出手段が抽出したブロックのうち、所定のしきい値以上の大きさを有するブロックを分割して単位領域とする際、分割された領域が重複するようにブロックを組み合わせて単位領域とすることを特徴とする。
【0016】
また、第3の発明は、第1の発明において、前記修復手段は、前記入力画像を形成する画素のうち、前記記入文字と定型情報とが交差又は重複する画素に接触属性を付与し、該接触属性を有する複数の画素列が互いに所定の位置関係にある場合に、画素列相互間に所在する画素を黒画素にして有効属性を付与することを特徴とする。
【0019】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。なお、本実施の形態では、文字認識装置に入力される帳票種類は、該装置の操作者が予め指定することとする。
【0020】
まず最初に、本実施の形態で用いる帳票及び認識対象領域の一例について説明する。
【0021】
図2は、本実施の形態で用いる帳票及び認識対象領域の一例を示す図である。
【0022】
同図に示すように、この帳票30は、○○○○○○株式会社が使用する帳票であり、払込通知票31及び収入金額領収書控32を切り取り線で結合したものである。
【0023】
ここで、この帳票30の払込通知票31には、請求金額欄31a及び支払期限欄31b等があるため、文字認識装置は、これらの欄に記入された記入文字を認識する必要がある。
【0024】
ここで、請求金額欄31aの枠線は矩形であるため、解析的な形(パラメータ)で表現できる定型情報となるが、支払期限欄31bは、矩形の四角を丸くしているため、解析的な形(パラメータ)で表現しずらい定型情報となる。
【0025】
このため、以下では、この支払期限欄31bに記入される文字を認識する場合に焦点を当てて説明することとする。
【0026】
図1は、本実施の形態で用いる文字認識装置の構成を示す機能ブロック図である。
【0027】
同図に示すように、この文字認識装置は、多値画像入力部11と、帳票位置検出部12と、書式情報記憶部13と、画像切出部14と、参照画像記憶部15と、機差情報記憶部16と、参照画像補正部17と、照合部18と、減算処理部19と、接触有無判定部20と、文字切出部21と、欠損補正処理部22と、文字認識部23と、辞書格納部24と、後処理部25とからなる。
【0028】
多値画像入力部11は、帳票を光学的に読み取って該帳票に対応する多値画像を取得するイメージスキャナ等の入力装置であり、帳票位置検出部12は、多値画像入力部11が取得した入力画像に含まれる帳票の4頂点の座標を検出する処理部である。
【0029】
書式情報記憶部13は、認識対象領域の位置及び大きさ並びに文字種などの帳票の書式に係わるパラメータを記憶する記憶部であり、画像切出部14は、書式情報記憶部13に記憶された書式情報に基づいて、入力画像から認識対象領域を切り出す処理部である。
【0030】
参照画像記憶部15は、認識対象領域に対応する参照画像を記憶する記憶部であり、機差情報記憶部16は、CCDの取付角度θccd や像倍率α等の光学的設定情報を記憶する記憶部である。
【0031】
参照画像補正部17は、機差情報記憶部16が記憶する機差情報と、帳票位置検出部12が検出した帳票の傾き角度θdoc とを用いて、参照画像記憶部15に記憶した参照画像の画像変換を行う処理部である。
【0032】
照合部18は、入力画像と参照画像を照合して、入力画像中での定型情報の平行移動量を算出する処理部であり、減算処理部19は、入力画像から参照画像を減算して、記入文字のみからなる差分画像を作成する処理部である。
【0033】
接触有無判定部20は、減算処理後の差分画像について、記入文字と参照画像の接触判定及び接触している位置の抽出を行う処理部である。
【0034】
文字切出部21は、書式情報記憶部13に記憶した書式情報に基づいて差分画像から輪郭抽出を行い、連結した黒画素を包含する矩形ブロックを抽出する処理部であり、欠損補正処理部22は、文字切出部21が切り出した矩形ブロックに含まれる記入文字の欠損を補完する補正を行う処理部である。
【0035】
文字認識部23は、書式情報記憶部13に記憶した書式情報及び辞書格納部24に記憶した文字認識辞書を用いて文字切出部21が切り出した矩形ブロックに含まれる文字の認識を行う処理部であり、後処理部25は、認識結果を整理して出力する処理部である。
【0036】
なお、多値画像入力部11と、帳票位置検出部12と、書式情報記憶部13と、画像切出部14と、参照画像記憶部15と、機差情報記憶部16と、参照画像補正部17と、照合部18とで請求項1の補正手段を構成し、減算処理部19と、接触有無判定部20と、文字切出部21と、欠損補正処理部22とで請求項1の修復手段を構成し、文字認識部23と、辞書格納部24とで請求項1の認識手段を構成している。
【0037】
次に、上記構成を有する文字認識装置の処理内容及び動作について処理手順に沿って具体的に説明する。
【0038】
まず、文字認識処理に先だって、書式情報記憶部13、参照画像記憶部15及び機差情報記憶部16に、帳票に関する書式、認識対象領域に対応する参照画像及び機差情報を格納するとともに、辞書格納部24に文字認識辞書を格納する。
【0039】
なお、本実施の形態では、説明の便宜上、これら情報の格納は操作者による設定操作によって、帳票の文字認識を実際にさせる前に、予め行なっておく。
【0040】
そして、かかる準備が完了したならば、多値画像入力部が、ローラー又はベルト等の搬送手段によって搬送された帳票等の原稿を読み取り、図示しない多値画像メモリへ一旦格納する。
【0041】
次に、帳票位置検出部12が、図3(a)に示すように、多値画像メモリに記憶された入力画像の4辺(上下左右辺)から各軸に垂直な方向に画素値を走査し、同図(b)に示すように、
E(i)=f(i+2)+f(i+1)−f(i-1)−f(i-2)
の計算式にしたがって、注目画素の近傍での濃度値Eがしきい値以上となる座標値列を算出する。
【0042】
そして、この上下左右辺ごとに算出した画素値列から帳票の上下左右端の4本の回帰直線を算出するとともに、かかる回帰直線の傾きから帳票の傾き角度θdoc を算定し、これらの回帰直線の交点から帳票の4頂点の座標を得る。
【0043】
なお、この帳票位置検出部12は、算定した帳票の傾き角度θdoc を参照画像の補正部17へ出力するとともに、帳票の傾き角度θdoc 及び帳票の4頂点の座標を画像切出部14へ出力する。
【0044】
次に、参照画像記憶部15及び機差情報記憶部16から、認識対象領域に対応する参照画像及び機差情報をそれぞれ読み出し、参照画像補正部17に対して出力する。ここで、CCDの取付角度θccd が正常でない場合には、画像入力時に画像に傾斜が生じ、像倍率が1.0でない場合には、画像入力時に画像に伸縮が生じることになるが、これらは予め基準帳票を用いて情報を収集し、機差情報記憶部16に記憶してある。
【0045】
そして、参照画像補正部17では、光学系設定情報(CCD取付角度θccd 、像倍率α)及び帳票位置検出部12が算定した帳票の傾き角度θdoc に基づいて、図4(a)に示す変換式により画像変換を行う。ただし、補正前の画像をf(Xin,Yin)とし、補正後の画像をg(Xout,Yout)とすることとする。
【0046】
例えば、図4(b)に示す参照画像が参照画像記憶部15に記憶されている場合には、かかる画像変換の結果により、図4(c)に示すように参照画像が変換されることになる。
【0047】
このようにして、照合部18及び減算処理部19で問題となる変形(回転、伸縮、傾斜、平行移動)のうち、回転、伸縮及び傾斜に関する変形が参照画像補正部17で吸収されることになる。なお、作成された参照画像は、照合部18に出力される。
【0048】
次に、画像切出部14は、指定された帳票種類及び認識対象領域に対応する書式情報(認識対象領域の位置と大きさ、文字種などのパラメータ)を書式情報記憶部13から読み出し、帳票位置検出部12で検出した帳票の傾き角度θdoc 及び帳票の4頂点の座標に基づいて入力画像から認識対象領域を切り出し、これを2値化処理して、図示しない認識対象領域メモリに格納する。
【0049】
なお、かかる2値化処理では、文字部や定型情報部を黒画素に変換し、背景部分を白画素へ変換する。この際、黒画素の属性を「有効」、白画素の属性を「無効」として記憶しておく。
【0050】
次に、照合部18は、図5に示す手順で、入力画像中での定型情報の平行移動量を算出する。
【0051】
図5に示すように、この照合部18は、まず最初に入力画像の輪郭点の座標及びその方向性(以下「輪郭点情報」と言う。)と、参照画像の輪郭点情報とをそれぞれ抽出する(ステップ401及び402)。例えば、参照画像補正部17から受け取った参照画像が図6(a)に示すものである場合には、その輪郭点情報は図6(b)のようになる。
【0052】
その後、参照画像から抽出した輪郭点情報から2値画像上の連結した黒画素を包含する矩形(以下「ブロック」と言う。)を抽出する(ステップ403)。なお、参照画像の輪郭点情報が図6(b)に示すものである場合には、図6(c)に示すように7個のブロックが抽出される。
【0053】
次に、かかるブロックのうち、ブロックの大きさが所定のしきい値以下のブロックをそれぞれ単位領域として抽出する(ステップ404)。例えば、図6(c)に示すブロックのうち、ブロック1〜ブロック6までの6個のブロックが単位領域として抽出される。
【0054】
また、図6(c)に示すブロック7のように、ブロックの大きさが所定のしきい値以上の場合には、ブロック7自体を単位領域とみなすのではなく、このブロック7を領域分割して各領域を単位領域とみなす。
【0055】
具体的には、図7(a)に示すように、垂直軸および水平軸方向の輪郭点の周辺分布を作成し、その周辺分布の度数がN等分される座標を算出し、同図(b)に示すように、N×Nの領域に分割する。そして、分割された領域が重複するように4個の分割領域を用いて1個の単位領域を構成し、同図(c)に示すように(N−1)×(N−1)個の単位領域を抽出する。なお、ここではN=4の場合を示している。
【0056】
このようにして、単位領域の作成が終了したならば、単位領域番号を示す変数iをインクリメントしつつ、参照画像の各単位領域ごとに入力画像中での定型情報の平行移動量を算出する(ステップ405〜407)。
【0057】
例えば、図6(a)に示す参照画像が存在する場合には、同図(c)に示すブロック1〜6と、図7(c)に示す9個のブロックの合計15個の単位領域について入力画像中での平行移動量を算出することになる。
【0058】
具体的には、第i番目の単位領域をセットし(ステップ405)、参照画像の輪郭点の方向成分と一致する入力画像上の輪郭点を、水平、垂直方向ともに(−δ)画素から(+δ)画素の範囲を探索し、一致する位置に対応する2次元(2δ+1)×(2δ+1)のマップ上の座標へ加点する(ステップ406)。そして、全ての輪郭点についての処理が終了した時点で、マップ上で最高得点となる位置を算出し、平行移動量を得る(ステップ407)。ただし、ここでは、平行移動量の範囲を水平、垂直方向共に(−δ)画素から(+δ)画素に制限することとする。
【0059】
このように、参照画像をブロック化し、その大きさに従って単位領域を決定し、個々のブロックでの平行移動量を抽出することにより、印刷ズレを吸収することが可能になる。
【0060】
例えば、定型情報の枠線部と文字部で印刷ズレ量が異なる場合や定型情報の枠線部のみが伸縮している場合などでも高精度な位置合わせが可能になる。
【0061】
また、この照合部18では、参照画像補正部17において回転、伸縮、傾斜の変動を吸収した後に入力画像と参照画像の照合を行うこととしているので、平行移動量を算出する構成が可能になり、照合に必要なメモリサイズを抑制でき、処理時間も低減できる。
【0062】
次に、減算処理部19は、入力画像から参照画像を減算することにより、記入文字のみで構成された差分画像を作成する。ここでは、照合部18が抽出した単位領域ごとの平行移動量に従って補正された参照画像を、単位領域ごとに入力画像から減算する。なお、照合は輪郭点情報を用いて行なうが、減算は元の画像から画素を取り除くことにより行なう。
【0063】
ただし、入力画像の画素属性が「有効」の画素については、その位置に対応する参照画像上の画素属性が「有効」である場合には、入力画像の画素属性を「仮接触境界」へ変更し、入力画像の画素属性が「無効」の画素については、画素属性を変更しない。単なる画像間の減算を行うと、罫線に接触する文字の欠落を招くからである。
【0064】
具体的には、図8(a)に示す入力画像と同図(b)に示す参照画像とが得られた場合には、入力画像から参照画像を減算した差分画像は、同図(c)に示すように、「有効」「仮接触境界」「無効」の3種の属性を持つ画素から形成される。
【0065】
次に、接触有無判定部20は、減算処理部19が作成した差分画像を用いて記入文字と定型情報の接触の有無を調べる。
【0066】
例えば、入力画像及び参照画像の一部が図9(a)及び(b)に示すような画素構成となっている場合には、同図(c)に示す差分画像が得られることになるため、この接触有無判定部20では、画素属性が「仮接触境界」である画素に注目し、該注目画素の4近傍に「有効」属性の画素が存在する場合には、注目画素の属性を「接触境界」へ変更し、注目画素の4近傍に「有効」属性の画素が存在しない場合には、該注目画素の属性を「無効」へと変更する。
【0067】
なお、「接触境界」に属性変更された画素が無い場合には、記入文字と定型情報との「接触なし」と判定し、属性変更された画素がある場合には、「接触有り」と判定する。
【0068】
かかる接触判定処理を行うことにより、記入文字と参照画像の接触判定及び接触している位置(接触面)つまり「接触境界」の画素を容易に抽出できることになり、その結果、図8(d)及び図9(d)に示すような「有効」、「接触境界」、「無効」の3種の属性を持つ画素で形成された差分画像が得られる。
【0069】
次に、文字切出部21は、接触有無判定部20が接触判定した「接触境界」を有する差分画像から輪郭抽出を行い、抽出した差分画像の輪郭点情報を用いて、その連結情報から2値画像上の連結した黒画素を包含する矩形(ブロック)を抽出する。
【0070】
ここで、差分画像に「接触境界」の属性を有する画素が存在しない場合には、抽出結果をそのまま文字切り出し結果として文字認識部23へ転送し、「接触境界」の属性を有する画素が存在する場合には、欠損補正処理部22へ抽出結果を転送する。
【0071】
欠損補正処理部22は、「接触境界」の画素属性を有する差分画像上の接触面に対して、図10に示すように、接触面の2つの端点の近傍輪郭点の座標列から2本の回帰直線を算出し、得られた2本の直線方程式を接触面の情報として記憶する。
【0072】
そして、接触面の組合せが図11に示す5種類の欠損パターンのいずれかのパターンに該当するか否かを照らし合わせ、図12に示す計算式を用いて該組合せが接触面を形成するか否かを評価する。
【0073】
具体的には、図11に示す欠損パターン1は、文字をなす直線又は曲線の線分と罫線等の定型情報とが交差する場合に生ずる欠損を示し、欠損パターン2は、文字をなす線分が分岐する箇所で定型情報と交差する場合に生ずる欠損を示す。
【0074】
また。欠損パターン3は、文字をなす円弧状の線分が定型情報と重複する場合に生ずる欠損を示し、欠損パターン4は、文字をなす線分の端部が定型情報と重複する場合に生ずる欠損を示し、欠損パターン5は、文字をなす線分が途切れることなくその一部が定型情報と重複する場合に生ずる欠損を示す。
【0075】
そして、これらの欠損が判明した場合には、図11及び図13に点線で示すように接触面の端点同士を結合し、この結合線と2つの接触面に囲まれた内側を黒画素すなわち「有効」に変換する。
【0076】
上記処理を行うことにより、修復された文字画像が得られ、例えば図8(d)に示す差分画像は、同図(e)に示すような、定型情報の文字と記入文字が接触した部分及び定型情報の枠線と記入文字が接触した部分が修復された状態となる。
【0077】
そして、欠損補正処理部22は、かかる欠損部の修復を終了したならば、文字切出部21が修復後の差分画像から文字を切り出し、文字認識部23が1文字ごとに文字認識処理し、後処理部25が結果を整理して出力する。
【0078】
上述してきたように、本実施の形態では、解析的な形(パラメータ)で表現できない多種多様な定型情報が、非ドロップアウトカラーで印刷され、帳票の画像入力時の変動(回転、伸縮、傾斜など)や定型情報の印刷ズレ(平行移動など)が生じた場合でも、入力画像から正確に定型情報の除去を行い、記入文字のみを抽出することができるため、高い精度の文字認識が実現できる。
【0079】
また、定型情報が文字で構成され、その文字と記入文字が接触、重畳した場合でも、定型情報と記入文字との接触箇所が正確に抽出できるため、接触、重畳による欠損部分の修復も可能となり、文字認識の精度を更に向上させることができる。
【0080】
なお、本実施の形態では、解析的な形(パラメータ)で表現できない多種多様な定型情報を例に挙げて説明したが、本発明はこれに限定されるものではなく、パラメータ表現できる場合であっても画像照合によって文字認識を行う場合には、同様に適用することができる。
【0081】
また、文字認識装置に入力される帳票種類は、該装置の操作者がその都度、予め指定することとしたが、帳票種別を別途自動的に読取って判断してもよい。
【0082】
【発明の効果】
以上詳細に説明したように、第1の発明は、帳票類に予め印刷された定型情報を含む記入領域の画像を参照画像として記憶し、認識対象となる帳票類の記入領域の入力画像を前記参照画像と対比して該記入領域に記入された記入文字を認識する文字認識装置において、画像入力系の光学系設定情報を記憶する記憶手段と、前記記憶手段に記憶した光学系設定情報と帳票の傾き角度に基づいて、入力画像と参照画像とのずれを補正すべく前記参照画像を回転、伸縮又は傾斜する第1の変形手段と、前記第1の変形手段により変形された前記変形画像と前記入力画像との平行移動ずれを補正する平行移動量を算出して、前記変形画像を該算出した平行移動量に基づき平行移動して補正参照画像に変形する第2の変形手段と、前記入力画像から前記補正参照画像の画素情報をを除いた差分画像を生成し、前記記入文字と定型情報との接触による欠落を補完して該記入文字を修復する修復手段と、前記修復手段が修復した差分画像から各記入文字を切り出して認識する認識手段とを具備し、前記第2の変形手段は、前記変形画像を2値化処理した2値画像から、連結した黒画素を包含する矩形領域であるブロックを抽出するブロック抽出手段と、前記ブロック抽出手段が抽出したブロックのうち、所定のしきい値よりも小さいブロックをそのまま単位領域とし、該所定のしきい値以上の大きさを有するブロックを所定数のブロックに分割して単位領域とする単位領域抽出手段と、前記単位領域抽出手段が抽出した単位領域ごとに入力画像の対応部分との前記平行移動量を算定し、算定した平行移動量に基づいて前記単位領域をそれぞれ平行移動する平行移動手段とを具備して構成したので、下記に示す効果が得られる。
【0083】
1)解析的な形(パラメータ)で表現できない多種多様な定型情報が、非ドロップアウトカラーで印刷され、画像入力系の機差、帳票搬送時の変動、帳票上の定型情報に印刷ズレが生じた場合でも、処理に要するメモリを少なく、処理時間を低減しつつ、入力画像から正確に定型情報の除去を行い、高い精度の文字認識を行うことができる。
【0084】
2)定型情報が文字で構成され、その文字と記入文字が接触、重畳した場合であっても、定型情報と記入文字との接触箇所を正確に抽出し、接触、重畳による欠損部分を修復することで、文字認識の精度を高めることができる。
【0085】
3)画像入力系の光学系設定情報を記憶しておき、記憶した光学系設定情報と帳票の傾き角度に基づいて、参照画像を回転、伸縮又は傾斜し、その後変形された変形画像と入力画像との平行移動量を算出して、該変形画像を平行移動するよう構成したので、ハフ変換を行う場合と比べてメモリ容量を大幅に低減しつつ、文字認識を行うことができる。
【0086】
4)変形画像を2値化処理した2値画像から、連結した黒画素を包含するブロックを抽出し、抽出したブロックのうち、所定のしきい値よりも小さいブロックをそのまま単位領域とし、該所定のしきい値以上の大きさを有するブロックを所定数のブロックに分割して単位領域をさらに抽出し、この単位領域ごとに入力画像の対応部分との平行移動量を算定し、算定した平行移動量に基づいて単位領域をそれぞれ平行移動するよう構成したので、搬送速度のばらつき等によって画像の伸び縮みが生じた場合であっても対応することができる。
【0087】
また、第2の発明は、抽出したブロックのうち、所定のしきい値以上の大きさを有するブロックを分割して単位領域とする際、分割された領域が重複するようにブロックを組み合わせて単位領域とするよう構成したので、印刷文字だけでなく、罫線等の定型情報に幅広く適用することができる。
【0088】
また、第3の発明は、入力画像を形成する画素のうち、記入文字と定型情報とが交差又は重複する画素に接触属性を付与し、該接触属性を有する複数の画素列が互いに所定の位置関係にある場合に、画素列相互間に所在する画素を黒画素にして有効属性を付与するよう構成したので、記入文字が定型情報と接触(交差、重複)する場合であっても、精度良く文字認識を行うことができる。
【図面の簡単な説明】
【図1】本実施の形態で用いる文字認識装置の構成を示す機能ブロック図。
【図2】本実施の形態で用いる帳票及び認識対象領域の一例を示す図。
【図3】図1に示す帳票位置検出部の検出処理を説明するための図。
【図4】図1に示す参照画像補正部が用いる変換式等を示す図。
【図5】図1に示す照合部における定型情報の平行移動量の算出手順を示すフローチャート。
【図6】図1に示す照合部が参照画像から抽出するブロックの一例を示す図。
【図7】ブロックの大きさが所定のしきい値以上である場合の単位領域生成手順を示す図。
【図8】差分画像の欠損部を修復するまでの流れの一例を示す図。
【図9】仮接触属性及び接触属性付与の一例を示す図。
【図10】図1に示す欠損補正処理部が行う回帰直線の算出の説明に用いる図。
【図11】図1に示す欠損補正処理部が補正対象とする接触面相互の組合せパターンを示す図。
【図12】図1に示す欠損補正処理部が用いる計算式を示す図。
【図13】図1に示す欠損補正処理部による補正前後の一例を示す図。
【符号の説明】
11…多値画像入力部、 12…帳票位置検出部、
13…書式情報記憶部、 14…画像切出部、 15…参照画像記憶部、
16…機差情報記憶部、 17…参照画像補正部、 18…照合部、
19…減算処理部、 20…接触有無判定部、 21…文字切出部、
22…欠損補正処理部、 23…文字認識部、 24…辞書格納部、
25…後処理部、
30…帳票、 31…払込通知票、 31a…請求金額欄、
31b…支払期限欄、 32…収入金額領収書控
Claims (3)
- 帳票類に予め印刷された定型情報を含む記入領域の画像を参照画像として記憶し、認識対象となる帳票類の記入領域の入力画像を前記参照画像と対比して該記入領域に記入された記入文字を認識する文字認識装置において、
画像入力系の光学系設定情報を記憶する記憶手段と、
前記記憶手段に記憶した光学系設定情報と帳票の傾き角度に基づいて、入力画像と参照画像とのずれを補正すべく前記参照画像を回転、伸縮又は傾斜する第1の変形手段と、
前記第1の変形手段により変形された前記変形画像と前記入力画像との平行移動ずれを補正する平行移動量を算出して、前記変形画像を該算出した平行移動量に基づき平行移動して補正参照画像に変形する第2の変形手段と、
前記入力画像から前記補正参照画像の画素情報を除いた差分画像を生成し、前記記入文字と定型情報との接触による欠落を補完して該記入文字を修復する修復手段と、
前記修復手段が修復した差分画像から各記入文字を切り出して認識する認識手段と
を具備し、
前記第2の変形手段は、
前記変形画像を2値化処理した2値画像から、連結した黒画素を包含する矩形領域であるブロックを抽出するブロック抽出手段と、
前記ブロック抽出手段が抽出したブロックのうち、所定のしきい値よりも小さいブロックをそのまま単位領域とし、該所定のしきい値以上の大きさを有するブロックを所定数のブロックに分割して単位領域とする単位領域抽出手段と、
前記単位領域抽出手段が抽出した単位領域ごとに入力画像の対応部分との前記平行移動量を算定し、算定した平行移動量に基づいて前記単位領域をそれぞれ平行移動する平行移動手段と
を具備することを特徴とする文字認識装置。 - 前記単位領域抽出手段は、
前記ブロック抽出手段が抽出したブロックのうち、所定のしきい値以上の大きさを有するブロックを分割して単位領域とする際、分割された領域が重複するようにブロックを組み合わせて単位領域とする
ことを特徴とする請求項1記載の文字認識装置。 - 前記修復手段は、
前記入力画像を形成する画素のうち、前記記入文字と定型情報とが交差又は重複する画素に接触属性を付与し、該接触属性を有する複数の画素列が互いに所定の位置関係にある場合に、画素列相互間に所在する画素を黒画素にして有効属性を付与する
ことを特徴とする請求項1記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02876198A JP3756309B2 (ja) | 1998-02-10 | 1998-02-10 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02876198A JP3756309B2 (ja) | 1998-02-10 | 1998-02-10 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11232387A JPH11232387A (ja) | 1999-08-27 |
JP3756309B2 true JP3756309B2 (ja) | 2006-03-15 |
Family
ID=12257403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02876198A Expired - Fee Related JP3756309B2 (ja) | 1998-02-10 | 1998-02-10 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3756309B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4580520B2 (ja) * | 2000-08-28 | 2010-11-17 | 株式会社日本デジタル研究所 | 文字認識方法および文字認識装置 |
CN111325182B (zh) * | 2020-03-19 | 2023-05-30 | 四川骏逸富顿科技有限公司 | 一种基于ocr的医保报销欺诈检测方法 |
-
1998
- 1998-02-10 JP JP02876198A patent/JP3756309B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11232387A (ja) | 1999-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3580670B2 (ja) | 入力画像を基準画像に対応付ける方法、そのための装置、及びその方法を実現するプログラムを記憶した記憶媒体 | |
JPH11219407A (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
JP4395188B2 (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP3636809B2 (ja) | 画像処理方法 | |
US7969631B2 (en) | Image processing apparatus, image processing method and computer readable medium storing image processing program | |
US7079265B2 (en) | Distortion correction device for correcting imaged object to produce plane image without distortion | |
JP2000251082A (ja) | 文書画像傾き検出装置 | |
JP3756309B2 (ja) | 文字認識装置 | |
US6658166B1 (en) | Correction of distortions in form processing | |
JP3006466B2 (ja) | 文字入力装置 | |
JP3230334B2 (ja) | 画像処理装置 | |
JP4543675B2 (ja) | 文字・図形の認識方法 | |
JP3378439B2 (ja) | 帳票画像作成装置 | |
JP2003271942A (ja) | バーコード記録方法、画像補正方法および画像補正装置 | |
JP2009025992A (ja) | 2次元コード | |
JP4329226B2 (ja) | 基準マーク検出方法、基準マーク検出装置及び光学式文字読取装置 | |
JPH03232100A (ja) | ナンバープレート読み取り装置 | |
JP2824372B2 (ja) | 帳票の認識装置 | |
JP4635845B2 (ja) | Ocr装置、フォームアウト方法及びフォームアウトプログラム | |
JP2022184098A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2616967B2 (ja) | 傾き抽出装置 | |
CN117671715A (zh) | 图像信息提取方法、装置、计算机设备及存储介质 | |
JP2964594B2 (ja) | マーク検査方法 | |
JPH11250179A (ja) | 文字認識装置および文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050406 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051221 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090106 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100106 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100106 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110106 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120106 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120106 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130106 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130106 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140106 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140106 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |