JP4094359B2 - 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム - Google Patents

画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム Download PDF

Info

Publication number
JP4094359B2
JP4094359B2 JP2002196319A JP2002196319A JP4094359B2 JP 4094359 B2 JP4094359 B2 JP 4094359B2 JP 2002196319 A JP2002196319 A JP 2002196319A JP 2002196319 A JP2002196319 A JP 2002196319A JP 4094359 B2 JP4094359 B2 JP 4094359B2
Authority
JP
Japan
Prior art keywords
correction formula
image data
evaluation value
pattern
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002196319A
Other languages
English (en)
Other versions
JP2004038678A (ja
Inventor
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002196319A priority Critical patent/JP4094359B2/ja
Publication of JP2004038678A publication Critical patent/JP2004038678A/ja
Application granted granted Critical
Publication of JP4094359B2 publication Critical patent/JP4094359B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、入力された画像を文字認識する認識システム等に利用され、特に、定型帳票における画像間の位置合わせを行うための画像処理を行う画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラムに関する。
【0002】
【従来の技術】
定型帳票処理において、2枚以上の同種の画像の位置合わせを行う必要を生じることがある。例えば、定まったフォーマットの帳票(定型帳票)に記入された文字を画像化してから切出し、文字認識処理を行う場合においては、文字画像の切出し処理に先立って、基準として予め用意された画像(参照画像)と位置合わせする必要がある。
【0003】
このような画像の位置合わせに関するものとしては、特開平7−192087号公報に開示された技術のように、非読み取り領域の文字データを用いる方法がある。この方法は、帳票ごとに任意に印刷されている記入用ガイド等の非読み取り領域枠の位置を予めメモリに格納しておく。次に、処理しようとする帳票画像を入力し、この入力画像においても同様に非読み取り領域枠を抽出して、その相対位置の変動から入力画像における読み取り対象領域を求めるものである。
【0004】
また、特開平10−208040号公報に開示された技術は、帳票画像上にある文字等のパターンを用いて位置合わせを行うものである。この方法は、まず、基準となる帳票画像(参照画像)から文字等のパターンを予め抽出しておく。次に、処理対象帳票画像を入力し、入力された画像から文字等のパターンを抽出する。これら2枚の画像から別々に抽出されたパターン同士を比較し、形状が似ているもの同士を選び出す。そして、これらパターンの位置関係から、処理対象画像と参照画像との位置合わせのための補正式を算出する。認識対象領域の、処理対象画像上での位置を知りたい場合には、この補正式を参照画像上における認識対象領域の座標値に適用すればよく、位置が正確にわかることで文字の切出しが正確に行えることになる。
【0005】
【発明が解決しようとする課題】
しかしながら、特開平7−192087号公報の技術では、上記非読み取り領域枠が印刷されていない帳票に対して位置合わせを行うことはできないという問題があった。
【0006】
また、特開平10−208040号公報の技術では、文字等のパターン同士の同一/非同一を正しく判定することが必要となる。したがって、仮に、異なる文字同士を「対応する」と誤って認識した場合には、この誤った情報に基づいて補正式を求めることになり、補正式の推定精度が大幅に低下する。
【0007】
このまま処理を行えば、文字が記入されていない部分の文字認識を行うことになり、認識結果が無意味なものとなる。文字の同一判定は実質的には文字認識を行っているのと同じである。現在、精度100%の文字認識装置が存在しない以上、同一判定の誤りによって補正式も誤りが生じることになる。処理を精度良く行うためには、文字の同一判定だけに頼らない別の精度向上のための手段の提供が必要である。
【0008】
この発明は、上述した従来技術による問題点を解消するため、位置合わせのために用いる補正式を評価することにより、この補正式を用いた際の信頼性を定量的に得て、位置合わせの信頼性を向上できる画像処理装置、画像処理方法、及びプログラムを提供することを目的とする。
【0009】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、本発明は、処理対象の画像データと参照画像データとの位置合わせを行う画像処理装置において、同一か否かを判断するための基準値を用いて、前記画像データと前記参照画像データとから形状が同一のパターンを夫々抽出する同一パターン抽出手段と、抽出された前記パターンの位置情報に基づき前記画像データと前記参照画像データとの位置合わせのための補正式を算出する補正式算出手段と、を備え、算出された前記補正式の係数値に基づく該補正式の評価値を取得し、取得された前記評価値が所定の閾値より大きい場合、該評価値が取得された補正式を用いて位置合わせを行い、取得された前記評価値が該閾値より小さい場合、前記基準値とは異なる基準値を用いて形状が同一のパターンを取得し直し、取得された該パターンの位置情報に基づき算出された補正式を用いて位置合わせを行うことを特徴とする。
【0070】
【発明の実施の形態】
以下に添付図面を参照して、この発明に係る画像処理装置、画像処理方法及びその方法をコンピュータに実行させるプログラムの好適な実施の形態を詳細に説明する。この発明の画像処理装置が実行する画像処理内容としては、定型帳票の文字認識を行う構成を主に説明する。
【0071】
(実施の形態1)
図1は、この発明の画像処理装置の実施の形態1に係る構成を示すブロック図である。パターン抽出手段101は、処理対象画像格納手段102に格納された文字等の処理対象画像(画像データ)と、参照画像格納手段103に予め格納されている文字等の参照画像(画像データ)から文字等のパターンを抽出する。同一パターン抽出手段104は、これら処理対象画像と参照画像のそれぞれから抽出されたパターンのうちで、同一であるものの組を抽出する。補正式算出手段105は、位置合わせのための補正式を算出する。評価値算出手段106は、補正式算出手段105で得られた補正式から評価値を求める。文字切出手段107は、認識対象文字の位置を推定する。文字認識手段108は、認識対象文字の位置を推定後に文字認識処理を行う。
【0072】
図2は、実施の形態1における画像処理の処理手順を示すフローチャートである。まず、パターン抽出手段101は、処理対象画像と参照画像から文字等のパターンを抽出する(ステップS201)。パターン抽出法としては、二値画像であれば黒連結成分の抽出を行えばよい。次に同一パターン抽出手段104で各画像から抽出されたパターンのうちで、同一であるものの組を抽出する(ステップS202)。同一かどうかの判断基準はさまざま考えられるが、例えば2つのパターンを重ね合わせ、白黒が一致する画素数を、しない画素数で割ったものがある一定の閾値T以上であれば同一とする方法等が考えられる。
【0073】
次に補正式算出手段105で位置合わせのための補正式を算出する(ステップS203)。ここでは補正式にアフィン変換を用いるものとする。すなわち参照画像上の座標値を(x,y)、処理対象画像上の対応する座標値を(X,Y)とおいたとき、図3に示す式(1)となるような係数a〜fを求める。係数は以下のように求める。
【0074】
先に求めた同一パターンがn組見つかったとする。
i番目のパターンの重心の座標値を
(xi,yi) (参照画像上のパターンの座標値)
(Xi,Yi) (対応する処理対象画像上のパターンの座標値)
とおく。
【0075】
(1)式に(xi,yi)を代入し、この計算式で得られた(X,Y)と(Xi,Yi)のずれの二乗和が最小になるよう、a〜fを決定する。すなわち、図4の式(2)に示すようにa〜fを求めればよい。
【0076】
次に、評価値算出手段106で評価値を求める(ステップS204)。評価値はいろいろなものが考えられる。例えば、パターンの組数が多く見つかれば、得られた補正式は信頼度が高いとみなせるので、高い評価値を与えることができる。
【0077】
また、補正式の係数から評価値を求めることもできる。例えば、b+cの値は0から離れるほど補正式を施したあとの画像のゆがみが大きいので評価値としては低くなる。
【0078】
また、e2 +f2 は、ずれを表すが、この値が大きすぎる場合も不自然であるので評価値は低いものを設定できる。補正式算出手段105で得られた補正式は、文字切出手段107へ出力される(ステップS206)。文字切出手段107では認識対象文字の位置を推定するのに使える。すなわち、参照画像上の文字の記入枠の位置の座標値を持っておけば、これに補正式で表現される補正を施して、処理対象画像における記入枠の位置を推定できる。位置がわかればこの領域から文字を切り出す(記入された部分の画像を特定する)ことができ、文字認識手段108で文字認識処理を行うことができる(ステップS207)。
【0079】
また、評価値を補正式とともに出力(ステップS205)すれば、出力された側は、評価値が低い(補正式の妥当性が低い)場合には、別の処理を行うことも可能となる。例えば、評価値が低い場合には警告を発して、きちんと切り出されているか目視で判断を加えるようユーザーに促すことができる。そうでないときは自動で認識させることで、帳票認識する際の信頼性と利便性のバランスをより高いレベルでとることができる。
【0080】
(実施の形態2)
図5は、この発明の画像処理装置の実施の形態2に係る構成を示すブロック図である。実施の形態2において実施の形態1と同一の構成部には同一の番号を附してある。
【0081】
補正式算出手段A(501A)は、同一パターン抽出手段104で同一であるものの組を用いて補正式を算出する。補正式算出手段B(501B)は、補正式算出手段A(501A)とは異なる方式を持ち補正式を算出する。評価値吟味手段502は、評価値算出手段106で求めた評価値を吟味し、評価値が低い場合には条件再設定手段503により条件を再設定し補正式算出手段B(501B)で再度補正式を算出させる。
【0082】
図6は、実施の形態2における画像処理の処理手順を示すフローチャートである。図示の処理で実施の形態1と同様の処理内容は説明を省略している。同一パターン抽出手段104で同一であるものの組を抽出した後(ステップS202)、補正式算出手段A(501A)で補正式を算出する(ステップS203)。この処理は、実施の形態1の補正式算出手段105と同じものである。
【0083】
次に評価値算出手段106で、実施の形態1と同様に評価値を求める(ステップS204)。次に評価値吟味手段502で求めた評価値を吟味する(ステップS605)。ここで、評価値が低く信頼できない(ステップS605:No)、すなわち補正式の妥当性が低いと判断した場合には、補正式算出手段A(501A)とは異なる方式を持つ補正式算出手段B(501B)で再度補正式を算出する(ステップS606)。
【0084】
補正式算出手段A(501A)では、アフィン変換の係数を求めている。アフィン変換では位置ずれ、伸縮、回転の計算が同時に可能である。ただ、同一パターンの組の抽出で誤りが多い場合には、極端な伸縮、回転が係数に現れる場合がある。そこで、補正式算出手段B(501B)では、位置ずれの補正のみを行うことが考えられる。
【0085】
上記式(1)の代わりに図7に示す式(3)を用いて同様に計算する。他にも、回転と位置ずれ、伸縮と位置ずれ、回転のみ、伸縮のみ等の計算が考えられる。例えば、回転と位置ずれの場合は上記式(1)の代わりに、図8に示す式(4)を用い、伸縮と位置ずれの場合には図9に示す式(5)を用いればよい。
【0086】
さらに、補正式の求め方は同一であっても、同一パターンを見つける際の基準を変更して(ステップS607)、同一パターンが1回目より多めに(あるいは少なめに)見つかるようにして、再び同一パターンを求めなおして(ステップS608)、補正式を再算出する(ステップS609)。
【0087】
これは、基準がゆるすぎて同一パターンが誤って多く見つかったり、あるいは基準が厳しすぎてパターンが少なすぎ、誤差が大きくなった場合に有効である。この実施の形態2では、同一とみなす基準として2つのパターンを重ね合わせ、白黒の一致する画素数を用い、ある閾値T以上一致すれば同一とみなしている。この、閾値Tを大きく、あるいは小さくすることで基準が変更できる。
【0088】
さらに、閾値の変更にとどまらず、異なる判定基準を用いてもよい。例えば、パターンのエッジ数、サイズ等を用いる方法が考えられる。いずれにしても、評価値吟味を行って妥当性が低いと判断された場合には、再び補正式の算出を行う。そして、再び得られた補正式を吟味し、もっとも妥当性が高い補正式を出力する(ステップS610)。
【0089】
そして、ステップS605にて評価値が高い場合(ステップS605:Yes)、及びステップS610の処理後に文字を切出し(ステップS206)、文字認識する(ステップS207)。
【0090】
このように、実施の形態2では、評価値が低い場合にのみ再度補正式の計算をすることで、処理時間の増加を抑えつつ、より信頼性の高い補正式が得られ、文字認識の精度も向上が期待できるようになる。
【0091】
(実施の形態3)
図10は、この発明の画像処理装置の実施の形態3に係る構成を示すブロック図である。この実施の形態3では、同一パターン抽出手段104による同一パターンの抽出後、補正式算出手段A(501A)及び補正式算出手段B(501B)によりそれぞれ補正式を計算し、最適補正式選択手段1001で最適な補正式を選択する構成である。
【0092】
図11は、実施の形態3における画像処理の処理手順を示すフローチャートである。図示の処理で実施の形態1と同様の処理内容は説明を省略している。同一パターンを抽出した後(ステップS202)、補正式算出手段A(501A),補正式算出手段B(501B)を用いて補正式を複数の方法で計算する(ステップS203,S1104)。複数の補正式算出方法の例は、実施の形態2と同様である。
【0093】
次に、各々の手法で求めた補正式のそれぞれに対して、評価値算出手段106で評価値を求める(ステップS204)。そして得られた評価値を最適補正式選択手段1001で吟味し、最良補正式を選択し(ステップS1106)、文字を切出し(ステップS206)、文字認識する(ステップS207)。
【0094】
以上説明した実施の形態3では、補正式をはじめから複数の手法で算出することにより、処理時間は実施の形態2に比べ増加するものの、補正式の信頼度をさらに向上させることができる。
【0095】
(実施の形態4)
図12は、上述した各実施の形態1〜3の構成をソフトウェアプログラムの実行によって実現する場合のハードウェア構成を示すブロック図である。画像処理装置は、CPU1201,メモリ1202,ハードディスク1203,入力装置1204,CD−ROMドライブ1205,ディスプレイ1206等からなる汎用のコンピュータ処理装置を用いることができる。CD−ROM等の記録媒体1207には、上記各実施形態の画像処理機能や処理手順を実現させるためのプログラムが記録されている。
【0096】
また、処理対象の原稿画像(画像データ)は、例えばハードディスク1203等に格納されている。CPU1201は、記録媒体1207から上記した処理機能、手順を実現するプログラムを読み出し実行し、行抽出の結果をディスプレイ1206や図示しないプリンタ等の出力装置等に出力する。
【0097】
そして、上記各実施形態で説明した画像処理のプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
【0098】
【発明の効果】
以上説明したように、本発明によれば、補正式の評価値に応じて位置合わせを行う際に用いる補正式の算出に必要なパターンを取得し直すため、処理対象の画像データと参照画像データとの位置合わせに対する信頼性を向上させることができる。
【図面の簡単な説明】
【図1】この発明の画像処理装置の実施の形態1に係る構成を示すブロック図である。
【図2】実施の形態1における画像処理の処理手順を示すフローチャートである。
【図3】実施の形態1で用いる補正式を説明するための図である。
【図4】実施の形態1で用いる補正式を説明するための図である。
【図5】この発明の画像処理装置の実施の形態2に係る構成を示すブロック図である。
【図6】実施の形態2における画像処理の処理手順を示すフローチャートである。
【図7】実施の形態2で用いる補正式を説明するための図である。
【図8】実施の形態2で用いる補正式を説明するための図である。
【図9】実施の形態2で用いる補正式を説明するための図である。
【図10】この発明の画像処理装置の実施の形態3に係る構成を示すブロック図である。
【図11】実施の形態3における画像処理の処理手順を示すフローチャートである。
【図12】実施の形態1〜3の構成をソフトウェアプログラムの実行によって実現する場合のハードウェア構成を示すブロック図である。
【符号の説明】
101 パターン抽出手段
102 処理対象画像格納手段
103 参照画像格納手段
104 同一パターン抽出手段
105 補正式算出手段
106 評価値算出手段
107 文字切出手段
108 文字認識手段
501A 補正式算出手段A
501B 補正式算出手段B
502 評価値吟味手段
503 条件再設定手段
1001 最適補正式選択手段
1201 CPU
1202 メモリ
1203 ハードディスク
1204 入力装置
1205 CD−ROMドライブ
1206 ディスプレイ
1207 記録媒体

Claims (3)

  1. 処理対象の画像データと参照画像データとの位置合わせを行う画像処理装置において、
    同一か否かを判断するための基準値を用いて、前記画像データと前記参照画像データとから形状が同一のパターンを夫々抽出する同一パターン抽出手段と、
    抽出された前記パターンの位置情報に基づき前記画像データと前記参照画像データとの位置合わせのための補正式を算出する補正式算出手段と、
    を備え、
    算出された前記補正式の係数値に基づく該補正式の評価値を取得し、
    取得された前記評価値が所定の閾値より大きい場合、該評価値が取得された補正式を用いて位置合わせを行い、
    取得された前記評価値が該閾値より小さい場合、前記基準値とは異なる基準値を用いて形状が同一のパターンを取得し直し、取得された該パターンの位置情報に基づき算出された補正式を用いて位置合わせを行うことを特徴とする画像処理装置。
  2. 処理対象の画像データと参照画像データとの位置合わせを行う画像処理方法において、
    同一か否かを判断するための基準値を用いて、前記画像データと前記参照画像データとから形状が同一のパターンを夫々抽出手段により抽出する同一パターン抽出工程と、
    抽出された前記パターンの位置情報に基づき前記画像データと前記参照画像データとの位置合わせのための補正式を算出手段により算出する補正式算出工程と、
    を含み、
    算出された前記補正式の係数値に基づく該補正式の評価値を取得手段により取得し、
    取得された前記評価値が所定の閾値より大きい場合、該評価値が取得された補正式を用いて位置合わせ手段により位置合わせを行い、
    取得された前記評価値が該閾値より小さい場合、前記基準値とは異なる基準値を用いて形状が同一のパターンを前記取得手段により取得し直し、取得された該パターンの位置情報に基づき算出された補正式を用いて位置合わせ手段により位置合わせを行うことを特徴とする画像処理方法。
  3. 請求項2に記載の方法をコンピュータに実行させるためのプログラム。
JP2002196319A 2002-07-04 2002-07-04 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム Expired - Fee Related JP4094359B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002196319A JP4094359B2 (ja) 2002-07-04 2002-07-04 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002196319A JP4094359B2 (ja) 2002-07-04 2002-07-04 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム

Publications (2)

Publication Number Publication Date
JP2004038678A JP2004038678A (ja) 2004-02-05
JP4094359B2 true JP4094359B2 (ja) 2008-06-04

Family

ID=31704448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002196319A Expired - Fee Related JP4094359B2 (ja) 2002-07-04 2002-07-04 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム

Country Status (1)

Country Link
JP (1) JP4094359B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636741B (zh) * 2015-02-06 2018-04-13 百度在线网络技术(北京)有限公司 公式识别方法和装置

Also Published As

Publication number Publication date
JP2004038678A (ja) 2004-02-05

Similar Documents

Publication Publication Date Title
KR101365789B1 (ko) 얼굴 특징점 위치 보정 장치, 얼굴 특징점 위치 보정 방법, 및 얼굴 특징점 위치 보정 프로그램을 기록한 컴퓨터 판독가능 기록 매체
US8019143B2 (en) Image processing apparatus and computer program product
CN105009170A (zh) 物体识别设备、方法和存储介质
US20050201607A1 (en) Method and system for processing an image
KR101066323B1 (ko) 생체 정보 판독 장치 및 생체 정보 판독 방법
JP5600723B2 (ja) 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム
JP2761467B2 (ja) 画像切り出し装置及び文字認識装置
JP5501925B2 (ja) 物体認識装置及びプログラム
JP4708740B2 (ja) 画像処理装置及び画像処理方法
JP4094359B2 (ja) 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム
JPH1125215A (ja) 帳票種識別方法、装置および記録媒体
JP4116179B2 (ja) 画像処理方法、画像処理装置および記録媒体
CN110033466B (zh) 一种基于多灰度级的冠脉拉直图像分割边界确定方法
JP4910635B2 (ja) 画像処理装置及び画像処理プログラム
JP4257264B2 (ja) パターン照合装置、画像品質検証方法及び画像品質検証プログラム
JP4070486B2 (ja) 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP4141754B2 (ja) 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4108910B2 (ja) 画像処理装置、画像処理方法および記録媒体
JP2007102422A (ja) パターン照合装置
JP3625245B2 (ja) 画像処理方法及び画像処理装置
JPH10340348A (ja) 画像位置合わせ方法、ファックス文字認識方法および記録媒体
JP6323009B2 (ja) 画像処理装置及び画像処理プログラム
US11551446B2 (en) Video detection device, and video detection method
JP6074198B2 (ja) 画像処理装置及び画像処理方法
JP3932201B2 (ja) 帳票種識別装置および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080305

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120314

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140314

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees