JP5619111B2 - 画像判定装置およびプログラム - Google Patents

画像判定装置およびプログラム Download PDF

Info

Publication number
JP5619111B2
JP5619111B2 JP2012249290A JP2012249290A JP5619111B2 JP 5619111 B2 JP5619111 B2 JP 5619111B2 JP 2012249290 A JP2012249290 A JP 2012249290A JP 2012249290 A JP2012249290 A JP 2012249290A JP 5619111 B2 JP5619111 B2 JP 5619111B2
Authority
JP
Japan
Prior art keywords
image
cells
input image
calculated
template image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012249290A
Other languages
English (en)
Other versions
JP2013114678A (ja
Inventor
慶久 張
慶久 張
寧 楽
寧 楽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2013114678A publication Critical patent/JP2013114678A/ja
Application granted granted Critical
Publication of JP5619111B2 publication Critical patent/JP5619111B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • G06K9/20

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Description

本発明は、帳票などの、罫線およびセルを含む入力画像がテンプレート画像と一致するか否かを判定する画像判定装置およびプログラムに関する。
金融業などにおける事務処理では、日付や金額などの事項が記入された帳票が取り扱われる。近年では、省力化のために、帳票に記入された事項を、情報処理装置によって自動的に抽出する技術の開発が進んでいる。また、帳票に記入された事項を抽出する前段階として、帳票の種類を判定する技術の開発も進んでいる。
たとえば、特許文献1には、記入済みの帳票を、複数種類の帳票原本のうちのいずれかに分類する帳票認識装置が記載されている。特許文献1に記載の帳票認識装置は、記入済みの帳票をスキャナで読み取って得られる入力画像から抽出した罫線と、帳票原本をスキャナで予め読み取って得られたテンプレート画像から予め抽出された罫線とに基づいて、入力画像とテンプレート画像とが一致するか否かを判定している。より詳細には、特許文献1に記載の帳票認識装置は、入力画像中の罫線に基づいて抽出した、入力画像中の最小矩形の枠線と、テンプレート画像中の罫線に基づいて予め抽出した、テンプレート画像中の最小矩形の枠線とを1対1に対応させ、対応する最小矩形の枠線間での相違度を算出し、相違度が小さい場合に、入力画像とテンプレート画像とが一致すると判定している。
特開2004−334913号公報
テンプレート画像から罫線を抽出する際には、通常、ユーザは正しく罫線が認識できているかを確認し、罫線が欠けている場合には必要に応じて罫線を修正することができる。したがって、帳票認識装置に記憶されているテンプレート画像の罫線は完全なものであり、罫線に基づいて抽出される最小矩形の枠線も完全なものとなる。これに対して、入力画像に対しては修正などが行われないので、記入済みの帳票に欠陥があったり、スキャナの性能が低かったりすると、罫線が不完全になる場合がある。
入力画像中の罫線が不完全な場合、抽出される最小矩形の形状・大きさが、テンプレート画像とは大きく異なり、それに起因して、入力画像中の最小矩形とテンプレート画像中の最小矩形との対応関係が変化してしまう。そうすると、特許文献1に記載の帳票認識装置では、対応する最小矩形の枠線間の相違度を正しく算出することができず、判定を正しく行うことができなくなってしまう。
本発明は、上述した課題を解決するためのものであり、判定精度の高い画像判定装置およびプログラムを提供することを目的とする。
本発明は、入力画像中から、罫線およびセルを抽出する特徴量抽出部と、
予め抽出および記憶されている、テンプレート画像中の罫線の間隔と、前記特徴量抽出部によって抽出された、前記入力画像中の罫線の間隔とから、予め抽出および記憶されている、テンプレート画像中のセルおよび罫線と、前記特徴量抽出部によって抽出された、前記入力画像中のセルおよび罫線とを整列させる整列部と、
前記整列部によって整列させられた前記入力画像中のセルと前記テンプレート画像中のセルとにおける、セル同士の重なり率を算出し、算出した重なり率から前記入力画像と前記テンプレート画像との一致率を算出し、算出した一致率が所定の閾値よりも高い場合に、前記入力画像と前記テンプレート画像とが一致すると判定する判定部と、を備え
前記判定部は、前記入力画像中から抽出されたセルの個数と前記テンプレート画像中のセルの個数とが異なる場合に、
セルの個数が少ない方の画像中の各セルについて、当該セルの面積に対する重なり面積の割合を、前記重なり率として算出し、
算出された各重なり率のうち、所定の限界値よりも低い重なり率を除いて、各重なり率の平均値を算出し、算出した平均値を前記一致率とするように構成され、
前記重なり面積は、セルの個数が少ない方の画像中のセルとセルの個数が多い方の画像中のいずれか1つのセルとにおける、重なっている部分の面積であることを特徴とする画像判定装置である。
また本発明は、入力画像中から、罫線およびセルを抽出する特徴量抽出部と、
予め抽出および記憶されている、テンプレート画像中の罫線の間隔と、前記特徴量抽出部によって抽出された、前記入力画像中の罫線の間隔とから、予め抽出および記憶されている、テンプレート画像中のセルおよび罫線と、前記特徴量抽出部によって抽出された、前記入力画像中のセルおよび罫線とを整列させる整列部と、
前記整列部によって整列させられた前記入力画像中のセルと前記テンプレート画像中のセルとにおける、セル同士の重なり率を算出し、算出した重なり率から前記入力画像と前記テンプレート画像との一致率を算出し、算出した一致率が所定の閾値よりも高い場合に、前記入力画像と前記テンプレート画像とが一致すると判定する判定部と、を備え、
前記整列部は、
前記テンプレート画像中の罫線の間隔と前記入力画像中の罫線の間隔との比率を複数算出して、算出した複数の比率を複数の倍率候補とし、複数の倍率候補それぞれについて、前記テンプレート画像中の罫線のいずれか1つと前記入力画像中の罫線のいずれか1つとを一致させる複数の平行移動候補を計算し、
各倍率候補および各平行移動候補について、前記テンプレート画像または前記入力画像のうちのいずれか一方の罫線を前記倍率候補によって拡大または縮小し、前記平行移動候補によって平行移動させたものと、前記テンプレート画像または前記入力画像のうちのいずれか他方の罫線とにおける、罫線の一致度を評価し、
前記一致度が最も高くなるときの倍率候補および平行移動候補によって、前記テンプレート画像または前記入力画像のうちのいずれか一方の罫線およびセルを拡大または縮小し、平行移動させることによって、前記テンプレート画像または前記入力画像のうちのいずれか他方の罫線およびセルに対して整列させることを特徴とする画像判定装置である
また本発明は、前記入力画像中のセルの数が所定の基準値よりも少ない場合には、前記整列部に整列を行わせず、前記判定部に判定を行わせず、前記入力画像中のセルの数が前記所定の基準値よりも多い場合には、前記整列部に整列を行わせ、前記判定部に判定を行わせる識別部を備えることを特徴とする。
また本発明は、コンピュータを、前記画像判定装置として機能させることを特徴とするプログラムである。
本発明によれば、入力画像中のセルとテンプレート画像中のセルとを整列させた後、セル同士の重なり率によって判定を行うので、セル間の対応関係を考慮する必要が無く、精度の良い判定を行うことができる。
また本発明によれば、セルの個数が少ない方の画像中のセルの全面積に対する、当該セルとセルの個数が多い方の画像中のいずれか1つのセルとの重複部分の面積の割合が、セルの重なり率として算出され、セルの個数が少ない方の画像中の各セルについての各重なり率の、所定の限界値よりも低い重なり率を除いた平均値が、一致率として算出される。たとえば、入力画像中の罫線が欠けている場合、入力画像中のセルの個数はテンプレート画像中のセルの個数よりも少なくなるが、その分、入力画像中には、テンプレート画像中のセルよりも大きな面積のセルが現れる。この大きな面積のセルと、テンプレート画像中のいずれか1つのセルとの重なり率は、所定の限界値よりも低くなるので、一致率の算出には考慮されない。すなわち、本発明に係る画像判定装置は、入力画像中の罫線の欠けによる、セルの個数の減少および大きな面積のセルの出現の影響を排除して、判定を行うことができる。
また本発明によれば、罫線の間隔同士の比率を複数の倍率候補とし、倍率候補ごとに複数の平行移動候補を計算し、罫線の一致度が最も高くなる、倍率候補および平行移動候補によって、入力画像中の罫線およびセルと、テンプレート画像中の罫線およびセルとが整列させられる。したがって、精度良く整列を行うことができる。
また本発明によれば、識別部によって、入力画像中のセルの数が所定の基準値よりも少ないと判定された場合には、前記整列部による整列および前記判定部による判定が行われないので、計算量を少なくすることができる。
また本発明によれば、コンピュータを、前記画像判定装置として機能させることができる。
画像抽出装置100の構成を機能的に示すブロック図である。 文字等が記入されていない帳票を、スキャナ等で読み取って得られた画像を示す図である。 記入済みの帳票を、スキャナ等で読み取って得られた画像を示す図である。 画像抽出装置100の処理を概略的に示すフローチャートである。 図2に示すテンプレート画像中から抽出された罫線およびセルを示す図である。 図3に示す入力帳票画像中から抽出された罫線およびセルを示す図である。 図5に示す罫線およびセルと、図6に示す罫線およびセルとを整列させたときの図である。
以下に、本発明の実施形態である画像抽出装置100について説明する。図1は、画像抽出装置100の構成を機能的に示すブロック図である。画像抽出装置100は、MFP(Multi Function Printer)などに備えられる従来公知の制御演算回路および記憶回路によって実現され、機能的には、画像判定部10と画像抽出部20と記憶部30とを含む。画像判定部10は、特徴量抽出部11と、識別部12と、整列部13と、判定部14とを含む。
画像抽出装置100は、概略的には、帳票に記入された文字等を抽出するための装置である。図2は、文字等が記入されていない帳票(以下では、「帳票原本」と称する)を、スキャナ等で読み取って得られた画像(以下では、「テンプレート画像」と称する)を示している。帳票は、たとえば、図2に示すような矩形状の記録用紙であり、複数の罫線が引かれており、縦に延びる2本の罫線Kと横に延びる2本の罫線Kとによって区切られる矩形状の領域(以下では、「セル」と称する)Cに、文字等が記入される。図3に、帳票原本中の空欄のセルに文字等が記入された帳票、すなわち、記入済みの帳票を、スキャナ等で読み取って得られた画像(以下では、「入力帳票画像」と称する)を示す。
図4は、画像抽出装置100の処理を概略的に示すフローチャートである。画像が入力されると、特徴量抽出部11は、入力された画像中から、その画像の特徴量である、罫線およびセルを抽出する(ステップS1)。
次に、ステップS2において、識別部12は、抽出された罫線およびセルに基づいて、入力された画像が、テンプレート画像または入力帳票画像であるか否かを判断し、入力された画像がテンプレート画像または入力帳票画像である場合には、ステップS3へ進み、入力された画像がテンプレート画像または入力帳票画像ではない場合には、ステップS8へ進む。たとえば、識別部12は、入力された画像中のセルの数が所定の基準値(たとえば、10)よりも少ない場合に、入力された画像は、テンプレート画像または入力帳票画像ではないと判断する。ステップS8では、画像抽出装置100は、ユーザに対して、入力された画像は帳票ではないと報知し、処理を終了する。
ステップS3では、画像抽出装置100は、ユーザに対して、テンプレート画像または入力帳票画像のいずれであるかの入力を促し、テンプレート画像であると入力された場合には、ステップS4へ進み、入力帳票画像であると入力された場合には、ステップS5へ進む。
ステップS4では、記憶部30が、テンプレート画像の罫線およびセルの情報を記憶する。このとき、画像抽出装置100は、テンプレート画像の罫線およびセルを表示し、ユーザに対して、罫線およびセルに誤りが無いか否かを確認するようにしてもよい。さらに、画像抽出装置100は、罫線およびセルに誤りがあった場合に、ユーザが修正できるように構成されていてもよい。また、画像抽出装置100は、テンプレート画像の罫線およびセルの情報とともに、ユーザによって入力された、テンプレート画像の名称や種類、注目領域などを記憶するように構成されてもよい。ここで、注目領域とは、テンプレート画像と同じ種類の入力帳票画像が入力されたときに、画像抽出装置100が文字等を抽出する対象となるセルである。
ステップS5では、整列部13が、記憶部30に記憶されている、テンプレート画像中の罫線の間隔と、特徴量抽出部11によって抽出された、入力帳票画像中の罫線の間隔とに基づいて、当該テンプレート画像中のセルおよび罫線と、当該入力帳票画像中のセルおよび罫線とを整列させる。ここでいう整列とは、テンプレート画像中のセルおよび罫線と入力画像中のセルおよび罫線とを、同じ大きさおよび位置に揃えることである。整列は、画像の縦方向および横方向それぞれにおいて行われる。
具体的には、整列部13は、まず、テンプレート画像中の罫線の間隔と入力帳票画像中の罫線の間隔との比率を算出する。通常、帳票中の罫線の間隔は複数存在するので、複数個の比率が算出される。そして、整列部13は、算出された複数の比率を、倍率候補とする。テンプレート画像と入力帳票画像とが同じ種類の帳票に基づいていれば、複数の倍率候補のうちのいずれか1つで、拡大または縮小を行えば、テンプレート画像と入力帳票画像とが同じ大きさに揃うことになる。
次に、整列部13は、複数の倍率候補それぞれについて、倍率候補で拡大または縮小を行ったときに、テンプレート画像中の罫線のいずれか1つと入力画像中の罫線のいずれか1つとが一致するような、平行移動候補(移動距離候補)を複数個設定する。そして、各倍率候補および各平行移動候補について、テンプレート画像または入力帳票画像のうちのいずれか一方の罫線を倍率候補によって拡大または縮小し、平行移動候補によって平行移動させたものと、テンプレート画像または入力帳票画像のうちのいずれか他方の罫線とにおける、罫線の一致度を評価する。一致度が高い方が評価は高いとする。すなわち、テンプレート画像と入力帳票画像とが同じ種類の帳票に基づいていれば、一致度が最も高いときの倍率候補および平行移動候補の組を用いて、テンプレート画像または入力帳票画像のうちのいずれか一方の罫線を拡大または縮小し、平行移動させたものと、テンプレート画像または入力帳票画像のうちのいずれか他方とは、大きさおよび位置が揃うことになる。整列部13は、このようにして、テンプレート画像中のセルおよび罫線と、入力帳票画像中のセルおよび罫線とを整列させる。
ステップS6では、判定部14が、整列部13によって整列させられた入力帳票画像中のセルとテンプレート画像中のセルとにおける、セル同士の重なり率を算出する。そして、判定部14は、算出した重なり率から入力帳票画像とテンプレート画像との一致率を算出し、算出した一致率が所定の閾値(たとえば、95%)よりも高い場合に、入力帳票画像とテンプレート画像とが一致すると判定し、ステップS7へ進む。記憶部30に記憶されているすべてのテンプレート画像に対して整列および判定が行われた結果、入力帳票画像はいずれのテンプレート画像にも一致しないと判定された場合には、ステップS9へ進む。ステップS9では、画像抽出装置100は、ユーザに対して、入力された画像は未分類の帳票であると報知し、処理を終了する。
ステップS6において、判定部14は、入力帳票画像中のセルの個数とテンプレート画像中のセルの個数とが異なる場合には、以下のように重なり率および一致率を算出する。以下では、入力帳票画像中のセルの個数の方がテンプレート画像中のセルの個数よりも少ないとする。このような場合、判定部14は、入力帳票画像中のセルそれぞれについて、セルの全面積に対する、当該セルとテンプレート画像中のいずれか1つのセルとの、重なっている部分の面積の割合を、重なり率として算出する。すなわち、重なり率=(重なっている部分の面積/セルの全面積)×100[%]である。判定部14は、入力帳票画像中のセルそれぞれについて、重なり率を算出し、算出した重なり率のうち、所定の限界値(たとえば、75%)よりも低い重なり率を除いて、各重なり率の平均値を算出する。判定部14は、このようにして算出した平均値を一致率とする。
ステップS7では、画像抽出部20が、テンプレート画像と一致すると判定された入力帳票画像中のセルのうち、記憶部30に記憶されている注目領域から、画像の抽出を行う。そして、画像抽出部20は、抽出した画像に基づいて、OCR(Optical Character Recognition)によって、文字等を生成して記憶部30に記憶させ、処理を終了する。
このような画像抽出装置100によれば、入力帳票画像中のセルとテンプレート画像中のセルとを整列させた後、セル同士の重なり率によって一致判定を行うので、セル間の対応関係を考慮する必要が無く、精度の良い判定を行うことができる。
また、ステップS6では、セルの個数が少ない方の画像中のセルの全面積に対する、当該セルとセルの個数が多い方の画像中のいずれか1つのセルとの重複部分の面積の割合が、セルの重なり率として算出され、セルの個数が少ない方の画像中の各セルについての各重なり率の、所定の限界値よりも低い重なり率を除いた平均値が、一致率として算出されるので、精度の良い判定を行うことができる。たとえば、入力帳票画像中の罫線が欠けている場合、入力帳票画像中のセルの個数はテンプレート画像中のセルの個数よりも少なくなるが、その分、入力帳票画像中には、テンプレート画像中のセルよりも大きな面積のセルが現れる。この大きな面積のセルと、テンプレート画像中のいずれか1つのセルとの重なり率は、所定の限界値よりも低くなるので、一致率の算出には考慮されない。すなわち、画像抽出装置100によれば、入力帳票画像中の罫線の欠けによる、セルの個数の減少および大きな面積のセルの出現の影響を排除して、判定を行うことができ、その結果、精度の良い判定を行うことができる。
また、ステップS5では、罫線の間隔同士の比率を複数の倍率候補とし、倍率候補ごとに複数の平行移動候補を設定し、罫線の一致度が最も高くなる、倍率候補および平行移動候補によって、入力帳票画像中の罫線およびセルと、テンプレート画像中の罫線およびセルとが整列させられる。したがって、画像抽出装置100は、精度良く整列を行うことができ、その結果、精度の良い判定を行うことができる。
また、ステップS2では、入力された画像中のセルの数が所定の基準値よりも少ない場合に、入力された画像は、テンプレート画像または入力帳票画像ではないと判断し、この場合、ステップS3〜S7,S9の処理は行われない。したがって、この場合、整列部13による整列および判定部14による判定が行われないので、画像抽出装置100の計算量を少なくすることができる。
以下では、特徴量抽出部11の具体的な動作について説明する。特徴量抽出部11は、図2に示すテンプレート画像中から、図5に示す罫線およびセルを抽出したり、図3に示す入力帳票画像中から、図6に示す罫線およびセルを抽出したりする。
具体的には、特徴量抽出部11は、まず、入力された画像に対して傾き補正処理を行う。傾き補正処理は、帳票をスキャナ等で読取った際に帳票が微小に傾いていた場合に、その傾きを補正するために、傾きの方向とは逆方向に数度程度、画像を回転させる処理である。
次に、特徴量抽出部11は、傾き補正処理後の画像をグレースケール(たとえば、255階調のグレースケール)の画像に変換する。そして、変換後の画像の左上の画素から順に右方向を主走査方向(X方向)、下方向を副走査方向(Y方向)として、1画素ずつ走査を行い画素の抽出を行い、抽出した画素を黒画素とし、それ以外を白画素とする2値化を行う。抽出される画素は、前後左右のいずれかの画素の階調値よりも所定の値(たとえば、50)以上高い階調値を有する画素である。また、先に抽出された画素に隣接する同程度(たとえば、±10程度)の階調値を有する画素も抽出される。このようにして2値化を行うことで、図2および図5ならびに図3および図6に示すように、グレーのセルを白に変換することができるとともに、グレーの罫線を黒に変換することができる。これに対して、もし、単純に1つの閾値によって、入力された画像に対して2値化を行った場合、グレーのセルがすべて黒に変換されるか、または、グレーの罫線が白に変換されてしまう。
次に、特徴量抽出部11は、公知の線分抽出方法、たとえばHough変換によって、X方向またはY方向に平行な線分を抽出し、線分の両端の点のXY座標値を記憶する。そして、特徴量抽出部11は、所定の値(たとえば、5)以内の間隔の平行な線分群について、位置を揃える。具体的には、X軸に平行な線分群であれば、Y座標値の算術平均値を算出し、その値を線分群に含まれる各線分のY座標値とする。たとえば、線分Aの両端点のXY座標値が(1,2),(10,2)であり、線分Bの両端点のXY座標値が(20,2.1),(25,2.1)であり、線分Cの両端点のXY座標値が(11,1.6),(15,1.6)である場合、線分A〜CのY座標値の算術平均値(2+2.1+1.6)/3=1.9を算出し、線分Aの両端点のXY座標値を(1,1.9),(10,1.9)に置き換え、線分Bの両端点のXY座標値を(20,1.9),(25,1.9)に置き換え、線分Cの両端点のXY座標値を(11,1.9),(15,1.9)に置き換える。特徴量抽出部11は、Y軸に平行な線分群についても、同様の処理を行う。
次に、特徴量抽出部11は、所定の値(たとえば、3)以下で隣接している線分同士を接続する。たとえば、線分Aの両端点のXY座標値は(1,1.9),(10,1.9)であり、線分Bの両端点のXY座標値は(20,1.9),(25,1.9)であり、線分Cの両端点のXY座標値は(11,1.9),(15,1.9)であるので、線分Aと線分Cとは隣接し、また、線分Bと線分Cとは隣接している。このような場合、特徴量抽出部11は、線分Aと線分Cとを接続するとともに、線分Bと線分Cとを接続し、1つの線分とする。この1つの線分の両端点のXY座標値は、(1,1.9),(25,1.9)となる。
次に、特徴量抽出部11は、所定の短い線分(たとえば、線分の長さが5未満)について、垂直な線分と交差しているか否かを確認する。そして、その短い線分が、垂直な線分と交差していないか、または、交差している、1または複数の垂直な線分の長さが、所定の長さ(たとえば、10)未満である場合には、その短い線分を削除する。次に、特徴量抽出部11は、残りの線分について、垂線な線分と交差しているか否かを確認し、交差していない場合には、その線分を削除する。以上の処理で残っている線分が、罫線とみなされる。
次に、特徴量抽出部11は、線分の交点のうち、画像の上から順に、Y座標値が等しければ左から順に、注目交点とし、以下(a)〜(d)の処理を行ってセルを抽出する。
(a)注目交点と同じY座標値を有し、注目交点よりも右側の交点(第1交点)があるか否かを確認する。ある場合には、(b)の処理を行い、無い場合には、注目交点を次へ移す。
(b)注目交点と同じX座標値を有し、注目交点よりも下側の交点(第2交点)があるか否かを確認する。ある場合には、(c)の処理を行い、無い場合には、注目交点を次へ移す。
(c)第1交点と同じX座標値を有し、第2交点と同じY座標値を有する交点(第3交点)があるか否かを確認する。ある場合には、(d)の処理を行い、無い場合には、注目交点を次へ移す。
(d)注目交点および第1〜第3交点のXY座標値を1つの組として、1つのセルに対応付けて記憶し、注目交点を次に移す。
次に、識別部12の具体的な動作について説明する。識別部12は、たとえば、以下の(e)〜(g)の条件を満たすときに、入力された画像はテンプレート画像または入力帳票画像であると判断する。
(e)セルの個数が所定の数(たとえば、10)以上である。
(f)セルの面積/すべてのセルの合計面積が、所定の範囲(たとえば、1%〜5%)となるセルが、所定の数(たとえば、5)以上である。なお、「すべてのセルの合計面積」の代わりに、「すべてのセルを含む最小の矩形の面積」を用いてもよい。
(g)セルの面積/入力された画像全体の面積が、所定の範囲(たとえば、0.2%〜2%)となるセルが、所定の数(たとえば、5)以上である。
次に、整列部13の具体的な動作について説明する。整列部13は、図5に示す罫線およびセルと、図6に示す罫線およびセルとを、図7に示すように整列させる。
具体的には、まず、整列部13は、入力帳票画像とテンプレート画像とのそれぞれについて、X軸に平行な線分(罫線)間の間隔DY,DYを算出する。たとえば、入力帳票画像に存在するX軸に平行な線分の数が5である場合において、各線分のY座標値YE1〜5が、小さい方から順に、{1,4,8,13,18}である場合、DY={3,4,5,5}となる。また、たとえば、テンプレート画像に存在するX軸に平行な線分の数が6である場合において、各線分のY座標値YT1〜6が、小さい方から順に、{21,33,39,47,57,67}であるとき、DY={12,6,8,10,10}となる。
次に、整列部13は、DYの各要素と、DYの各要素との間で、複数の比率を計算し、各比率を要素とする比率群を計算する。この計算は、DY,DYのうち、要素の数が少ない方を分母とし、多い方を分子とする。換言すれば、X軸に平行な罫線の数が少ない方の画像を、Y方向に拡大または縮小して、罫線の数が多い方の画像に対して整列させるということになる。以下では、DYの要素を分母とし、DYの要素を分子とする比率からなる群を、PYT/Eと表す。なお、比率の計算の際には、同じ値の比率が複数個出現することがあるが、その場合、PYT/Eの要素が重複しないようにする。また、PYT/Eの要素が多すぎて計算量が膨大になる場合には、同じ値の比率の出現数が多い方から順に、所定の個数(たとえば、10個)の比率のみを、PYT/Eの要素としてもよい。
たとえば、DY={3,4,5,5}であり、DY={12,6,8,10,10}である場合、複数の比率からなる比率群PYT/Eは、PYT/E={4,2,8/3,10/3,3,3/2,5/2,12/5,6/5,8/5}となる。ここで、PYT/Eの要素である4は、DYの要素である3を、DYの要素である12に揃えるためには、12/3=4[倍]する必要があることを示している。同様に、PYT/Eの要素である2は、DYの要素である3を、DYの要素である6に揃えるためには、6/3=2[倍]する必要があることを示している。整列部13は、DYのいずれの要素とDYのいずれの要素とが対応しているかを判別できないので、上記のように、あらゆる対応関係を想定して、PYT/Eが計算される。
次に、整列部13は、PYT/Eの各要素PYT/E (k)(この値が、倍率候補である)を、罫線の数が少ない方の画像におけるY座標値であるYE1〜5に乗じて、Y軸上の数列である第k数列EY(k)を算出する。たとえば、上の例において、PYT/E (1)=4とすると、第1数列EY(1)={4,16,32,52,72}である。また、PYT/E (2)=2とすると、第2数列EY(2)={2,8,16,26,36}である。
次に、整列部13は、第k数列のn個目の要素Eと、罫線の数が多い方の画像におけるY座標値YT1〜6のm個目の要素Tとが一致するように、第k数列をY軸上で平行移動させる。たとえば、第1数列EY(1)={4,16,32,52,72}の2番目の要素16と、Y座標値YT1〜6={21,33,39,47,57,67}の4番目の要素47とが一致するように、第1数列をY軸上で+31(この値が、平行移動候補である)だけ平行移動させる。この場合における平行移動後の数列EY(k) nmは、EY(1) 24={35,47,63,83,103}となる。
そして、整列部13は、この平行移動後の数列EY(1) 24と、Y座標値YT1〜6との他の一致点を確認する。具体的には、一致させた要素である47を除くY座標値YT1〜6の各要素T−Min(DY)×0.1〜T+Min(DY)×0.1の範囲内に、EY(1) 24のいずれかの要素(一致させた要素である47を除く)が存在するか否かを確認し、一致するTの個数1個につき1点として評価する。なお、T−Min(DY)×0.1〜T+Min(DY)×0.1のように範囲を持たせるのは、各要素が完全に一致しない場合も含めるためである。
上の例では、EY(1) 24の47以外の要素と、Y座標値YT1〜6の47以外の要素とは、いずれも一致しない(YT1〜6の近傍の範囲内に含まれない)ので、EY(1) 24に対する評価値は、0点である。また、たとえば、EY(2) 12の場合、平行移動候補は+31であり、EY(2) 12={33,39,47,57,67}となるので、Y座標値YT1〜6におけるEY(2) 12と一致する要素(一致させた要素である33を除く)は、39,47,57,67の4つの要素となるので、EY(2) 12に対する評価値は、4点となる。このようにして、整列部13は、すべてのEY(k) nmについて評価値をそれぞれ計算する。
次に、整列部13は、最も評価値が高いEY(k) nmに対応する平行移動候補および倍率候補を、テンプレート画像と入力帳票画像とをY方向において整列させるための平行移動候補および倍率候補として選択する。なお、最も評価値が高いEY(k) nmが2つ以上存在することにより、平行移動候補および倍率候補の組が2組以上存在する場合には、一致とみなされた各要素が最も近くなるものを選ぶ。
最後に、整列部13は、罫線の数が少ない方の画像(上の例では入力帳票画像)について、選択した倍率候補によって、X軸に平行な罫線同士のY方向における間隔、および、Y軸に平行な罫線の長さを、拡大または縮小し、さらに、各罫線を、選択した平行移動候補によって、Y方向に平行移動させる。そして、整列部13は、以上の処理を、Y軸に平行な線分(罫線)についても行い、X方向およびY方向の両方において、入力帳票画像とテンプレート画像とを整列させる。
次に、判定部14の具体的な動作について説明する。判定部14は、図7のように整列させられた入力帳票画像中のセルとテンプレート画像中のセルとの重なり率を算出する。上述したように、入力帳票画像中のセルの個数の方がテンプレート画像中のセルの個数よりも少ない場合、判定部14は、入力帳票画像中のセルそれぞれについて、セルの全面積に対する、当該セルとテンプレート画像中のいずれか1つのセルとの、重なっている部分の面積の割合を、重なり率として算出する。いずれか1つのセルとしているのは、入力帳票画像中のセルに対して、テンプレート画像中のセルが複数個重なっている場合も有り得るからである。複数個重なっている場合には、テンプレート画像中のそれぞれのセルにおいて重なっている部分面積のうちの、最も大きな値を、重なり率の算出に用いる、重なっている部分の面積とする。
なお、判定部14は、入力帳票画像中のセルの個数とテンプレート画像中のセルの個数とが等しい場合には、上の例とは逆に、テンプレート画像中のセルの全面積に対する、当該セルと入力帳票画像中のいずれか1つのセルとの、重なっている部分の面積の割合を、重なり率として算出してもよい。
次に、判定部14は、重なり率から一致率を算出する。上述したように、入力帳票画像中のセルの個数の方がテンプレート画像中のセルの個数よりも少ない場合、判定部14は、算出した各重なり率のうち、所定の限界値(たとえば、75%)よりも低い重なり率を除いて、各重なり率の平均値を算出し、一致率とする。
なお、平均値は、算術平均値であってもよいし、面積の重みつきの平均値であってもよい。また、判定部14は、入力帳票画像中のセルの個数とテンプレート画像中のセルの個数とが等しい場合には、重なり率が所定の限界値よりも低いか否かの判断は行わずに、すべての重なり率について平均値を算出する。この場合には、入力帳票画像中の罫線に欠けは無いと考えられるからである。ただし、入力帳票画像中のセルの個数とテンプレート画像中のセルの個数とが等しい場合であっても、重なり率が所定の限界値よりも低いときに、その重なり率を除くようにしてもよい。
このようにして一致率を算出すると、判定部14は、その一致率が所定の閾値(たとえば、95%)よりも高いか否かを判断し、高いと判断した場合に、入力帳票画像とテンプレート画像とが一致すると判定する。
以上のような画像抽出装置100は、従来公知の情報処理装置に、該情報処理装置を画像抽出装置100として機能させるプログラムである画像抽出プログラムを記憶させることで、実現することができる。この画像抽出プログラムは、従来公知の、コンピュータ読み取り可能な記録媒体に記録できる。
上記画像抽出プログラムを記録媒体に記録することで、画像抽出装置100が行う各種の処理を実行するためのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラムなど)を記録した記録媒体を、持ち運び自在に提供することができる。
なお、記録媒体は、マイクロコンピュータが処理を行うためのメモリ、たとえばROM(Read Only Memory)のようなプログラムメディアであってもよいし、または、コンピュータが外部記憶装置として備えるプログラム読取装置に挿入することで読み取られるプログラムメディアであってもよい。
記録媒体に格納されているプログラムは、マイクロプロセッサが記録媒体にアクセスして実行する方式であってもよいし、または、マイクロプロセッサが記録媒体からプログラムコードを読み出し、読み出されたプログラムコードがマイクロコンピュータのプログラム記憶エリアにダウンロードされることで、そのプログラムが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープ、カセットテープなどのテープ系、フレキシブルディスク、ハードディスクなどの磁気ディスク、CD−ROM(Compact Disc - Read Only Memory)、MO(Magneto Optical disc)、MD(Mini Disc)、DVD(Digital Versatile Disc)などの光ディスクのディスク系、IC(Integrated Circuit)カード(メモリカードを含む)、光カードなどのカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(登録商標)、フラッシュROMなどによる半導体メモリを含めた固定的にプログラムコードを担持する媒体であってもよい。
また、コンピュータが、インターネットを含む通信ネットワークを接続可能なシステム構成であれば、記録媒体は、通信ネットワークからプログラムコードをダウンロードするように、流動的にプログラムコードを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、または他の記録媒体からインストールしておく。また、上記画像抽出プログラムは、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
10 画像判定部
11 特徴量抽出部
12 識別部
13 整列部
14 判定部
20 画像抽出部
30 記憶部
100 画像抽出装置

Claims (4)

  1. 入力画像中から、罫線およびセルを抽出する特徴量抽出部と、
    予め抽出および記憶されている、テンプレート画像中の罫線の間隔と、前記特徴量抽出部によって抽出された、前記入力画像中の罫線の間隔とから、予め抽出および記憶されている、テンプレート画像中のセルおよび罫線と、前記特徴量抽出部によって抽出された、前記入力画像中のセルおよび罫線とを整列させる整列部と、
    前記整列部によって整列させられた前記入力画像中のセルと前記テンプレート画像中のセルとにおける、セル同士の重なり率を算出し、算出した重なり率から前記入力画像と前記テンプレート画像との一致率を算出し、算出した一致率が所定の閾値よりも高い場合に、前記入力画像と前記テンプレート画像とが一致すると判定する判定部と、を備え
    前記判定部は、前記入力画像中から抽出されたセルの個数と前記テンプレート画像中のセルの個数とが異なる場合に、
    セルの個数が少ない方の画像中の各セルについて、当該セルの面積に対する重なり面積の割合を、前記重なり率として算出し、
    算出された各重なり率のうち、所定の限界値よりも低い重なり率を除いて、各重なり率の平均値を算出し、算出した平均値を前記一致率とするように構成され、
    前記重なり面積は、セルの個数が少ない方の画像中のセルとセルの個数が多い方の画像中のいずれか1つのセルとにおける、重なっている部分の面積であることを特徴とする画像判定装置。
  2. 入力画像中から、罫線およびセルを抽出する特徴量抽出部と、
    予め抽出および記憶されている、テンプレート画像中の罫線の間隔と、前記特徴量抽出部によって抽出された、前記入力画像中の罫線の間隔とから、予め抽出および記憶されている、テンプレート画像中のセルおよび罫線と、前記特徴量抽出部によって抽出された、前記入力画像中のセルおよび罫線とを整列させる整列部と、
    前記整列部によって整列させられた前記入力画像中のセルと前記テンプレート画像中のセルとにおける、セル同士の重なり率を算出し、算出した重なり率から前記入力画像と前記テンプレート画像との一致率を算出し、算出した一致率が所定の閾値よりも高い場合に、前記入力画像と前記テンプレート画像とが一致すると判定する判定部と、を備え、
    前記整列部は、
    前記テンプレート画像中の罫線の間隔と前記入力画像中の罫線の間隔との比率を複数算出して、算出した複数の比率を複数の倍率候補とし、複数の倍率候補それぞれについて、前記テンプレート画像中の罫線のいずれか1つと前記入力画像中の罫線のいずれか1つとを一致させる複数の平行移動候補を計算し、
    各倍率候補および各平行移動候補について、前記テンプレート画像または前記入力画像のうちのいずれか一方の罫線を前記倍率候補によって拡大または縮小し、前記平行移動候補によって平行移動させたものと、前記テンプレート画像または前記入力画像のうちのいずれか他方の罫線とにおける、罫線の一致度を評価し、
    前記一致度が最も高くなるときの倍率候補および平行移動候補によって、前記テンプレート画像または前記入力画像のうちのいずれか一方の罫線およびセルを拡大または縮小し、平行移動させることによって、前記テンプレート画像または前記入力画像のうちのいずれか他方の罫線およびセルに対して整列させることを特徴とする画像判定装置。
  3. 前記入力画像中のセルの数が所定の基準値よりも少ない場合には、前記整列部に整列を行わせず、前記判定部に判定を行わせず、前記入力画像中のセルの数が前記所定の基準値よりも多い場合には、前記整列部に整列を行わせ、前記判定部に判定を行わせる識別部を備えることを特徴とする請求項1または2に記載の画像判定装置。
  4. コンピュータを、請求項1〜のいずれか1つに記載の画像判定装置として機能させることを特徴とするプログラム。
JP2012249290A 2011-11-30 2012-11-13 画像判定装置およびプログラム Active JP5619111B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110412113.9 2011-11-30
CN2011104121139A CN103136544A (zh) 2011-11-30 2011-11-30 图像判断装置

Publications (2)

Publication Number Publication Date
JP2013114678A JP2013114678A (ja) 2013-06-10
JP5619111B2 true JP5619111B2 (ja) 2014-11-05

Family

ID=48496352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012249290A Active JP5619111B2 (ja) 2011-11-30 2012-11-13 画像判定装置およびプログラム

Country Status (2)

Country Link
JP (1) JP5619111B2 (ja)
CN (1) CN103136544A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6467787B2 (ja) * 2014-05-27 2019-02-13 株式会社リコー 画像処理システム、撮像装置、画像処理方法およびプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728935A (ja) * 1993-07-07 1995-01-31 Oki Electric Ind Co Ltd 文書画像処理装置
JP3353215B2 (ja) * 1995-05-15 2002-12-03 日本電信電話株式会社 帳票書式識別方法及び装置
JPH0973516A (ja) * 1995-09-04 1997-03-18 Nippon Telegr & Teleph Corp <Ntt> 帳票種類識別方法
JPH1027208A (ja) * 1996-07-10 1998-01-27 N T T Data Tsushin Kk 帳票照合方法及び装置
TW368640B (en) * 1996-12-25 1999-09-01 Hitachi Ltd Image processor, image processing device and image processing method
CN1217292C (zh) * 2003-06-27 2005-08-31 杭州信雅达系统工程股份有限公司 票据图象版面识别方法
JP5617249B2 (ja) * 2010-01-20 2014-11-05 富士ゼロックス株式会社 帳票識別装置、帳票識別プログラム及び帳票処理システム

Also Published As

Publication number Publication date
CN103136544A (zh) 2013-06-05
JP2013114678A (ja) 2013-06-10

Similar Documents

Publication Publication Date Title
RU2678485C1 (ru) Способ сегментации и распознавания символов
JP5500480B2 (ja) 帳票認識装置及び帳票認識方法
US10437466B2 (en) Formula inputting method and apparatus
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
US7106904B2 (en) Form identification method
RU2621601C1 (ru) Устранение искривлений изображения документа
JP4977368B2 (ja) 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
US20110222776A1 (en) Form template definition method and form template definition apparatus
CN112699775A (zh) 基于深度学习的证件识别方法、装置、设备及存储介质
CN111144400B (zh) 身份证信息的识别方法、装置、终端设备及存储介质
CN110427853B (zh) 一种智能票据信息提取处理的方法
JP4704601B2 (ja) 文字認識方法,プログラム及び記録媒体
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
CN114708186A (zh) 一种电子签章定位方法及装置
CN106557733A (zh) 信息处理装置和信息处理方法
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP5619111B2 (ja) 画像判定装置およびプログラム
JP2009223612A (ja) 画像認識装置及びプログラム
CN111008635A (zh) 一种基于ocr的多票据自动识别方法及识别系统
JP4521466B2 (ja) 帳票処理装置
JP5134383B2 (ja) Ocr装置、証跡管理装置及び証跡管理システム
CN111709419A (zh) 一种纸币冠字号的定位方法、系统、设备及可读存储介质
JP4521377B2 (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JPH07230526A (ja) 文字読取装置
CN113435331B (zh) 图像文字识别方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140826

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140916

R150 Certificate of patent or registration of utility model

Ref document number: 5619111

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150