JP4388545B2 - 画像処理装置及び方法、並びにプログラム - Google Patents

画像処理装置及び方法、並びにプログラム Download PDF

Info

Publication number
JP4388545B2
JP4388545B2 JP2006352623A JP2006352623A JP4388545B2 JP 4388545 B2 JP4388545 B2 JP 4388545B2 JP 2006352623 A JP2006352623 A JP 2006352623A JP 2006352623 A JP2006352623 A JP 2006352623A JP 4388545 B2 JP4388545 B2 JP 4388545B2
Authority
JP
Japan
Prior art keywords
image
straight line
pattern
processing apparatus
form image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006352623A
Other languages
English (en)
Other versions
JP2008167009A (ja
Inventor
敬己 下郡山
Original Assignee
キヤノンソフトウェア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by キヤノンソフトウェア株式会社 filed Critical キヤノンソフトウェア株式会社
Priority to JP2006352623A priority Critical patent/JP4388545B2/ja
Publication of JP2008167009A publication Critical patent/JP2008167009A/ja
Application granted granted Critical
Publication of JP4388545B2 publication Critical patent/JP4388545B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)

Description

本発明は、画像処理装置及び方法、並びにプログラムに関し、特に、サイズや種類が異なる複数の帳票を一度にスキャンした画像から各帳票画像を抽出して特定することができる画像処理装置及び方法、並びにプログラムを提供することを目的とする。
複数の帳票を1枚ずつ処理することを前提として、予め登録された複数の帳票パターンの中から、スキャンされた帳票の画像と一致する帳票パターンを識別し、特定した帳票に対して処理を行う技術が知られている。
従来、紙媒体である帳票をスキャンして帳票上に記載された文字列を認識する場合、帳票の傾きにより認識率が低下するという問題がある。これに対して、帳票の傾きを検知し、水平方向または垂直方向のズレを補正してから文字を認識する技術が提案されている(例えば、特許文献1参照)。
また、傾きがバラバラである複数の帳票を一斉にスキャンして一度に複数の帳票を認識する技術が提案されている(例えば、特許文献2参照)。
特開平7−121658号公報 特開平9−128478号公報
しかしながら、上記特許文献2では、複数の帳票の種類が同一のものに限られ、また等間隔に設けられた区画に帳票を並べるという制約が課せられている。例えば、名刺のように予め形がわかっているものを縦横一様(碁盤の目)に並べるようなケースに限定される。この条件から外れる帳票については、上記特許文献1のように、帳票を1枚ずつのスキャンする必要がある。
本発明は、上記問題に鑑みて成されたものであり、原稿台に無作為に置かれたサイズや種類が異なる複数の帳票を一度にスキャンした画像から各帳票の画像部分を抽出して該帳票を特定・認識することができる画像処理装置及び方法、並びにプログラムを提供することを目的とする。
上記目的を達成するために、請求項1記載の画像処理装置は、複数種類の帳票を一度に画像読取装置で読み取ることにより得られる一の画像であって、当該複数種類の帳票イメージが配置される画像上から複数種類の帳票イメージを抽出する画像処理装置であって、前記画像上の任意の一の直線及び該直線に対して平行又は垂直となる直線から構成される矩形領域であって、前記画像処理装置に記憶されている帳票構造を直線成分によりパターン化した帳票パターンと照合することにより、当該矩形領域を構成する直線成分が前記帳票パターンの帳票構造と照合された矩形領域を、前記画像上の帳票イメージとして夫々特定する帳票イメージ特定手段と、前記帳票イメージ特定手段により特定された前記帳票イメージを、順次一の種類の帳票イメージとして抽出する帳票イメージ抽出手段と、前記帳票イメージ抽出手段により抽出された一の種類の帳票イメージの夫々を個々のファイルとして分けて記憶する記憶手段とを備えることを特徴とする。
上記目的を達成するために、請求項5記載の画像処理方法は、複数種類の帳票を一度に画像読取装置で読み取ることにより得られる一の画像であって、当該複数種類の帳票イメージが配置される画像上から複数種類の帳票イメージを抽出する画像処理装置における画像処理方法であって、前記画像上の任意の一の直線及び該直線に対して平行又は垂直となる直線から構成される矩形領域であって、前記画像処理装置に記憶されている帳票構造を直線成分によりパターン化した帳票パターンと照合することにより、当該矩形領域を構成する直線成分が前記帳票パターンの帳票構造と照合された矩形領域を、前記画像上の帳票イメージとして夫々特定する帳票イメージ特定工程と、前記帳票イメージ特定工程にて特定された前記帳票イメージを、順次一の種類の帳票イメージとして抽出する帳票イメージ抽出工程と、前記帳票イメージ抽出工程にて抽出された一の種類の帳票イメージの夫々を個々のファイルとして分けて記憶手段に記憶する記憶工程とを備えることを特徴とする。
上記目的を達成するために、請求項6記載のプログラムは、複数種類の帳票を一度に画像読取装置で読み取ることにより得られる一の画像であって、当該複数種類の帳票イメージが配置される画像上から複数種類の帳票イメージを抽出する画像処理装置実行させるためのプログラムであって、前記画像上の任意の一の直線及び該直線に対して平行又は垂直となる直線から構成される矩形領域であって、前記画像処理装置に記憶されている帳票構造を直線成分によりパターン化した帳票パターンと照合することにより、当該矩形領域を構成する直線成分が前記帳票パターンの帳票構造と照合された矩形領域を、前記画像上の帳票イメージとして夫々特定する帳票イメージ特定手段と、前記帳票イメージ特定手段により特定された前記帳票イメージを、順次一の種類の帳票イメージとして抽出する帳票イメージ抽出手段と、前記帳票イメージ抽出手段により抽出された一の種類の帳票イメージの夫々を個々のファイルとして分けて記憶する記憶手段としてコンピュータを機能させることを特徴とする。
本発明によれば、原稿台に無作為に置かれたサイズや種類が異なる複数の帳票を一度にスキャンした画像から各帳票の画像部分を抽出して該帳票を特定・認識することができ、スキャニング処理の効率を高めることができる。
以下、本発明の実施の形態を図面を参照して詳細に説明する。
図1は、本発明の実施形態に係る画像処理装置のハードウェア構成を示すブロック図である。
図1において、帳票認識装置(画像処理装置)200は、パーソナルコンピュータ(PC)等から成り、CPU201と、RAM202と、ROM203と、メモリ204と、バス205と、入力装置206と、通信インタフェース207とを備える。
CPU201は、ROM203に記憶された制御プログラムを読み出して実行すると共に、帳票認識装置全体を制御する。RAM202は、データ等を一時記憶するためのバッファやワークエリア等として機能し、後述する帳票認識処理を行う際の処理対象となる帳票イメージ等が一時的に記憶される。
ROM203は、CPU201に実行される制御プログラムを記憶する。メモリ204は、ハードディスクドライブ等の記憶装置であり、サイズや種類の異なる複数の帳票パターンを記憶する。ここで、帳票パターンは、帳票においてその内容が未記述である状態、すなわち予め定型情報の一部として視覚可能な罫線位置などに基づき、他の帳票と区別可能で、帳票の種類を特定可能な情報を意味する。具体的には、図13(b)又は図13(c)に示すように、帳票構造を直線のみでパターン化したものである。なお、メモリ204は外部記憶装置であってもよい。入出力装置206は、キーボードやマウス、ディスプレイなどで構成される。
通信インタフェース207は、外部機器と通信を行うためのインタフェースである。通信インタフェース207は、ネットワーク209を介して外部の画像読取装置208に接続することができ、該画像読取装置208上でスキャンされたスキャン画像データを取り込む。バス205は、上述した各部を互いに接続するシステムバスである。
画像読取装置208は、原稿台上に原稿等を載置して画像を読み取るフラットベッドタイプのスキャナである。本実施の形態では、画像読取装置208は画像読取機能のみを備えるが、OCRのような帳票読み取り機能を備えていてもよい。また、画像読取装置208は、画像読取機能や画像形成機能、FAX機能等を備える複合機(MFP)であってもよい。また、画像読取装置208は、ネットワーク209を介して通信インタフェース207に接続されているが、ケーブルを介してローカルに接続されていてもよい。
次に、図1の帳票認識装置200において実行される、スキャン画像から帳票イメージを抽出する流れについて図2及び図3を参照して説明する。
図2は、サイズや種類の異なる複数の帳票が画像読取装置の原稿台上に任意に置かれた状態を示す図である。図3(a)〜図3(e)は、図2に示す状態でスキャンされたスキャン画像から各帳票イメージを1つずつ抽出する一連の流れを示す図である。
図2において、画像読取装置208は、サイズや種類の異なる複数の帳票を置くことが可能な原稿台210を備える。原稿台210上には、例えば、帳票211,212,213,214が載置されているものとする。
図3(a)において、スキャン画像100は、画像読取装置208において、原稿台210上の4枚の帳票211,212,213,214を1度にスキャンした画像である。スキャン画像100には、帳票211,212,213,214に対応する帳票イメージ101,102,103,104が含まれている。
帳票認識装置200は、まず画像形成装置208からスキャン画像データを取得する。
次に、スキャン画像100上の複数の帳票イメージ101,102,103,104のうちの1つの帳票イメージ(例えば、帳票イメージ101)を抽出する。そして、抽出した帳票イメージ101をスキャン画像100上から削除し、帳票イメージ101が存在していた画像部分をクリーンアップする。ここで、クリーンアップとは、当該画像部分を背景と同じ色に置き換えることを意味する。クリーンアップしたスキャン画像100aを図3(b)に示す。
次に、帳票認識装置200は、帳票イメージ101が削除されたスキャン画像100aから帳票イメージ102を抽出する。そして、抽出した帳票イメージ102をスキャン画像100a上から削除し、当該画像部分をクリーンアップする。クリーンアップしたスキャン画像100bを図3(c)に示す。スキャン画像100bでは、スキャン画像100から2枚の帳票イメージが削除されている。
更に、帳票認識装置200は、スキャン画像100bから帳票イメージ103を抽出し、抽出した帳票イメージ103を削除して当該画像部分をクリーンアップする。クリーンアップしたスキャン画像100cを図3(d)に示す。スキャン画像100cでは、スキャン画像100から3枚の帳票イメージが削除されている。
そして、帳票認識装置200は、スキャン画像100cから帳票イメージ104を抽出し、抽出した帳票イメージ104を削除して当該画像部分をクリーンアップする。クリーンアップしたスキャン画像100dを図3(e)に示す。スキャン画像100dでは、スキャン画像100からすべての帳票イメージが削除されている。
なお、本実施の形態においては、抽出した帳票イメージ101〜104をスキャン画像100上から削除し、帳票イメージ101〜104が存在していた画像部分をクリーンアップする方法により本発明を実現しているが、帳票イメージ101〜104をスキャン画像100上から削除するのではなく、抽出した帳票イメージ101〜104が存在していた画像部分の領域を記憶しておき、残りの帳票イメージを抽出する際、既に抽出した帳票イメージが存在していた画像部分の領域以外の画像領域から残りの帳票イメージを抽出する方法によっても実現可能である。これは、残りの帳票イメージを抽出する際に、既に抽出され、画像部分の領域が記憶された帳票イメージを除外して、残りの帳票イメージを抽出することでもある。
次に、帳票認識装置200において実行される、スキャン画像100から各帳票イメージを1枚ずつ抽出する動作処理について説明する。
図4は、図1の帳票認識装置200にて実行される帳票認識処理を示すフローチャートである。
図4において、まず、ユーザが画像読取装置208の原稿台210上に複数の帳票を任意の位置に置いてスキャン開始指示を行うと、画像読取装置208が画像のスキャンを開始してスキャン画像データが得られる(ステップS301)。原稿台上に載置される複数の帳票は、種類の同一/非同一やサイズの同一/非同一の区別なく、例えば、図2に示すような状態で載置されているものとする。
次に、ステップS302では、帳票認識装置200は、画像読取装置208からスキャン画像データを取得し、メモリ204内のスキャン画像データ格納領域230に格納する。スキャン画像データ格納領域230は、スキャン画像データを格納するためにメモリ204内に設定された記憶領域である。
ステップS303〜S308は、スキャン画像全体から各帳票に対応する帳票イメージを抽出し、抽出した帳票イメージをOCR等のアプリケーションに渡せるように、帳票データ保存領域240に格納する一連の処理である。この一連の処理により、スキャン画像100から各帳票イメージが順次抽出される。なお、帳票データ保存領域240は、抽出された帳票イメージを格納するためにメモリ204内に設定された記憶領域である。
ステップS303では、帳票認識装置200は、スキャン画像データ格納領域230からスキャン画像データを読み出す。
ステップS304では、帳票認識装置200は、読み出したスキャン画像データのスキャン画像100から直線(直線画像)のみを抽出し、該直線に基づいてスキャン画像100を回転させるスキャン画像データの正規化処理を行う。ここでは、スキャン画像から抽出した複数の直線のうちの1本の直線に着目し、この直線が画像上の水平軸(又は垂直軸)と平行になるようにスキャン画像100全体を回転させ、回転した画像から水平又は垂直の直線のみを抽出する。これらの抽出した画像をスキャン正規化画像と呼ぶ(図10のスキャン正規化画像605参照)。ステップS304における詳細な処理については後述する。
次に、ステップS305では、帳票認識装置200は、ステップS304で生成されたスキャン正規化画像から帳票イメージに対応する所定の矩形領域を抽出し、抽出した所定の矩形領域と予め登録した帳票パターンとを比較する。本実施の形態では、帳票構造を直線のみでパターン化した帳票パターンと、抽出された所定の矩形領域とを照合し、一致するか否かで帳票を特定する方法を採用する。そのため、サイズや種類の異なる複数の帳票の帳票パターンが予めメモリ204等に格納されている。ステップS305における詳細な処理については後述する。
次に、ステップS306では、帳票認識装置200は、ステップS305における比較の結果、帳票パターンと一致するものがあるか否かを判断し、帳票パターンと一致するものあるときは、ステップS307へ進む。一方、帳票パターンと一致するものがなかったときは、ステップS309へ進む。
ステップS307では、帳票パターンと一致する部分(矩形領域)をスキャン画像100から抽出し、帳票データ保存領域240に帳票データとして格納する。そして、抽出した一致部分すなわち帳票イメージをスキャン画像100上から削除(又は除外)し、帳票イメージが存在していた画像部分をクリーンアップする。上述したように、例えば、抽出した帳票イメージの画像部分を背景色と同じ色で塗りつぶす。このように、スキャン画像100から帳票イメージが1枚ずつ抽出される度に該スキャン画像100が更新される。ステップS307における処理の詳細については後述する。
次に、ステップS308では、帳票認識装置200は、スキャン画像100から全ての帳票イメージの抽出が完了したか否かを判断する。スキャン画像100上に帳票イメージが存在しないと判断したときは、本処理を終了する。一方、スキャン画像100上に帳票イメージが存在していると判断したときは、ステップS303以降の処理を繰り返す。
一方、ステップS309では、「帳票パターン無し」のエラーメッセージ等を入出力装置206に表示して(ステップS308)、本処理を終了する。これは、予め登録されている帳票パターンにない帳票がスキャンされた場合やスキャン画像が不鮮明なために帳票イメージと帳票パターンとの照合に失敗した場合等が考えられる。なお、一致する帳票パターンがなかった帳票イメージを不詳帳票パターンとして保存し、処理を続行することも可能である。
また、帳票パターンは、直線で形成される輪郭を採用しているが、円のような曲線をパターンに取り入れることもできる。この場合は、帳票イメージにおいても、直線抽出だけではなく、輪郭抽出の技術手段を採用する必要がある。そして、直線や曲線であっても帳票パターンのすべての線とマッチした場合は照合成功となる。また、線の形のマッチングだけでなく、線種の照合、マッチング許容基準等の技術手段を加えれば、本発明の適用範囲が拡大し、より実用的になることは云うまでもない。
次に、図4のステップS304におけるスキャン画像データの正規化処理の詳細について説明する。
図5は、図4のステップS304におけるスキャン画像データの正規化処理の詳細を示すフローチャートである。図6は、図5の処理におけるスキャン画像の変遷を示す図である。なお、本処理は、CPU201がROM203から読み出した制御プログラムに基づいて実行される処理である。
図5において、ステップS401では、CPU201は、スキャン画像100から直線(直線画像)のみを抽出し、図6に示すようなスキャン直線画像602を生成する。直線の抽出方法としては、Hough変換法などの任意のアルゴリズムを利用する。この変換法により、直線判別(直線抽出)及び直線の傾き判別が可能になる。なお、直線か否かの判断基準は、線種や線の太さが異なる線、不鮮明部分等を含む線なども抽出可能なように設定される。
そして、CPU201は、抽出した各直線の両端(始点及び終点)の座標値と傾き角度を直線情報として図7(a)に示すような直線情報リスト1101に格納する。通常、複数の帳票イメージを含むスキャン画像100からは複数の直線が抽出されるので、直線情報1102〜1108のように、複数の直線情報が独立して格納される。直線情報リスト1101の各構成要素は1本の直線に対応する直線情報であり、図7(b)に示すように、例えば、直線情報1102には、スキャン画像100における直線の始点座標及び終点座標、並びに傾きθが格納される。
直線の始点座標及び終点座標は、図6に示すように、スキャン直線画像602の左端最下部614を原点(0,0)としたときの座標値(X,Y)である。例えば、直線601上の左端601aが直線の始点であり、右端601bが終点である。直線の傾きθ613は、例えば、直線の左端601aと交差する水平軸(X軸)に平行な仮想線611と、当該直線601の為す角度である。なお、仮想線611は垂直軸(Y軸)に平行であってもよい。
次に、ステップS402では、CPU201は、抽出された複数の直線のうちの1本の直線(直線α)に着目する。着目する直線の決め方は任意のアルゴリズムを用いてよい。例えば、スキャン直線画像602上のX軸座標(以下、「X座標」という。)の値Xを最小値とし、Y軸座標(以下、「Y座標」という。)の値Yを最小値から最大値まで変更し、その後、X座標の値Xを1つ増加させて再度Y座標の値Yを最小値から最大値まで変更する。このような方法で、スキャン直線画像602上を左上から右下にサーチしていく中で、最初に検出された直線を着目する直線αとして選択してもよい。本実施の形態では、スキャン直線画像602を左上からサーチして最初に検出した直線601を直線αとしている。
ステップS403では、CPU201は、フォーカスされた直線α(直線601)の始点及び終点の座標値、傾きθをRAM202に格納する。図6に示すように、始点及び終点の座標値は、スキャン直線画像602の左端最下部614を原点(0,0)としたときの直線αの左端601aと右端601bの各座標値となる。また、直線αの傾きθは、直線αの左端601aと交差するX軸方向に平行な仮想線611と直線αの為す角度θ613となる。
ステップS404では、直線αが水平軸(又は垂直軸)すなわち仮想線611に対して傾いているときは、直線αを含む帳票イメージも同じ角度で傾いているとみなし、直線αの左端601aを中心に直線αの傾きθ613が角度0°(X軸に対して傾き角0°)になるように、スキャン直線画像602全体を回転させる。これにより、スキャン直線画像602内に存在する直線αと同じ傾きを持った他の直線が傾きθ=0°となる。
次に、ステップS405では、CPU201は、スキャン画像100と同じ画像サイズで、何も画像が記録されていない仮想の白紙画像を用意するため、RAM202内にデータをクリアにしたメモリ空間を確保する。
ステップS406では、CPU201は、スキャン直線画像604上に存在するすべての直線に対して、その直線が水平または垂直か否かを判定する。すなわち、直線情報リスト1101上の各直線情報における傾きθを参照し、ステップS402で着目した直線αの傾きθ613と比較して、当該直線が平行又は直角であるかを判別する。この結果、その直線が平行又は直角であると判断したときは、当該直線を仮想の白紙画像上の同じ座標位置に描画する(ステップS407)。これにより、スキャン直線画像604から抽出された直線のうちの任意の直線に対して平行又は直角になる直線よりなる抽出直線画像が生成される。
一方、ステップS406の判別の結果、その直線が平行でも直角でもない場合、直線情報リスト1101上の全ての直線情報に対して判定が完了したか否かを判断し(ステップS408)、そうでないときは、リスト1101上の次の直線情報に移動してステップS406以降の処理を繰り返す。一方、全ての直線情報に対して判定が完了したときは、リターンする。これにより、直線αを含む抽出直線画像は、スキャン正規化画像605上で垂直及び水平の直線で構成される帳票イメージになる。
次に、図4のステップS305における、スキャン正規化画像605(抽出直線画像)から帳票イメージに対応する所定の矩形領域を抽出し、帳票イメージを特定する処理の流れについて説明する。
図9は、図4のステップS305における帳票イメージ特定処理の詳細を示すフローチャートである。図10〜図12は、図9の処理を説明するための図である。
図9において、ステップS901では、スキャン正規化画像605の縦方向(X軸と平行(水平方向))に上端から下端まで直線(直線画像)を検索し、スキャン正規化画像605の上下端を含む、検索した2本の直線に基づいて、仮想の分断線Mを設定して上方から順に番号を付与する。その一例を図10に示す。
図10において、スキャン正規化画像605上には、帳票イメージと推定される抽出直線画像801,802,803が存在しているものとする。
まず、スキャン正規化画像605の縦方向に、X軸に平行な直線を上端(図の上)から下端へ向かって検索していく。そして、最初に検索された直線804とスキャン正規化画像605の上端との中間位置にX軸平行分断線809(M=1)を仮想的に設定する。さらに、下方に向かってX軸に平行な直線を検索し、次に当たった直線805と前の直線804との中間位置にX軸平行分断線810(M=2)を仮想的に設定する。この動作を繰り返して、最終的には、スキャン正規化画像605の下端と最後の直線との間にX軸平行分断線811(M=MaxM、本実施形態ではMaxM=13)を設定する。例えば、図10に示すような3つの帳票イメージが存在するスキャン正規化画像の場合は、3つの帳票イメージのすべてが13本の水平直線で分断される。
次に、ステップS902では、スキャン正規化画像605の横方向(Y軸と平行(垂直方向))に左方から右方まで直線(直線画像)を検索し、スキャン正規化画像605の左右端を含む、検索した2本の直線に基づいて、仮想の分断線Nを設定して左方から順に番号を付与する。その一例を図11に示す。
図11において、ステップS901と同様な方法で、スキャン正規化画像605の横方向に、Y軸に平行な直線を左端(図の左)から右端へ向かって検索していく。そして、スキャン正規化画像605の左端から右端までの間に、Y軸平行分断線812(N=1)からY軸平行分断線822(N=MaxN、本実施形態ではMaxN=14)の仮想の分断線を設定する。なお、ステップS901,S902では、直線はすべて認識されており、また図5のステップS403において、スキャン正規化画像の回転角、座標位置はすべて把握されている。
次に、ステップS903では、仮想分断線のうちの水平方向の2本と垂直方向の2本の各交点を結んで矩形領域を抽出する。すなわち、水平方向の仮想分断線の任意の2本M1,M2(1≦M1<M2≦MaxM)と、垂直方向の仮想分断線の任意の2本N1,N2(1≦N1<N2≦MaxN)を選択し、M1,M2,N1,N2により囲まれた矩形領域、すなわちM1とN1の交点を座標(l,u)とM2とN2の交点を座標(r,b)に囲まれた矩形領域を抽出する。
次に、ステップS904では、メモリ204に格納された帳票パターンを1つずつ読み出し、読み出した帳票パターンを、図8に示すような1.〜4.の4つの向きにそれぞれ回転させる。スキャン画像100は、原稿台上にサイズや種類の異なる複数の帳票が無作為に置かれた状態で一度にスキャンされた画像であることから、各帳票イメージが任意の向きにそれぞれ傾いているのが通常である。また、傾いていない場合でも向きがある。そこで、帳票パターンの向きを回転させて、ステップS903で抽出した矩形領域と照合させることにより、より精度よく照合を行うことが可能となる。
1.上向き501(傾いていない場合)・・・傾き:0度
2.下向き502(上下逆転している場合)・・・傾き:180度
3.横向き503(左向きに置いている場合)・・・傾き:270度(503)
4.横向き504(右向きに置いている場合)・・・傾き:90度(504)
なお、本実施の形態では、スキャン画像100の左側からスキャンしていることから、帳票イメージの向きは、図8に示すように、501から508までの8つの向きがある。
ステップS905では、ステップS903で抽出された矩形領域と、ステップS904で回転させた帳票パターンとが一致するか否かを比較する。一致するか否かの判断は、帳票パターン内の垂直及び水平方向の直線と、矩形領域内の水平及び垂直方向の直線とを比較することにより行われる。この結果、一致しないときは、ステップS906へ進み、M1,M2,N1,N2の組み合わせを変更(座標(l,u)と座標(r,b)の変更)して、ステップS903に戻り、スキャン正規化画像605から新たな矩形領域を抽出する。ステップS903〜S906を繰り返し行うことにより、抽出した矩形領域と帳票パターンとが一致する場合は(ステップS905でYES)、リターンする。なお、ステップS906では、例えば、M1(=1),N1(=1),M2(=2),N2(=2)を最小値として矩形領域を広げていく方法であってもよいし、その逆であってもよい。
図12は、スキャン正規化画像605から帳票イメージを含む矩形領域が抽出された状態を示す図である。
図12において、スキャン正規化画像605では、X軸平行分断線の上方の任意の分断線810(u)、下方の任意の分断線811(b)、及びY軸平行分断線の左方の任意の分断線812(l)、右方任意の分断線813(r)の計4本の分断線で囲まれた矩形領域804が帳票パターンとの照合対象となる。これにより、分断線810、分断線811、分断線812、分断線813で囲まれた矩形領域804が生成される。
図13(a)では、スキャン画像100の一部である1個の帳票の画像データとして帳票イメージ701を図示してある。この帳票イメージに対応する帳票パターンが図13(b)で示す帳票パターン702である。枠を形成する線をパターン化しているが、必ずしも矩形とは限らず、2本の線で上下で囲むパターンをユーザが登録することもできる。
図13(a)において、帳票イメージ701は、スキャン画像100上の一つの帳票イメージである。この帳票イメージ701は、「技術者便覧」という帳票種であり、タイトル欄701a、技術者の顔写真欄701b、氏名・所属欄701c、及び技術経歴欄701dで構成される。本実施の形態では、枠組み輪郭を抽出したものである。
図13(b)において、帳票パターン702は、上述した「技術者便覧」という帳票種の帳票パターンである。帳票パターン702は、図9〜図11で説明したように、分断線4本で囲まれたスキャン正規化画像605の矩形領域804と照合される。照合方法は、直線の太さ、長さ、方向等について、ある程度の許容範囲内で一致するか否かで判定される。帳票イメージが、帳票パターン上のすべての線でマッチすれば、当該帳票パターンにより特定される帳票種とみなすことができる。ただし、スキャン正規化画像605と特定した帳票パターンの両者の縮尺を合わせてマッチングすることは云うまでもない。
また、図13(c)に示すように、帳票イメージ704は、枠710自体が帳票パターンを構成する要素であるにも関わらず、帳票パターン702と判断されてしまうおそれがある。そこで、帳票パターン702のように他の帳票パターンを含むパターンは、先に照合するというルール設定が必要になる。
また、線の種類(二重線、破線等)や、線の太さもマッチング対象にすれば、より正確なマッチングが可能になる。また、ある程度の短い線はノイズとみなすようにすれば、マッチング精度が高まる。
図14は、図4のステップS307における詳細な処理を示すフローチャートである。本処理は、登録された帳票パターンと一致した帳票イメージをスキャン画像100から切り出し、帳票データとして帳票データ保存領域240に格納する処理である。
図14において、ステップS1001では、CPU201は、スキャン画像データ格納領域230からスキャン画像データを読み出し、格納した直線αの傾き角度と座標に基づいて、一致した帳票パターンを回転させ、該帳票パターンで帳票イメージをスキャン画像100から切り出す。
次に、ステップS1002では、切り出した帳票イメージを再度、格納した直線αの傾き角度で回転させて正規化(補正)する。これを帳票データ保存領域240に格納する。格納領域への格納の形態については、1個ずつ切り出した帳票イメージ個々を名称無しの可変長レコードとしてファイリングしてもよい。より実用的には、帳票パターン名又はアプリケーション上の特定帳票名で分類するファイリング形態や、インデックス付きで、同一パターンの帳票を分類カタログするDBファイリング形態が考えられる。
次に、ステップS1003において、帳票パターンで切り出した帳票イメージ部分を消去する(帳票が無い場合の背景と同じデータで埋め込む)。これで、処理済みの帳票イメージは消去されたことになる。
ステップS1004では、帳票イメージを消去したスキャン画像データをスキャン画像データ格納領域に格納し、スキャン画像データを更新する。
上記実施の形態では、帳票を1つ認識する毎にその帳票イメージを削除する形態について説明した。しかしながら、帳票イメージから削除しなくても、スキャン画像上のその帳票イメージが存在する位置の座標を登録し、位置座標を登録した帳票イメージを除外して処理を進めるようにしてもよい。これにより、認識した帳票イメージを削除する処理を省略することができる。
また、上記実施形態では、抽出された任意の直線αの傾きに基づいてスキャン画像全体を回転させ、当該直線αを含む帳票イメージを水平又は垂直な向きに変更する形態について説明した。しかしながら、図10〜図11に示した仮想の分断線を直線αの傾きに基づいて設定するようにしてもよい。すなわち、任意の直線αの傾きに平行又は直角のそれぞれ2本の線より抽出される仮想の分断線で囲まれる矩形領域と帳票パターンとが一致することを確認することで、スキャン画像全体を回転させる処理を省略することができる。
上記実施の形態において、画像読取装置208は、画像読取機能を有する複合機であってもよい。
帳票認識装置200は、画像読取装置208と一体に構成された、画像読取機能や画像形成機能等を備える複合機であってもよい。
また、本発明の目的は、以下の処理を実行することによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出す処理である。
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、プログラムコードを供給するための記憶媒体としては、次のものを用いることができる。例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等である。または、プログラムコードをネットワークを介してダウンロードしてもよい。
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現される場合も本発明に含まれる。加えて、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
更に、前述した実施形態の機能が以下の処理によって実現される場合も本発明に含まれる。即ち、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行う場合である。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した各実施の形態の機能が実現される場合も本発明に含まれる。加えて、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部または全部を行い、その処理によって前述した実施の形態の機能が実現する場合も含まれる。
この場合、上記プログラムは、該プログラムを記憶した記憶媒体から直接、またはインターネット、商用ネットワーク、若しくはローカルエリアネットワーク等に接続された不図示の他のコンピュータやデータベース等からダウンロードすることにより供給される。
上記プログラムの形態は、オブジェクトコード、インタプリタにより実行されるプログラムコード、OS(オペレーティングシステム)に供給されるスクリプトデータ等の形態から成ってもよい。
本発明の実施形態に係る帳票認識装置のハードウェア構成を示すブロック図である。 画像読取装置の原稿台上に複数の帳票が無作為に置かれた状態を示す図である。 図2に示す状態でスキャンされた画像から各帳票画像を1つずつ抽出する一連の流れを示す図である。 図1の帳票認識装置にて実行される帳票認識処理を示すフローチャートである。 図4のステップS304におけるスキャン画像データの正規化処理の詳細を示すフローチャートである。 図5の処理におけるスキャン画像の変遷を示す図である。 (a)は直線情報リストの概要を示す図であり、(b)は直線情報リストに格納される直線情報の内容を示す図である。 帳票パターンの向きの一例を示す図である。 図4のステップS305における帳票イメージ特定処理の詳細を示すフローチャートである。 スキャン正規化画像の縦方向にX軸に平行な直線を検索して仮想の分断線を設定した状態の一例を示す図である。 スキャン正規化画像の横方向にY軸に平行な直線を検索して仮想の分断線を設定した状態の一例を示す図である。 矩形領域を抽出した状態を示す図である。 帳票パターンの一例を示す図である。 図4のステップS307の詳細な処理を示すフローチャートである。
符号の説明
100 スキャン画像
200 帳票認識装置
201 CPU
202 RAM
203 ROM
204 メモリ
208 画像読取装置
211,212,213,214 帳票

Claims (6)

  1. 複数種類の帳票を一度に画像読取装置で読み取ることにより得られる一の画像であって、当該複数種類の帳票イメージが配置される画像上から複数種類の帳票イメージを抽出する画像処理装置であって、
    前記画像上の任意の一の直線及び該直線に対して平行又は垂直となる直線から構成される矩形領域であって、前記画像処理装置に記憶されている帳票構造を直線成分によりパターン化した帳票パターンと照合することにより、当該矩形領域を構成する直線成分が前記帳票パターンの帳票構造と照合された矩形領域を、前記画像上の帳票イメージとして夫々特定する帳票イメージ特定手段と、
    前記帳票イメージ特定手段により特定された前記帳票イメージを、順次一の種類の帳票イメージとして抽出する帳票イメージ抽出手段と、
    前記帳票イメージ抽出手段により抽出された一の種類の帳票イメージの夫々を個々のファイルとして分けて記憶する記憶手段とを備えることを特徴とする画像処理装置。
  2. 前記帳票イメージ抽出手段により抽出された前記帳票イメージを前記画像から消去する消去手段を更に有し、
    前記帳票イメージ抽出手段は、前記消去手段により前記帳票イメージが消去された前記画像から、前記帳票イメージ特定手段により特定された帳票イメージが前記画像上からなくなるまで、前記帳票イメージを抽出する処理を繰り返すことを特徴とする請求項1記載の画像処理装置。
  3. 前記帳票イメージ抽出手段により抽出すべき帳票の帳票パターンを記憶する帳票パターン記憶手段を更に有し、
    前記帳票イメージ抽出手段は、前記帳票パターン記憶手段に予め記憶された帳票のパターンと前記抽出された帳票イメージとが一致するかを判断することにより、前記一の種類の帳票イメージを特定することを特徴とする請求項1または2記載の画像処理装置。
  4. 前記帳票イメージ特定手段は、前記特定した前記帳票イメージを包含する任意の仮想分断線を設定することにより、当該仮想分断線の一の直線および該直線に対して平行又は垂直となる直線を構成要素とする仮想分断線の矩形領域を夫々特定する矩形領域特定手段とを備え、
    前記帳票イメージ抽出手段は、前記画像上から、前記矩形領域特定手段により特定された仮想分断線の矩形領域に包含される一の種類の帳票イメージを夫々抽出することを備えることを特徴とする請求項1記載の画像処理装置。
  5. 複数種類の帳票を一度に画像読取装置で読み取ることにより得られる一の画像であって、当該複数種類の帳票イメージが配置される画像上から複数種類の帳票イメージを抽出する画像処理装置における画像処理方法であって、
    前記画像上の任意の一の直線及び該直線に対して平行又は垂直となる直線から構成される矩形領域であって、前記画像処理装置に記憶されている帳票構造を直線成分によりパターン化した帳票パターンと照合することにより、当該矩形領域を構成する直線成分が前記帳票パターンの帳票構造と照合された矩形領域を、前記画像上の帳票イメージとして夫々特定する帳票イメージ特定工程と、
    前記帳票イメージ特定工程にて特定された前記帳票イメージを、順次一の種類の帳票イメージとして抽出する帳票イメージ抽出工程と、
    前記帳票イメージ抽出工程にて抽出された一の種類の帳票イメージの夫々を個々のファイルとして分けて記憶手段に記憶する記憶工程とを備えることを特徴とする画像処理方法。
  6. 複数種類の帳票を一度に画像読取装置で読み取ることにより得られる一の画像であって、当該複数種類の帳票イメージが配置される画像上から複数種類の帳票イメージを抽出する画像処理装置実行させるためのプログラムであって、
    前記画像上の任意の一の直線及び該直線に対して平行又は垂直となる直線から構成される矩形領域であって、前記画像処理装置に記憶されている帳票構造を直線成分によりパターン化した帳票パターンと照合することにより、当該矩形領域を構成する直線成分が前記帳票パターンの帳票構造と照合された矩形領域を、前記画像上の帳票イメージとして夫々特定する帳票イメージ特定手段と、
    前記帳票イメージ特定手段により特定された前記帳票イメージを、順次一の種類の帳票イメージとして抽出する帳票イメージ抽出手段と、
    前記帳票イメージ抽出手段により抽出された一の種類の帳票イメージの夫々を個々のファイルとして分けて記憶する記憶手段としてコンピュータを機能させるためのプログラム。
JP2006352623A 2006-12-27 2006-12-27 画像処理装置及び方法、並びにプログラム Expired - Fee Related JP4388545B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006352623A JP4388545B2 (ja) 2006-12-27 2006-12-27 画像処理装置及び方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006352623A JP4388545B2 (ja) 2006-12-27 2006-12-27 画像処理装置及び方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2008167009A JP2008167009A (ja) 2008-07-17
JP4388545B2 true JP4388545B2 (ja) 2009-12-24

Family

ID=39695873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006352623A Expired - Fee Related JP4388545B2 (ja) 2006-12-27 2006-12-27 画像処理装置及び方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP4388545B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5462522B2 (ja) * 2009-05-07 2014-04-02 キヤノン株式会社 画像処理装置、画像処理方法、当該画像処理方法をコンピュータに実現させるためのプログラム
JP5339308B2 (ja) * 2010-08-16 2013-11-13 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理方法、プログラム及び記録媒体。
JP6404598B2 (ja) * 2014-05-28 2018-10-10 Necプラットフォームズ株式会社 画像形成装置、画像形成システム、画像形成方法及びプログラム
EP3149659A4 (en) 2015-02-04 2018-01-10 Vatbox, Ltd. A system and methods for extracting document images from images featuring multiple documents
US10321014B2 (en) 2015-09-29 2019-06-11 Kyocera Document Solutions Inc. Image reading apparatus and image forming apparatus, comprising at least a mode reception and a selection of at least a quality first mode or a speed first mode
US10558880B2 (en) 2015-11-29 2020-02-11 Vatbox, Ltd. System and method for finding evidencing electronic documents based on unstructured data
US11138372B2 (en) 2015-11-29 2021-10-05 Vatbox, Ltd. System and method for reporting based on electronic documents
US10509811B2 (en) 2015-11-29 2019-12-17 Vatbox, Ltd. System and method for improved analysis of travel-indicating unstructured electronic documents
JP6631249B2 (ja) * 2015-12-28 2020-01-15 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理システム、制御方法、及びプログラム
JP6957889B2 (ja) * 2017-02-08 2021-11-02 富士フイルムビジネスイノベーション株式会社 画像処理装置及び画像処理プログラム
JP6695638B2 (ja) * 2017-03-16 2020-05-20 富士通フロンテック株式会社 画像処理プログラム、画像処理装置および画像処理方法
JP7135544B2 (ja) * 2018-07-31 2022-09-13 ブラザー工業株式会社 プリンタドライバ
JP7460948B2 (ja) * 2020-03-02 2024-04-03 京セラドキュメントソリューションズ株式会社 画像形成装置
CN113763439A (zh) * 2021-02-07 2021-12-07 北京沃东天骏信息技术有限公司 图像处理方法和装置

Also Published As

Publication number Publication date
JP2008167009A (ja) 2008-07-17

Similar Documents

Publication Publication Date Title
JP4388545B2 (ja) 画像処理装置及び方法、並びにプログラム
KR102403964B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 저장 매체
JP3170299B2 (ja) 画像読取処理装置
US20070168382A1 (en) Document analysis system for integration of paper records into a searchable electronic database
JP4557765B2 (ja) 画像処理装置およびその方法
JP5357612B2 (ja) 下線除去装置
JPH08293001A (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
US20230273952A1 (en) Image processing apparatus, image processing method, and storage medium
US20180174324A1 (en) Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor
JP4834351B2 (ja) 文字認識装置及び文字認識方法
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
US20020051574A1 (en) Character recognition method, program and recording medium
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP3733310B2 (ja) 文書書式識別装置および識別方法
CN101520788B (zh) 图像文件分类方法、图像文件分类设备和计算机程序产品
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP4628278B2 (ja) 表認識装置、及びコンピュータプログラム
JP2006277151A (ja) 文字列画像切出装置、文字列画像切出方法およびプログラム
JPH1063744A (ja) 文書のレイアウト解析方法及びシステム
JP3090070B2 (ja) 帳票識別方法及び装置
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JP4648084B2 (ja) 記号認識方法及び装置
JPWO2020044537A1 (ja) 画像照合装置、画像照合方法、及びプログラム
JP5248074B2 (ja) 楽譜認識装置、楽譜認識方法、及びコンピュータプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090929

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091002

R150 Certificate of patent or registration of utility model

Ref document number: 4388545

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121009

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131009

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131009

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141009

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees