JP2013250927A - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法及び画像処理プログラム Download PDF

Info

Publication number
JP2013250927A
JP2013250927A JP2012127092A JP2012127092A JP2013250927A JP 2013250927 A JP2013250927 A JP 2013250927A JP 2012127092 A JP2012127092 A JP 2012127092A JP 2012127092 A JP2012127092 A JP 2012127092A JP 2013250927 A JP2013250927 A JP 2013250927A
Authority
JP
Japan
Prior art keywords
frame
image data
frame region
ruled line
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012127092A
Other languages
English (en)
Inventor
Masaru Sekiguchi
優 関口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2012127092A priority Critical patent/JP2013250927A/ja
Publication of JP2013250927A publication Critical patent/JP2013250927A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】帳票画像データにある表中の同一パターンで反復配置されている枠に対して、1回の手動操作で複数の枠領域を抽出する。
【解決手段】帳票原稿から画像データを取得して表示画面上に表示し、表示画面上への手動操作を検出する。当該画像データを帳票画像データと定義し、帳票画像データの表領域の中にある上下左右の枠線の内側を枠領域と定義し、帳票画像データにある表中の任意の枠がドラッグ操作に応じて指定された場合、指定された箇所の座標値を検出し、当該座標値から枠領域を抽出する。帳票画像データにおいて同一の形状が並べてある複数の枠がドラッグ操作に応じて指定された場合、複数の枠から任意の箇所の枠を1つ選択し、選択された箇所の座標値を検出し、当該座標値から1つの枠領域を抽出し、当該1つの枠領域に対して、ドラッグ操作に応じて指定された方向へ同一形状の枠領域を繰り返し抽出し、枠領域データを出力する。
【選択図】図3

Description

本発明は、帳票画像処理に用いる枠領域データを生成するのに好適な画像処理装置、画像処理方法及び画像処理プログラムに関する。
従来の画像処理装置にあっては、図14に示すように、モニタの表示画面上に表示された、各行に同じパターンが配置されている帳票画像に対して、手動操作で帳票認識用領域を指定していた。しかし、操作者が1つ1つの領域を手動操作で指定するには、多大な操作時間を必要としていた。
また、図14に示すように、同じ形状の罫線が連続して配置している帳票画像データからテンプレート用帳票画像データ、もしくはデータベース化されたテンプレート用帳票データを作成する場合、帳票画像中の罫線に対して罫線抽出処理を行い、罫線の分布から枠領域を抽出する技術が知られている。これにより、入力帳票画像データ中の特定の枠線を手動操作で設定する場合と比較して、余分な作業を行うこと無く、枠領域を抽出することができていた。
特許文献1には、文字記入枠内にデータが記入されていない帳票のマスタ画像に基づいて、その帳票定義データを自動的に作成する目的と、帳票のマスタ画像に基づいて、より詳細な帳票定義情報を含む帳票定義データを自動的に作成する目的が開示されている。
また、入力された帳票のマスタ画像上の文字記入枠などの領域を指定し、指定された各領域の周辺部分の罫線特徴をマスタ画像より抽出し、予め定められた帳票定義書式に従って、少なくとも各領域に関する領域情報と罫線特徴を整理し、帳票定義データとして出力するという構成が開示されている。
さらに、帳票画像データからテンプレート用帳票画像データを作成するという点が開示されている。
特許文献2には、帳票の各項目の定義情報(テンプレートデータ)を自動認識する目的と、帳票の各項目の並びを解析して、各項目の属性を決定する目的とが開示されている。
また、帳票画像データから帳票の縦罫線及び横罫線で構成される最小矩形を抽出し、最小矩形の帳票の行方向の接続関係から、表の各行を構成する論理行に分類し、連続して且つ同じ行構造を持つ論理行を1つのブロックにまとめておく。表の上部及び下部に接続するブロック間で、同じ列構造を持つブロックの関係を抽出し、同一の列構造を持つブロックを、論理列の単位でまとめ、論理行、ブロック、論理列に解析された表構造から、属する行数が最大であるブロックをボデイ部分として決定する。そのブロックの上部及び下部に位置するブロックを、ヘッダ部、フッタ部として決定し、ヘッダ部の論理行を見出し部分とし、見出し部分の文字を論理列単位で文字認識して、論理列単位の見出し部分の属性を決定し、論理列単位の見出し部分の属性から、ボデイ部分の論理列における最小矩形の属性を決定するという構成が開示されている。
これにより、枠線の形状が連続して配置している帳票画像データからテンプレート用帳票画像データを作成し、帳票画像データ全体に対して自動で枠領域を抽出することができる。
しかしながら、特許文献1にあっては、同じ形状の枠が連続して配置している帳票画像データに対して、枠領域を抽出するには多大な処理時間がかかるといった問題があった。
また、特許文献2にあっては、手動操作で枠領域を設定したい場合や、一部箇所の枠領域を設定したい場合には、かえって処理時間が増加することになり、効率よく枠領域を設定することができないといった問題があった。
さらに、従来の技術にあっては、帳票画像データからテンプレート用帳票画像データを手動操作で作成する場合、1つ1つ枠領域を作成する必要があり、多大な手間がかかるといった問題があった。
図14に示すように、行が繰り返し配置されている帳票画像データに対して、帳票画像データ中の特定の枠線を手動操作で設定する場合、従来の技術では、画像全体に対して処理するため、余分な枠領域が抽出される、あるいは1つ1つ枠領域を設定する必要があり、作業効率が低下するといった問題があった。
そこで、作業者に余分な手動操作を強いることなく、帳票画像データにある表中の同一パターンで反復配置されている枠に対して、1回の手動操作で複数の枠領域を抽出することができる画像処理装置の提供が切望されている。
本発明は、このような事情に監みてなされたもので、帳票画像データにある表中の同一パターンで反復配置されている枠に対して、1回の手動操作で複数の枠領域を抽出することができる画像処理装置、画像処理方法及び画像処理プログラムを提供することを目的としている。
上記課題を解決するために、本発明の画像処理装置は、帳票画像処理に用いる枠領域データを生成する画像処理装置であって、帳票原稿から画像データを取得する画像取得手段と、前記画像取得手段によって取得された前記画像データを表示画面上に表示する画像表示手段と、前記表示画面上への手動操作を検出する操作検出手段と、前記画像取得手段によって取得された前記画像データを帳票画像データと定義し、前記帳票画像データの表領域の中にある上下左右の枠線の内側を枠領域と定義し、前記帳票画像データにある表中の任意の枠が前記手動操作に応じて指定された場合に、指定された箇所の座標値を検出し、検出された当該座標値から枠領域を抽出する単枠領域抽出手段と、前記帳票画像データにおいて同一の形状が並べてある複数の枠が前記手動操作に応じて指定された場合に、前記複数の枠から任意の箇所の枠を1つ選択し、選択された箇所の座標値を検出し、検出された当該座標値から1つの枠領域を抽出し、当該1つの枠領域に対して、前記手動操作に応じて指定された方向へ同一形状の枠領域を繰り返し抽出する複数枠領域抽出手段と、前記枠領域データを出力する結果出力手段と、を有することを特徴とする。
本発明によれば、取得された画像データを帳票画像データと定義し、帳票画像データの表領域の中にある上下左右の枠線の内側を枠領域と定義し、帳票画像データにある表中の任意の枠が手動操作に応じて指定された場合に、指定された箇所の座標値を検出し、検出された当該座標値から枠領域を抽出し、画像データにおいて同一の形状が並べてある複数の枠が手動操作に応じて指定された場合に、複数の枠から任意の箇所の枠を1つ選択し、選択された箇所の座標値を検出し、検出された当該座標値から1つの枠領域を抽出し、当該1つの枠領域に対して、手動操作に応じて指定された方向へ同一形状の枠領域を繰り返し抽出することで、帳票画像データにある表中の同一パターンで反復配置されている枠に対して、1回の手動操作で複数の枠領域を抽出することができる。
本発明の実施形態に係わる画像処理装置のハードウエアのブロック構成を示す図である。 図1に示す画像処理装置1に適用可能な画像処理機能ブロック31を示す図である。 本発明の実施形態に係わる画像処理装置の動作を示すメインルーチンのフローチャートである。 本発明の実施形態に係わる画像処理装置の動作を示すサブルーチンのフローチャートである。 表示画面に表示した入力帳票画像に対してドラッグ操作したことを示す説明図である。 (a)、(b)は、入力帳票画像を構成する各部について説明するための図である。 複数の枠領域抽出を行う際の指定線データを操作入力したことを示す説明図である。 図7に示す軌跡を0.1秒の時間間隔でサンプリングした座標値を示す図である。 枠領域抽出について説明するための説明図である。 様々な罫線のパターンを示す図である。 (a)、(b)は、罫線領域の定義について説明を容易にするため罫線に沿って空白があるように示した図である。 指定線が縦方向の場合に、枠領域を反復配置することを示す図である。 指定線が横方向の場合に、枠領域を反復配置することを示す図である。 各行が同じパターンで配置されている帳票画像の例を示す図である。
本発明の実施形態について説明する。本実施形態では、帳票画像データ中の表に対して、特定の枠線に対する枠領域を抽出する処理に際して、同一の形状が並べてある少なくとも1個以上の複数の「枠」に対して、ユーザが複数の枠をドラッグしたとき、軌跡中のサンプリングした箇所で枠検出を行い、重複した位置が検出されたら1つの枠と判断し、そうでないときは別の位置を枠領域抽出処理部に渡す処理を繰り返すことで、1個の枠領域を抽出することとし、1個の枠領域に対して、ユーザが指定した方向へ同一形状の枠領域で反復配置することを特徴とする。
以下、本発明の実施形態について、図面を参照して説明する。
図1を参照して、本発明の実施形態に係わる画像処理装置1のハードウエアのブロック構成について説明する。
画像処理装置1は、据え置き型コンピュータ、複写機、組み込み端末、電子計算機、画像データベース装置、タブレット端末、スマートフォン端末、携帯情報機器などを想定することができる。
画像処理装置1は、ROM(図示しない)又はハードディスク20からプログラムを読み出して装置全体の制御を実行するCPU10と、原稿台上に置かれた例えば紙体の原稿から画像データを読み取るスキャナ部11と、デジタルカメラ(図示しない)で撮影したカメラ画像や処理結果の情報を記憶するハードディスク20やCD/DVD/メモリカードなどの外部記憶部12と、スキャナ部11又は外部記憶部12から原稿ファイルを読み取った入力画像を記憶する入力画像メモリ部13と、入力画像をモニタの表示画面上にプレビュー表示する表示部14と、表示部14の表示画面の表層に配置されたタッチパネルに対するユーザによるクリック操作やタップ操作やドラッグ操作等を入力するとともに、該操作時の座標データを入力する操作部15と、入力画像をVRAM上に記憶しておき、VRAM上の画像データに対して位置あわせ処理、拡大縮小処理、回転処理、ノイズ付与・除去処理、スキュー補正処理などの画像処理を行う画像処理部16と、帳票のテンプレートデータを出力するテンプレート出力部17と、ネットワークNを介して外部から入力画像を取り込む一方、処理結果の情報をネットワークNを介して外部に配信する通信制御部18とを備えている。
次に、図2を参照して、図1に示す画像処理装置1に適用可能な画像処理機能ブロック31の各機能について説明する。なお、図2に示す円柱はデータベース、平行四辺形はデータを示すこととする。
画像処理機能ブロック31は、スキャナ部11、外部記憶部12、ネットワークNに接続されている通信制御部18にアクセスしてデータアクセス部33により取得された画像データ32を入力する画像入力部34と、画像入力部34により取得した画像データをVRAM上に記憶しておき、VRAMから読み出した画像データをモニタの表示画面上に表示する画像表示部35と、マウス(図示しない)や画像表示部35上に設けられたタッチパネルなどの入力デバイスに対してユーザにより指定された範囲を入力する範囲指定部36と、範囲指定部36に対してユーザが指定した範囲の入力を示す指定範囲入力37と、範囲指定部36に対して入力された指定線データ38を座標値に変換する座標値変換部39と、座標値を用いて罫線を抽出する罫線抽出処理部40と、罫線抽出処理部40で得られたデータから枠領域を抽出する枠領域抽出部41と、範囲指定部36によって得られた結果データを出力する結果出力部42と、ROM又はハードディスク20から読み出したプログラムに基づいて各部に処理を指示する処理制御部43とから構成されている。
なお、画像処理機能ブロック31の各部をソフトウエアモジュールから構成してもよい。また、処理制御部43に設けられたメモリ上に画像処理用のワークエリアを設け、当該ワークエリアに帳票画像データを展開しておき、後述する罫線抽出処理や枠領域抽出処理を行うこととする。
図3に示すメインルーチンのフローチャート及び図4に示すサブルーチンのフローチャートを参照して、本発明の実施形態に係わる画像処理装置1に適用可能な画像処理機能ブロック31の動作について説明する。
なお、本実施形態では、処理制御部43に設けられたメモリ上のワークエリアに展開された帳票画像データに対して、黒画素を探索することで罫線抽出処理や枠領域抽出処理を行うこととする。
まず、処理制御部43からの指示を受けた画像入力部34は、スキャナ部11、外部記憶部12、ネットワークNに接続されている通信制御部18にアクセスしてデータアクセス部33により取得された画像データ32を入力帳票画像データとして取得する(F301)。
ここで、入力帳票画像データとしては、図14に示すような帳票の画像データを扱うこととする。
次いで、入力帳票画像データ(図14参照)を画像表示部35に出力することでモニタの表示画面に表示させ、タッチパネルやマウスなどの入力デバイスを用いて範囲指定部36に対して指定範囲入力37を入力し、抽出したい枠を示す範囲を指定線データ38として指定する(F302)。
例えば、図5に示すように、モニタの表示画面に表示した入力帳票画像に対してユーザが指先47を上方(47a)から下方(47b)へ1回のドラッグ操作したこととする。この結果、範囲指定部36に抽出したい枠を示す範囲として指定線データ38が入力される。なお、ドラッグ操作とは、マウスやタッチパネルを使った操作法の1つであり、表示画面上でマウスポインタがウィンドウの枠やファイルのアイコンなどに重なった状態でマウスのボタンを押し、そのままの状態でマウスを移動させる操作を示す。
同時に、入力帳票画像データを処理制御部43に設けられたメモリ上のワークエリアに展開する。以降、罫線抽出処理や枠領域抽出処理では、当該ワークエリアに展開された帳票画像データに対して行う。
ここで、図6を参照して、入力帳票画像を構成する各部について説明する。図6(a)において、51は表領域、52は枠領域、53は文字領域を示している。また、図6(b)において、54は枠、55は枠線(右側の枠線)を示している。
ユーザが、図7に示すように、タッチパネルの表示画面上に対して、起点61での指先の押下から終点62での指先の押上に至るドラッグ操作により軌跡Lを指定した場合、範囲指定部36に指定線データ38が入力される。なお、図7は、複数の枠領域抽出を行う際の指定線データを操作入力したことを示す説明図である。
次いで、指定範囲を座標値化する(F303)。すなわち、処理制御部43からの指示を受けた座標値変換部39は、範囲指定部36から入力した指定線データ38の範囲を座標値として変換する。この場合、座標値変換部39は、任意の周期として例えば0.1秒でサンプリングして座標値を取得する。
図8に示す破線65は、図7に示す軌跡Lを例えば0.1秒の時間間隔でサンプリングした座標値の例であり、それぞれの座標値をTn(x,y)とする(nは序数)。
次いで、座標値Tnの全てを回ったか判断する(F304)。座標値Tnの全てを回っていない場合(F304 No)、確定済み枠領域があるか否かを判断する(F305)。確定済み枠領域がない場合(F305 「ない」)、ステップF306に進む。
次いで、罫線抽出処理部40は、座標値Tn(x,y)を基点に、上下左右方向に罫線を抽出し、枠領域抽出部41は、抽出された罫線を用いて枠領域77を作成する(図9、F306〜F309)。
概略的には、図9に示す、ユーザがクリック操作を行ったときの位置(図9では「×」で示す)について検証する。上方向71、下方向72、左方向73、右方向74の4方向のうちの1方向として、例えば、座標値Tn(x,y)から上方向に対して罫線の有無をスキャンし(F306)、罫線抽出処理部40は、座標値Tn(x,y)を用いて罫線を抽出し(F307)、未だスキャンしていない残りの方向があるか否かを判断し(F308)、未スキャン方向がある場合にはF306に戻り、残り方向のうちの1方向についてステップF306〜F308の処理を繰り返し、ステップF308において、上記4方向に対してスキャンが終了した場合にはF309に進む。枠領域抽出部41は抽出された罫線を用いて枠領域77を作成する(F308)。なお、図9は、枠領域抽出処理について説明するための説明図である。
なお、上述したステップF305〜F309での処理をサブルーチン化したのが図4に示すフローチャートである。
次に、図4に示すサブルーチンのフローチャートを参照して、本発明の実施形態に係わる画像処理装置1に適用可能な画像処理機能ブロック31による枠領域抽出処理について詳しく説明する。なお、罫線は図10で示すように、様々な罫線のパターンがある。
図10において、スキャン方向が上下方向の場合の罫線を示す。80の罫線は、想定している罫線である。81の罫線は、かすれの罫線を想定したものである。82の罫線は、下線が付加された文字列に対して誤検出した場合を想定したものである。83の罫線は、垂直方向の線は両端の罫線を示し、表の外周の罫線を簡略化したものである。
以下、上述した罫線80〜83に対する対応策を含めて説明する。
罫線Lx(xは方向を表し、t、b、l、rいずれかが代入される。図11参照)に対して、下記情報を測定する。
罫線領域Ltは、連結した黒画素(画像データ上の画像)の外接線を囲むように設定する。
図11(a)は、罫線領域の定義について説明を容易にするため罫線に沿って空白があるように示した図である。図11(b)には、連結した黒画素(画像データ上の画像)の外接線85を囲むように設定された場合と、連結した黒画素(画像データ上の画像)を外接線86で囲むように設定しても黒画素が傾斜された場合とを示す。実際の罫線領域は図10に示す種別の罫線80〜83である。
<指定線が垂直方向である場合の罫線抽出処理>
まず、方向別に画像データをスキャンする。ここで、スキャンとは、座標値を起点に、上下左右方向に罫線の有無をスキャンすることをいう。
上方向にスキャンした場合を例にとって説明する(F401)。罫線抽出処理部40は、罫線Laを抽出する。罫線Laの両端に垂直方向の罫線の有無を探索し(F402)、両端の罫線の有無を判断する(F403)。スキャン方向が左右方向の罫線Laの場合、垂直方向の罫線の有無を探索することになる。
ステップF403において、罫線Laの左右端に罫線Ll、Lrの両方ともが存在する場合(F403で「両端に罫線がある」)、かつ罫線Ll、Lrの長さが、表の高さに相当する値である場合、罫線Laを「確定罫線」と決定してラベルを付与する(F404)。
次いで、全方向の罫線が確定しているか、すなわち、残っているスキャン方向(上下左右方向のいずれか)の罫線が確定しているかどうか判定する(F413)。
全方向すなわち上下左右方向の罫線が確定している状態である場合(F413でYes)、Lt、Lb、Ll、Lrから枠領域を作成する(F416)。次いで、メインルーチンへ復帰し、ステップF310へ進む。
罫線Laの左右端に罫線Ll、Lrの片方だけ存在し、かつ罫線Ll、Lrの長さが、表の高さに相当する値である場合、罫線Laは「未確定罫線」(F405)と決定してラベルを付与して、隣接罫線Lbを探索する(F406)。
なお、上記「隣接罫線」とは、罫線Laから一定値以内(すなわち、近くに存在するもの)にある同一方向の罫線のことを指す。従って、近くに存在しても、方向が異なっている罫線(垂直方向の罫線)は隣接罫線といわない。
隣接罫線Lbの有無を探し、隣接罫線Lbの有無を判断する(F407)、隣接罫線Lbがある場合(F407 「罫線がある」)、罫線Laと隣接罫線Lbを統合する(F408)。その後、統合された罫線を確定する(F404)。隣接罫線がない場合(F407 「罫線がない」)、罫線Laを「保留罫線」として決定してラベルを付与する(F412)。
一方、ステップF403において、罫線Laの左右端に罫線Ll、Lr両方とも存在しない場合(F403 「罫線がない」)、罫線Laは「未確定罫線」(F409)と決定してラベルを付与して、スキャン方向上の別の罫線を探索する(F410)。具体的には、上方向にスキャンした場合、罫線Laを抽出したときの座標値より上側をスキャンするということである。
再スキャンしたときの罫線の有無を判断し(F411)、罫線がある場合(F411 「罫線がある」)、ステップF403の処理に戻り、もう一度両端の罫線を探索する。一方、罫線がない場合(F411 「罫線がない」)、保留罫線として決定してラベルを付与しておく(F412)。
ステップF412において、保留罫線を決定した場合に、上下左右いずれかの別方向へのスキャンの有無を判定する(F414)。ここで、未だスキャンを実行していない未スキャン方向がある場合(F414 Yes)、当該未スキャン方向へのスキャンを実行するためステップF401へ戻る。上下左右いずれかの方向へのスキャンが完了している場合(F414 No)、抽出された罫線Lt、Lb、Ll、Lrは全て保留罫線となり、次の座標値Tnに進み(F417)、メインルーチンへ復帰しステップF310へ進む。
枠領域は、図11に示すように、罫線抽出処理で得られた罫線領域の座標を統合し、かつ罫線の内側になるように算出するものである。
以上の処理により、始めに1番目の枠領域S1(xs,ys,xe,ye)が確定される。なお、以下の処理においはn番目の枠領域Snが確定したこととして説明する。
次いで、枠領域Sn(xs,ys,xe,ye)が確定した場合、枠領域Snの内側にある座標値Tnを全て削除して取り除く。これは、既に確定した枠領域Snがあるため、再度、枠領域Snの内側にある座標値に対して繰り返し処理を実行させないことで、処理時間の短縮化を図ることができる。
図3に戻り、枠領域Snの内側にある座標値Tnを全て削除して取り除かれた後の座標値グループにおいて、次の座標値に進む(F310)。
次の座標値においては、確定した枠領域Snが存在するため、確定した枠領域Sn(xs,ys,xe,ye)に基づいて、幅(|xs−xe|)を求め、高さ(|ys−ye|)を求め、この値を参照用領域R(width,height)とする。参照用領域Rは、以下のルールによって配置される。
指定線が縦方向のときは、枠領域Snのxsとxeの値が一定である。そこで、図12に示すように、枠領域S1(xs,ys,xe,ye)の参照用領域R(width,height)を下方向に移動して枠領域S2、S3として反復配置する。すなわち、枠領域S1のys値に対して、高さは「height + 罫線の太さ」周期で下方向に参照用領域R(width,height)を移動して枠領域S2、S3として反復配置することで、枠領域S2、S3を抽出することができる。
この結果、帳票画像データにおいて同一の形状が並べてある複数の枠が手動操作に応じて指定された場合に、複数の枠から任意の箇所の枠を1つ選択し、選択された箇所の座標値を検出し、検出された当該座標値から1つの枠領域を抽出し、当該1つの枠領域に対して、手動操作に応じて指定された方向へ同一形状の枠領域を繰り返し抽出することができる。
なお、図12に示す指定線の場合は、起点での押下から終点での押上に至る指定線の方向が下方向であるため、縦方向として処理して配置することになる(F311)。
全ての座標値T1〜Tnに関する処理が終了した場合(F304 Yes)、結果出力部42より枠領域を出力する(F312)。
<指定線が横方向である場合の罫線抽出処理>
横方向についても、縦方向の処理と同様の処理を実行して枠領域を抽出する。具体的には、罫線Lx(xは方向を表し、t、b、l、rいずれかが代入される。図11参照)に対して、下記情報を測定する。
まず、方向別に画像データをスキャンする。ここで、スキャンとは、上述したように、座標値を起点に、上下左右方向に罫線の有無をスキャンすることをいう。
上方向にスキャンした場合を例にとって説明する(F401)。罫線抽出処理部40で、罫線Laを抽出する。罫線Laの両端に垂直方向の罫線の有無を探索し(F402)。両端の罫線の有無を判断する(F403)。ここで、スキャン方向が左右方向の罫線Laの場合、垂直方向の罫線の有無を探索することになる。
ステップF403において、罫線Laの左右端に罫線Ll、Lrの片方だけが存在し、かつ罫線Ll、Lrの長さが、表の高さに相当する値である場合、罫線Laは「未確定罫線」(F405)と決定してラベルを付与して、隣接罫線Lbを探索する(F406)。
なお、本実施形態における「隣接罫線」とは、罫線Laから一定値以内(すなわち、近くにあるもの)にある同一方向の罫線のことを指す。従って、近くにあっても、方向が異なっている罫線(垂直方向の罫線)は隣接罫線といわない。
隣接罫線Lbの有無を探索し、隣接罫線Lbの有無を判断する(F407)、隣接罫線Lbがある場合(F407 「罫線がある」)、罫線Laと隣接罫線Lbを統合する(F408)。その後、統合された罫線を確定する(F404)。一方、隣接罫線がない場合(F407 「罫線がない」)、罫線Laを「保留罫線」として決定してラベルを付与する(F412)。
一方、ステップF403において、罫線Laの左右端に罫線Ll、Lr両方とも存在しない場合(F403 「罫線がない」)、罫線Laは「未確定罫線」(F409)と決定してラベルを付与して、スキャン方向上の別の罫線を探索する(F410)。具体的には、上方向にスキャンした場合、罫線Laを抽出したときの座標値より上側をスキャンするということである。
再スキャンしたときの罫線の有無を判断し(F411)、罫線がある場合(F411 「罫線がある」)、ステップF403の処理に戻り、もう一度両端の罫線を探索する。一方、罫線がない場合(F411 「罫線がない」)、保留罫線(F412)としておく。
ステップF412において、保留罫線を決定した場合、上下左右いずれかの別方向へのスキャンの有無を判定する(F414)。ここで、未だスキャンを実行していない未スキャン方向がある場合、当該未スキャン方向へのスキャンを実行する(F415)。上下左右いずれかの方向へのスキャンが完了している場合(F414 No)、抽出された罫線Lt、Lb、Ll、Lrは全て保留罫線となり、次の座標値Tnに進み(F417)、メインルーチンへ復帰し、ステップF310へ進む。
枠領域は、図11で示すように、罫線抽出処理で得られた罫線領域の座標を統合し、かつ罫線の内側になるように算出するものである。
以上の処理により、枠領域Sn(xs,ys,xe,ye)が確定される。
なお、この段階まで(緑文字で囲んだ箇所)は、縦方向と全く同じ処理内容である。
枠領域Sn(xs,ys,xe,ye)が確定した場合、枠領域Snの内側にある座標値Tnを全て取り除く。これは、既に確定した枠領域Snがあるため、枠領域Snの内側にある座標値に対して繰り返し処理をしないことで、処理時間の短縮化を図ることができる。
図3に戻り、取り除かれた後の座標値グループで、次の座標値Tnに進み(F310)、ステップF304へ戻る。
次の座標値Tnにおいては、確定した枠領域Snが存在するため(F305 「ある」)、確定した枠領域Snの幅・高さを求め、この値を参照用領域R(width,height)とする。参照用領域Rは、以下のルールによって配置される。
図13に示すように、指定線が横方向にある場合は、枠領域Snのysとyeの値が一定である。ここで、枠領域S1(xs,ys,xe,ye)の参照用領域R(width,height)を下方向に移動して枠領域S2、S3として反復配置する。すなわち、枠領域S1のxs値に対して、幅は「width+罫線の太さ」周期で右方向に参照用領域R(width,height)を移動して枠領域S1を枠領域S2、S3として反復配置することで、枠領域S2、S3を抽出することができる(F311)。
全ての座標値T1〜Tnに関する処理が終えた場合(F304 Yes)、結果出力部42は枠領域を出力する(F312)。
この結果、帳票画像データにおいて同一の形状が並べてある複数の枠が手動操作に応じて指定された場合に、複数の枠から任意の箇所の枠を1つ選択し、選択された箇所の座標値を検出し、検出された当該座標値から1つの枠領域を抽出し、当該1つの枠領域に対して、手動操作に応じて指定された方向へ同一形状の枠領域を繰り返し抽出することができる。
本実施形態によれば、取得された画像データを帳票画像データと定義し、帳票画像データの表領域の中にある上下左右の枠線の内側を枠領域と定義し、帳票画像データにある表中の任意の枠が手動操作に応じて指定された場合に、指定された箇所の座標値を検出し、検出された当該座標値から枠領域を抽出し、画像データにおいて同一の形状が並べてある複数の枠が手動操作に応じて指定された場合に、複数の枠から任意の箇所の枠を1つ選択し、選択された箇所の座標値を検出し、検出された当該座標値から1つの枠領域を抽出し、当該1つの枠領域に対して、手動操作に応じて指定された方向へ同一形状の枠領域を繰り返し抽出することで、入力帳票画像データにある表中の同一パターンで反復配置されている枠に対して、1回の手動操作で複数の枠領域を抽出することができる。
なお、本実施形態で説明した罫線抽出処理は、例えば、特許文献3の「罫線認識方法及び表処理方法」に記載されている技術を用いることとする。罫線抽出処理としては、具体的に、画像中の黒画素の連結性をもとに連続した黒画素に同じラベルを付与する。ラベリングされたラベル値が同一で、主走査方向又は副走査方向に連結していて、かつ妥当な長さ及び幅を持っているとき、罫線矩形データとして抽出する。抽出された少なくとも1つ以上の罫線矩形データ同士が交差している罫線矩形データを連結することにより、表単位の罫線を抽出することができる。
1…画像処理装置、10…CPU、11…スキャナ部、12…外部記憶部、13…入力画像メモリ部、14…表示部、15…操作部、16…画像処理部、17…テンプレート出力部、18…通信制御部、20…ハードディスク、31…画像処理機能ブロック、32…画像データ、33…データアクセス部、34…画像入力部、35…画像表示部、36…範囲指定部、37…指定範囲入力、38…指定線データ、39…座標値変換部、40…罫線抽出処理部、41…枠領域抽出部、42…結果出力部、43…処理制御部
特開2001−126010公報 特開2010−061693公報 特許3162414号

Claims (6)

  1. 帳票画像処理に用いる枠領域データを生成する画像処理装置であって、
    帳票原稿から画像データを取得する画像取得手段と、
    前記画像取得手段によって取得された前記画像データを表示画面上に表示する画像表示手段と、
    前記表示画面上への手動操作を検出する操作検出手段と、
    前記画像取得手段によって取得された前記画像データを帳票画像データと定義し、前記帳票画像データの表領域の中にある上下左右の枠線の内側を枠領域と定義し、前記帳票画像データにある表中の任意の枠が前記手動操作に応じて指定された場合に、指定された箇所の座標値を検出し、検出された当該座標値から枠領域を抽出する単枠領域抽出手段と、
    前記帳票画像データにおいて同一の形状が並べてある複数の枠が前記手動操作に応じて指定された場合に、前記複数の枠から任意の箇所の枠を1つ選択し、選択された箇所の座標値を検出し、検出された当該座標値から1つの枠領域を抽出し、当該1つの枠領域に対して、前記手動操作に応じて指定された方向へ同一形状の枠領域を繰り返し抽出する複数枠領域抽出手段と、
    前記枠領域データを出力する結果出力手段と、を有することを特徴とする画像処理装置。
  2. 前記単枠領域抽出手段は、枠領域が確定した場合には、当該枠領域の内側にある座標値を全て削除して取り除くことを特徴とする請求項1記載の画像処理装置。
  3. 前記複数枠領域抽出手段は、
    指定された方向が縦方向である場合には、前記単枠領域抽出手段により抽出された枠領域の幅と罫線の太さに基づいて、同一形状の枠領域を繰り返し抽出することを特徴とする請求項1記載の画像処理装置。
  4. 前記複数枠領域抽出手段は、
    指定された方向が横方向である場合には、前記単枠領域抽出手段により抽出された枠領域の高さと罫線の太さに基づいて、同一形状の枠領域を繰り返し抽出することを特徴とする請求項1記載の画像処理装置。
  5. 帳票画像処理に用いる枠領域データを生成する画像処理方法であって、
    帳票原稿から画像データを取得する画像取得ステップと、
    前記画像取得ステップによって取得された前記画像データを画像表示手段の表示画面上に表示する表示ステップと、
    前記表示画面上への手動操作を検出する操作検出ステップと、
    前記画像取得ステップによって取得された前記画像データを帳票画像データと定義し、前記帳票画像データの表領域の中にある上下左右の枠線の内側を枠領域と定義し、前記帳票画像データにある表中の任意の枠が前記手動操作に応じて指定された場合に、指定された箇所の座標値を検出し、検出された当該座標値から枠領域を抽出する単枠領域抽出ステップと、
    前記帳票画像データにおいて同一の形状が並べてある複数の枠が前記手動操作に応じて指定された場合に、前記複数の枠から任意の箇所の枠を1つ選択し、選択された箇所の座標値を検出し、検出された当該座標値から1つの枠領域を抽出し、当該1つの枠領域に対して、前記手動操作に応じて指定された方向へ同一形状の枠領域を繰り返し抽出する複数枠領域抽出ステップと、
    前記枠領域データを出力する結果出力ステップと、を有することを特徴とする画像処理方法。
  6. 請求項5記載のそれぞれの前記ステップをプロセッサに実行させることを特徴とする画像処理プログラム。
JP2012127092A 2012-06-04 2012-06-04 画像処理装置、画像処理方法及び画像処理プログラム Pending JP2013250927A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012127092A JP2013250927A (ja) 2012-06-04 2012-06-04 画像処理装置、画像処理方法及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012127092A JP2013250927A (ja) 2012-06-04 2012-06-04 画像処理装置、画像処理方法及び画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2013250927A true JP2013250927A (ja) 2013-12-12

Family

ID=49849497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012127092A Pending JP2013250927A (ja) 2012-06-04 2012-06-04 画像処理装置、画像処理方法及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP2013250927A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019095858A (ja) * 2017-11-17 2019-06-20 グローリー株式会社 帳票画像処理装置、帳票画像処理システム、帳票画像処理方法およびプログラム
CN110399060A (zh) * 2018-04-17 2019-11-01 卡西欧计算机株式会社 电子设备、信息处理方法及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160802A (ja) * 1993-12-10 1995-06-23 Hitachi Electron Eng Co Ltd Ocr用帳票フォーム作成処理装置
JPH1091720A (ja) * 1996-09-11 1998-04-10 Ricoh Co Ltd 領域指定方法、領域指定装置および記録媒体
JPH10111912A (ja) * 1996-10-08 1998-04-28 Sharp Corp 手書き文字記号検索装置及び手書き文字記号検索装置制御プログラムを記憶した媒体
JPH10162099A (ja) * 1996-11-28 1998-06-19 Internatl Business Mach Corp <Ibm> 矩形オブジェクトの認識方法及び認識装置、矩形オブジェクトの認識を行うプログラム・プロダクト
JP2001216468A (ja) * 2000-02-03 2001-08-10 Oki Electric Ind Co Ltd 文字認識装置
JP2001306559A (ja) * 2000-04-24 2001-11-02 Canon Inc 文書処理装置、方法、及び記憶媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07160802A (ja) * 1993-12-10 1995-06-23 Hitachi Electron Eng Co Ltd Ocr用帳票フォーム作成処理装置
JPH1091720A (ja) * 1996-09-11 1998-04-10 Ricoh Co Ltd 領域指定方法、領域指定装置および記録媒体
JPH10111912A (ja) * 1996-10-08 1998-04-28 Sharp Corp 手書き文字記号検索装置及び手書き文字記号検索装置制御プログラムを記憶した媒体
JPH10162099A (ja) * 1996-11-28 1998-06-19 Internatl Business Mach Corp <Ibm> 矩形オブジェクトの認識方法及び認識装置、矩形オブジェクトの認識を行うプログラム・プロダクト
JP2001216468A (ja) * 2000-02-03 2001-08-10 Oki Electric Ind Co Ltd 文字認識装置
JP2001306559A (ja) * 2000-04-24 2001-11-02 Canon Inc 文書処理装置、方法、及び記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019095858A (ja) * 2017-11-17 2019-06-20 グローリー株式会社 帳票画像処理装置、帳票画像処理システム、帳票画像処理方法およびプログラム
CN110399060A (zh) * 2018-04-17 2019-11-01 卡西欧计算机株式会社 电子设备、信息处理方法及存储介质
CN110399060B (zh) * 2018-04-17 2022-11-01 卡西欧计算机株式会社 电子设备、信息处理方法及存储介质

Similar Documents

Publication Publication Date Title
US7926732B2 (en) OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
CN100382096C (zh) 文档扫描设备及方法
US20090110288A1 (en) Document processing apparatus and document processing method
US20070168382A1 (en) Document analysis system for integration of paper records into a searchable electronic database
JP3113827B2 (ja) 矩形オブジェクトの認識方法及び認識装置
JP6558435B2 (ja) 測色装置および測色方法
JP2001203876A (ja) 文書修飾装置及び画像処理装置
JP5705060B2 (ja) 入力支援装置の表示装置、入力支援装置、入力支援装置における情報表示方法、入力支援装置における情報表示プログラム
JP2013250927A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2018160003A (ja) 画面差異検出装置及びプログラム
JP5794154B2 (ja) 画像処理プログラム、画像処理方法、及び画像処理装置
JP2019169182A (ja) 情報処理装置、制御方法、プログラム
JP5815434B2 (ja) マニュアル作成支援装置及びマニュアル作成支援方法
JP6700705B2 (ja) 振り分けシステム、情報処理方法、及びプログラム
JP2016219022A (ja) 表示装置及びプログラム
JP6446945B2 (ja) 非互換検出装置、非互換検出方法、及びプログラム
JP4867894B2 (ja) 画像認識装置、画像認識方法及びプログラム
JP4693167B2 (ja) 帳票検索装置、帳票検索方法、プログラム及びコンピュータ読み取り可能な記憶媒体
US9912834B2 (en) Document camera device and cutout assistance method
JP5666011B1 (ja) 方法及び電子機器
CN112463010A (zh) 信息处理装置及记录媒体
JP4548062B2 (ja) 画像処理装置
US20240185628A1 (en) Client terminal, control method for client terminal, and storage medium
JP5402417B2 (ja) 画像処理装置
JP2011197844A (ja) 差分検知システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150521

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160517

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161206