JP4810995B2 - 画像処理装置、方法及びプログラム - Google Patents

画像処理装置、方法及びプログラム Download PDF

Info

Publication number
JP4810995B2
JP4810995B2 JP2005341432A JP2005341432A JP4810995B2 JP 4810995 B2 JP4810995 B2 JP 4810995B2 JP 2005341432 A JP2005341432 A JP 2005341432A JP 2005341432 A JP2005341432 A JP 2005341432A JP 4810995 B2 JP4810995 B2 JP 4810995B2
Authority
JP
Japan
Prior art keywords
unit
image
background area
unit background
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005341432A
Other languages
English (en)
Other versions
JP2007148719A (ja
Inventor
勝彦 糸乘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2005341432A priority Critical patent/JP4810995B2/ja
Publication of JP2007148719A publication Critical patent/JP2007148719A/ja
Application granted granted Critical
Publication of JP4810995B2 publication Critical patent/JP4810995B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像処理の分野において、表を表した画像から表構造を抽出するための技術に関する。
従来、表を表した画像(以下、表画像という)からその表の構造を抽出するためには、表を構成する罫線を検出し、その罫線の組み合わせで生成される矩形情報を抽出することが必要であった(例えば特許文献1、2参照)。従来の方式では、画像中のどの線が表を構成する罫線であるかということを正確に認識しなければならないが、罫線の長さ、線種及び方向などは文書毎に異なるため、罫線を認識するための各種パラメータの最適化や制御などが必要とされていた。
特許文献1に記載の方式では、文書画像から文字行を検出し、検出した文字行をその行方向と垂直方向に分割して、各分割領域に行方向の射影パターンをそれぞれ作成し、射影パターンごとに行方向と垂直方向の黒ピーク値が閾値以上の場合に罫線有りと判定する。特許文献2に記載の方式では、2値画像上の一定値以上の長さを持つ黒ランを、注目した罫線方向について抽出し、黒ランの中で予め定められた距離内にある黒ランを統合した注目した罫線方向の罫線として抽出する。
特開平2−7183号公報 特開平9−34995号公報
特許文献1、2に記載された何れの方式であっても、水平方向及び垂直方向の罫線が比較的長い線分によって構成されていることを利用した技術であるため、罫線が短い場合には対処することができないおそれがある。また、何れの方式であっても文字が罫線に接触している場合には、文字と罫線とを判別することができず、誤った罫線が検出されてしまうおそれがある。
本発明は上記のような問題点に鑑みて為されたものであり、罫線の長さ、線種及び方向や、罫線と文字が接触しているか否かに依らず、従来よりも正確に表画像から表構造を抽出することができる技術を提供することを目的とする。
上記従来例の問題点を解決するため、本発明は、画像処理装置において、表画像を有する文書画像を入力する文書画像入力手段と、前記表画像の表を構成する罫線に途切れがあるか否かを判断する判断手段と、前記判断手段が前記表画像の表を構成する罫線に途切れがあると判断した場合には、当該途切れが無くなるまで、前記表画像または前記文書画像入力手段によって入力された文書画像を縮小する縮小手段と、前記表画像または前記縮小手段によって縮小された表画像から、表を構成する罫線によって囲まれた部分における背景領域の最小単位を単位背景領域として検出する単位背景領域検出手段と、前記単位背景領域内に表を構成する罫線以外の線で囲まれた背景領域が存在する場合には、該表を構成する罫線以外の線で囲まれた背景領域を前記単位背景領域に統合する単位背景領域統合手段と、前記単位背景領域間の位置関係を検出する単位背景領域関係検出手段と、前記単位背景領域間の位置関係から表構造を抽出する表構造抽出手段とを有することを特徴とする。このように、従来のように罫線そのものに基づいて表構造を抽出するのではなく、表画像から背景領域を用いて表構造を抽出するので、罫線の長さ、線種及び方向や、罫線と文字が接触しているか否かに依らず、従来よりも正確に表画像から表構造を抽出することができる。また、背景領域は、文字や点線、破線など罫線の線種より十分に大きいため、罫線の特徴(点線や破線の途切れ部分)が消滅する程度に画像を縮小して処理することにより、背景領域に対する認識精度を維持したまま、点線や破線の罫線を実線の罫線として取り扱うことができる。これにより、従来のような罫線を認識するための処理に必要なパラメータなどを変更するような特別な操作は必要なく、罫線の線種に依らずに表画像から背景領域を容易に検出することができる。また文字のつぶれや罫線の接触文字の影響も防ぐことができる。
さらに文書画像入力手段によって入力された文書画像から表画像を抽出する表画像抽出手段を有することで、表画像を有する入力画像から表画像を抽出することができる。
ここで背景領域検出手段は、前記表画像抽出手段によって抽出された表画像において背景を表す背景色を判定し、背景色と判定された領域を単位背景領域として検出するようにしてもよい。この場合表画像内で最も広い面積を占める色を背景色として判定することが好ましい。
ここで単位背景領域関係検出手段は、単位背景領域間の関係を各単位背景領域に対して座標を割り付けて単位背景領域間の隣接関係を特定することで、単位背景領域間の位置関係を検出することが好ましい。
また本発明の一態様に係る表構造抽出方法は、表画像を有する文書画像を入力する文書画像入力ステップと、前記表画像の表を構成する罫線に途切れがあるか否かを判断する判断ステップと、前記判断ステップにおいて前記表画像の表を構成する罫線に途切れがあると判断された場合には、当該途切れが無くなるまで、前記表画像または前記文書画像入力ステップによって入力された文書画像を縮小する縮小ステップと、前記表画像または前記縮小ステップにおいて縮小された表を構成する罫線によって囲まれた部分における背景領域の最小単位を単位背景領域として検出する単位背景領域検出ステップと、前記単位背景領域内に表を構成する罫線以外の線で囲まれた背景領域が存在する場合には、該表を構成する罫線以外の線で囲まれた背景領域を前記単位背景領域に統合する単位背景領域統合ステップと、前記単位背景領域から単位背景領域間の位置関係を検出する単位背景領域関係検出ステップと、前記単位背景領域間の位置関係から表構造を抽出し、記憶する表構造抽出ステップとを有することを特徴とする。
さらに本発明の一態様に係るプログラムは、コンピュータに、表画像を有する文書画像を入力する文書画像入力手順と、前記表画像の表を構成する罫線に途切れがあるか否かを判断する判断手順と、前記判断手順において前記表画像の表を構成する罫線に途切れがあると判断された場合には、当該途切れが無くなるまで、前記表画像または前記文書画像入力手順において入力された文書画像を縮小する縮小手順と、前記表画像または前記縮小手順において縮小された表を構成する罫線によって囲まれた部分における背景領域の最小単位を検出する単位背景領域検出手順と、前記単位背景領域内に表を構成する罫線以外の線で囲まれた背景領域が存在する場合には、該表を構成する罫線以外の線で囲まれた背景領域を前記単位背景領域に統合する単位背景領域統合手順と、前記単位背景領域から単位背景領域間の関係を検出する単位背景領域関係検出手順と、前記単位背景領域間の関係から表構造を抽出する表構造手順とを実行させることを特徴とする。
本発明によると、表画像から背景領域を用いて表構造を抽出するので、罫線の長さ、線種及び方向や、罫線と文字が接触しているか否かに依らず、従来よりも正確に表画像から表構造を抽出することができる。さらに単位背景領域検出手段によって検出された単位背景領域内に表を構成する罫線以外の線で囲まれた背景領域が存在する場合には、該表を構成する罫線以外の線で囲まれた背景領域を前記単位背景領域に統合する単位背景領域統合手段を有することで、例えば背景領域内に含まれる文字内の空白部分を単位背景領域に統合し、まとめて1つの単位背景領域とすることができる。また文書画像入力手段によって入力された文書画像を縮小して背景領域検出手段へ入力する縮小手段を有することで、罫線を認識する処理に必要なパラメータなどを変更するような特別な操作は必要なく、罫線の線種に依らずに表画像から背景領域を容易に検出することができ、文字のつぶれや罫線の接触文字の影響も防ぐことができる。
図1は、本発明の画像処理装置の実施の一形態を示すブロック構成図である。図中、101は文書画像入力部、102は表画像抽出部、103は表画像縮小部、104は単位背景領域検出部、105は単位背景領域統合部、106は単位背景領域関係検出部、107は表構造抽出部である。
文書画像入力部101は、スキャナなどを用い、プラテンガラスに載置された原稿上の画像を画像データとして取得する。表画像抽出部102は、文書画像入力部101で読み込まれた画像データから、表画像に相当する画像データと、表画像以外の画像に相当する画像データとを分離することで表画像を抽出する。表画像縮小部103は、抽出された表画像を縮小する。単位背景領域検出部104は、表画像から、表を構成する罫線によって囲まれた部分における背景領域の最小単位を単位背景領域として検出する。単位背景領域統合部105は、表を構成する罫線以外の線で囲まれた背景領域がどの単位背景領域に含まれるのかという包含関係を調べ、表を構成する罫線以外の線で囲まれた背景領域を、それを含む単位背景領域に統合する。単位背景領域関係検出部106は、単位背景領域間のそれぞれの位置関係を検出する。表構造抽出部107は、単位背景領域関係検出部106から検出された単位背景領域間のそれぞれの位置関係から表構造を抽出し、これを記憶する。
以上のように構成された画像処理装置の実施の一形態を示すブロック構成図の各部の処理について、図2を用いて説明する。文書画像入力部101は、スキャナなどを用い、載置された原稿上の画像を画像データとして取得する(ステップ201)。文書画像入力部101は、例えば原稿載置台、光源、ラインセンサ、A/D(アナログ/デジタル)変換器などからなる。文書画像入力部101は、1次元のCCDラインセンサを、ラインセンサの受光素子の並び方向(主走査方向)と直交する方向(副走査方向)に移動させることによって、原稿上の画像を読み取り、画像データとして出力する。もちろん、文書画像入力部101の読み取り方式は任意であり、原稿を移動させて読み取る方式などでも良い。
次に、表画像抽出部102は、入力された画像が表画像のみであるかを判断する(ステップ202)。表画像のみでない場合には(ステップS202;NO)、表画像抽出部102は、表画像を有する文書画像データから、表画像に相当する画像データと、表画像以外の画像に相当する画像データとを分離することで表画像を抽出する(ステップ203)。表画像のみである場合には(ステップS202;YES)、ステップS203をスキップしてステップS204の処理に移行する。
表画像の分離については、画像の属性を基に自動的に分離する表領域分離装置(例えば、特開平2−210586号公報参照)などがあり、公知の技術のため詳細な説明を省略する。また表画像の抽出は、例えば図3に示すパーソナルコンピュータなどの画像処理部302に備え付けられているディスプレイ上で、マウスに代表されるポインティングデバイスなどの画像指示部304により操作者が指定することにより行なってもよい。
次に、表画像縮小部103は、本発明の実施の一形態における処理の対象である表画像の罫線に途切れがあるかを判断する(ステップ204)。表画像の罫線に途切れがあると(つまり罫線が点線や破線であると)、後述する表を構成する罫線によって囲まれた部分における背景領域の最小単位を単位背景領域として検出できないからである。つまり、罫線に戸切れがあると、その途切れ部分によって背景領域が連なってしまい、1つ1つの単位背景領域を見分けることができなくなるからである。そこで、表画像の罫線に途切れがあるかを判断し、表画像の罫線に途切れがある場合には(ステップS204;YES)、表画像縮小部103により、表画像を縮小する(ステップ205)。この場合、表画像には罫線以外の線も含まれているが、表画像縮小部103は、画像中のどの線が罫線であるかを正確に認識する必要はなく、画像に含まれる線に途切れがあると判断した場合には、罫線に途切れがあると判断して表画像を縮小すればよい。背景領域は、文字や点線や破線の途切れ部分より充分に大きいので、表画像縮小部103により、表画像を点線や破線の特徴(途切れ)が無くなるまで画像を縮小して処理することにより、表画像の罫線に途切れの影響を受けずに、容易に点線、破線を用いている表画像から背景領域を取り出すことができる。このような処理を施すことで、従来技術で必要であった罫線の長さ、線種及び方向や、罫線と文字が接触しているか否かによって、操作者は、パラメータなどを変更するような操作は必要ない。なお、本発明の実施の一形態では、表画像のみに対して表画像縮小部103により表画像の縮小を行なったが、これに限られるものではなく、例えば文書画像入力部101によって入力された表画像を有する文書画像に対して上記のような縮小処理を行なってもよい。なお、表画像の罫線に途切れがない場合には(ステップS204;NO)、ステップS205の処理をスキップしてステップS206の処理に移行すればよい。
次に、単位背景領域検出部104は、表画像から表を構成する罫線によって囲まれた部分における背景領域の最小単位を単位背景領域として検出する(ステップ206)。単位背景領域検出部104は、まず表画像の背景を表す背景色を判定し、背景色と判定された領域を表画像から検出する。表画像においては、一般に文字あるいは罫線などの面積よりも背景領域の面積のほうが広いので、表画像で用いられている色の面積を計測して、最も広い面積を占める色を背景色とすることができる。背景色の判定は、例えば文書画像入力部101で原稿上の画像をレッド(R)、グリーン(G)、ブルー(B)等の3原色に色分解された電気信号により行なうことができる。表画像が白黒である場合には、一般に文字色は黒、背景色は白が用いられているので、背景色を白とすることもできる。
背景色として判定された画素は、表画像内で連結され、背景領域として検出される。背景領域の検出は、例えば連結している画素に同じラベルを付加することで複数の領域をグループとして分類するラベリング処理を用いることで実現できる。ラベリング処理により、連結する背景領域は、それぞれに番号が付加された外接矩形として表現することができる。例えば、図4の表画像401に対して、背景色と判定された画素に対してラベリング処理を行って背景色領域を取り出すと、単位背景領域402(図中、斜線で示した領域)が検出できる。
しかし、例えば図5の表画像500に対して単位背景領域検出部104による検出処理を適用すると、単位背景領域501(図中、各文字の外側に存在する斜線領域)が検出できる一方で、表を構成する罫線以外の線で囲まれた領域が背景領域502(つまり文字内の空白部分であって、図中の各文字の内側の斜線領域)をそれぞれ単位背景領域として検出することになる。一般に表画像内の文字は、罫線で囲われている矩形内に存在するため、矩形内の文字を一括して扱うには、これらの背景領域502を単位背景領域501と統合して、ひとまとまりの単位背景領域として検出するべきである。したがって、単位背景領域統合部105は、単位背景領域内に表を構成する罫線以外の線で囲まれた背景領域があるかを判断する(ステップ207)。そして、単位背景領域統合部105は、表を構成する罫線以外の線で囲まれた背景領域がある場合には(ステップS207;YES)、表を構成する罫線以外の線で囲まれた背景領域がどの単位背景領域に含まれるのかの包含関係を調べ、表を構成する罫線以外の線で囲まれた背景領域を、それを含む単位背景領域に統合する(ステップ208)。このような統合が行なわれることで、表画像500に対して単位背景領域601を検出することができる(図6参照)。なお、表を構成する罫線以外の線で囲まれた背景領域がない場合には(ステップS207;NO)、ステップS208の処理をスキップしてステップS209の処理に移行すればよい。
これら一連の処理を例えば図7(a)の表画像に対して施すことで、表画像から罫線画像を消去し、図7(b)に示す単位背景領域701を得ることができる。なお、図7(b)において、各々の単位背景領域のみならず各単位背景領域内の文字も図示しているのは、各単位背景領域とその領域に含まれていた文字との対応関係を示すためである。
次に、単位背景領域関係検出部106は、単位背景領域検出部104から検出、単位背景領域統合部105によって統合された単位背景領域701のそれぞれの位置関係を検出する(ステップ209)。例えば図8に示した表では、”注文日”に対して”2005年8月30日”という値が対応し、”発注番号”に”500365077”という値が対応している。このように、一般的な表においては、隣接する項目間に特定の対応関係がある。そこで、単位背景領域関係検出部106は、単位背景領域のそれぞれについての隣接関係(位置関係)を調べることで、項目間の対応関係を検出する。具体的には、単位背景領域検出部104は、図9に示すように、単位背景領域のそれぞれに一意の番号(単位背景領域番号)を割り付け、これらの単位背景領域番号と、各単位背景領域の位置座標とを対応付けていくことで単位背景領域の隣接関係(位置関係)を特定する。
ここで、図10は、各単位背景領域に2次元座標を割り付けるための処理のフローである。同図において、左上端を2次元(X−Y)座標の原点とし、単位背景領域の矩形情報を、矩形の左側のX座標:X、矩形の上側のY座標:Y、矩形の幅:W、矩形の高さ:Hによって表すものとする。まず、単位背景領域関係検出部106は、最小のX、Y座標を持つ単位背景領域を検出するために、X=1、Y=1、YY=−1と、それに対応する単位背景領域の矩形情報rRectを初期値として設定する(ステップ1001)。次に単位背景領域関係検出部106は、単位背景領域の座標に未割付領域が存在するかどうかを判断し(ステップ1002)、未割付領域が存在するのであれば(ステップ1002;YES)、単位背景領域関係検出部106は、2次元座標が割り付けられていない単位背景領域と、初期値rRectを比較する(ステップ1003)。未割付領域が存在しなければ(ステップ1002;NO)、処理は終了する。
単位背景領域関係検出部106は、単位背景領域のY座標と、初期値rRectのY座標を比較して、単位背景領域のY座標がrRectのY座標よりも小さいか否かを判断する(ステップ1004)。小さくなければ(ステップS1004;NO)、単位背景領域関係検出部106は、単位背景領域と初期値rRecのY座標が等しいかどうかを判断する(ステップ1005)。等しい場合には(ステップS1005;YES)、単位背景領域のX座標と、初期値rRectのX座標を比較して、単位背景領域のX座標がrRectのX座標よりもが小さいか否かを判断する(ステップ1006)。小さければ(ステップS1006;YES)、単位背景領域関係検出部106は、初期値rRectを単位背景領域とする(ステップ1007)。単位背景領域関係検出部106は、上記の比較を全ての単位背景領域において行い(ステップS1008;Yes)、最小座標を持つ単位背景領域を選択する。
次に、単位背景領域関係検出部106は、選択した単位背景領域を、前回の比較処理で選択した単位背景領域のY座標と比較する(ステップ1009)。Y座標に変化があれば、割り付けるY座標の値が変化したことになるので(ステップ1010;YES)、単位背景領域関係検出部106は、割り付けるX座標を”1”に、Y座標を”プラス1”して(ステップ1011)、選択した単位背景領域に座標を割り付ける(ステップ1012)。一方、Y座標に変化がなければ(ステップ1010;NO)、単位背景領域関係検出部106は、割り付けるX座標を”プラス1”して(ステップ1013)、選択した単位背景領域に座標を割り付ける(ステップ1012)。以上の処理を未割付の背景領域が無くなるまで繰り返し行なう。この結果、図11に示すように、単位背景領域それぞれに対して、(X,Y)=(1,1)、(1,2)、(2,1)、(2,2)というように座標を割り付けることができる。単位背景領域関係検出部106は、この座標値を調べることで、単位背景領域それぞれの隣接関係を検出できる。すなわち、2つの単位背景領域を比較し、割り付けられたX座標の値、あるいはY座標の値のどちらかが1だけ大きければ、その2つの単位背景領域は隣接していることが分かる。
再び図2の説明に戻る。表構造抽出部107は、単位背景領域関係検出部106によって検出された単位背景領域の位置関係に基づいて、表構造を抽出し、これを記憶する(ステップ210)。図12は、表構造抽出部107により抽出された表構造を表す図である。まず、図12(a)は、表構造抽出部107が各単位背景領域の座標に基づいて表構造を抽出する例を示した図であり、単位背景領域に割り付けられた単位背景領域番号と、各単位背景領域の位置座標と、各単位背景領域(表の各項目)内の文字列とが対応付けられて記憶されている様子を示している。
図12(a)に示す例では、例えば単位背景領域番号「1」が割り付けられた単位背景領域内の文字列「注文日」と、単位背景領域番号「2」が割り付けられた単位背景領域内の文字列「2005年8月30日」とはそれぞれ、座標(X,Y)=(1,1)と座標(X,Y)=(2,1)という位置関係にあるから(つまりX方向に隣接しているから)、これらは特定の対応関係にあるということが分かる。同様に、単位背景領域番号「3」が割り付けられた単位背景領域内の文字列「発注番号」と、単位背景領域番号「4」が割り付けられた単位背景領域内の文字列「500365077」とはそれぞれ、座標(X,Y)=(1,2)と座標(X,Y)=(2,2)という位置関係にあるから(つまりX方向に隣接しているから)、これらも特定の対応関係にあるということが分かる。
また、図12(b)は、表構造抽出部107が各単位背景領域の右方向又は下方向の隣接関係に基づいて表構造を抽出する例を示した図であり、単位背景領域に割り付けられた単位背景領域番号と、その単位背景領域の右側に位置する単位背景領域の単位背景領域番号と、その単位背景領域の下側に位置する単位背景領域の単位背景領域番号と、その単位背景領域内の文字列とが対応付けられて記憶されている様子を示している。図12(b)に示す例では、例えば単位背景領域番号「1」が割り付けられた単位背景領域内の文字列「注文日」の右側に、単位背景領域番号「2」が割り付けられた単位背景領域内の文字列「2005年8月30日」があるから(つまりこれらはX方向に隣接しているから)、これらは特定の対応関係にあるということが分かる。同様に、単位背景領域番号「3」が割り付けられた単位背景領域内の文字列「発注番号」の右側に、単位背景領域番号「4」が割り付けられた単位背景領域内の文字列「500365077」があるから(つまりこれらはX方向に隣接しているから)、これらも特定の対応関係にあるということが分かる。
このように表構造を用いることで、例えばワープロなど任意のアプリケーションで利用が可能な状態となる。
また本発明の画像処理装置の実施の一形態を図3に示す。301はスキャナなどの画像入力部、302はパーソナルコンピュータなどの画像処理部、303はキーボードなどの画像操作部、304はマウスに代表されるポインティングデバイスなどの画像指示部である。図3に示す例では、パーソナルコンピュータなどから構成されているが、画像を入力し処理できるものであれば、本発明はこれらの構成に限られるものではなく、例えば複写機などであっても良い。画像入力部301は、前述した文書画像入力部101に相当し、画像処理部302は、前述した表画像抽出部102、表画像縮小部103、単位背景領域検出部104、単位背景領域統合部105、単位背景領域関係検出部106、表構造抽出部107に相当する。
このように本実施の形態によると、表画像から背景領域を用いて表構造を抽出するので、罫線の長さ、線種及び方向や、罫線と文字が接触しているか否かに依らず、従来よりも正確に表画像から表構造を抽出することができる。さらに単位背景領域検出手段によって検出された単位背景領域内に表を構成する罫線以外の線で囲まれた背景領域が存在する場合には、該表を構成する罫線以外の線で囲まれた背景領域を前記単位背景領域に統合する単位背景領域統合手段を有することで、例えば背景領域内に含まれる文字内の空白部分を統合し、1つの単位背景領域とすることができる。また表画像または文書画像入力手段によって入力された文書画像を縮小して背景領域検出手段へ入力する縮小手段を有することで、罫線を認識する処理に必要なパラメータなどを変更するような特別な操作は必要なく、罫線の線種に依らずに表画像から背景領域を容易に検出することができ、文字のつぶれや罫線の接触文字の影響も防ぐことができる。
本発明の実施の形態に係る画像処理装置のブロック構成図である。 本発明の実施の形態に係る表構造抽出のフローチャート図である。 本発明の実施の形態に係る画像処理装置の構成図である。 本発明の実施の形態に係る表画像の単位背景領域の例を表す説明図である。 本発明の実施の形態に係る単位背景領域と文字による背景領域を表す説明図である。 本発明の実施の形態に係る単位背景領域を抽出した結果の一例を表す図である。 (a)は、本発明の実施の形態に係る表画像の一例を表す図であり、(b)は、本発明の実施の形態に係る単位背景領域を抽出した結果の一例を表す図である。 本発明の実施の形態に係る表構造の項目の関係の例を表す説明図である。 本発明の実施の形態に係る単位背景領域それぞれの位置関係の方向を表す説明図である。 本発明の実施の形態に係る単位背景領域それぞれに座標を割り付けるフローチャット図である。 本発明の実施の形態に係る単位背景領域それぞれの位置関係に座標を割り付けた結果の一例を表す図である。 (a)は、本発明の実施の形態に係る単位背景領域の位置関係の方向から表構造を抽出した一例を表す図であり、(b)は、本発明の実施の形態に係る単位背景領域の座標から表構造を抽出した一例を表す図である。
符号の説明
101 文書画像入力部、102 表画像抽出部、103 表画像縮小部、104 単位背景領域検出部、105 単位背景領域統合部、106 単位背景領域関係検出部、107 表構造抽出部、301 画像入力部、302 画像処理部、303 画像操作部、304 画像指示部、401 表画像、402 単位背景領域、501 罫線による単位背景領域、502 文字による背景領域、601 統合後の単位背景領域、701 表全体から切り出した単位背景領域

Claims (7)

  1. 表画像を有する文書画像を入力する文書画像入力手段と、
    前記表画像の表を構成する罫線に途切れがあるか否かを判断する判断手段と、
    前記判断手段が前記表画像の表を構成する罫線に途切れがあると判断した場合には、当該途切れが無くなるまで、前記表画像または前記文書画像入力手段によって入力された文書画像を縮小する縮小手段と、
    前記表画像または前記縮小手段によって縮小された表画像から、表を構成する罫線によって囲まれた部分における背景領域の最小単位を単位背景領域として検出する単位背景領域検出手段と、
    前記単位背景領域内に表を構成する罫線以外の線で囲まれた背景領域が存在する場合には、該表を構成する罫線以外の線で囲まれた背景領域を前記単位背景領域に統合する単位背景領域統合手段と、
    前記単位背景領域間の位置関係を検出する単位背景領域関係検出手段と、
    前記単位背景領域間の位置関係から表構造を抽出する表構造抽出手段と
    を有することを特徴とする画像処理装置。
  2. さらに前記文書画像入力手段によって入力された文書画像から表画像と該表画像以外の画像とを分離し、表画像を抽出する表画像抽出手段を有し、
    前記単位背景領域検出手段は、前記表画像抽出手段によって抽出された表画像から前記単位背景領域を検出することを特徴とする請求項1に記載の画像処理装置。
  3. 前記単位背景領域検出手段は、前記表画像において背景を表す背景色を判定し、背景色と判定された領域を前記単位背景領域として検出することを特徴とする請求項1に記載の画像処理装置。
  4. 前記単位背景領域検出手段は、前記表画像内で最も広い面積を占める色を背景色として判定することを特徴とする請求項3に記載の画像処理装置。
  5. 前記単位背景領域関係検出手段は、各々の前記単位背景領域に対して座標を割り付けて前記単位背景領域間の隣接関係を特定することで、前記単位背景領域間の位置関係を検出することを特徴とする請求項1に記載の画像処理装置。
  6. 表画像を有する文書画像を入力する文書画像入力ステップと、
    前記表画像の表を構成する罫線に途切れがあるか否かを判断する判断ステップと、
    前記判断ステップにおいて前記表画像の表を構成する罫線に途切れがあると判断された場合には、当該途切れが無くなるまで、前記表画像または前記文書画像入力ステップによって入力された文書画像を縮小する縮小ステップと、
    前記表画像または前記縮小ステップにおいて縮小された表を構成する罫線によって囲まれた部分における背景領域の最小単位を単位背景領域として検出する単位背景領域検出ステップと、
    前記単位背景領域内に表を構成する罫線以外の線で囲まれた背景領域が存在する場合には、該表を構成する罫線以外の線で囲まれた背景領域を前記単位背景領域に統合する単位背景領域統合ステップと、
    前記単位背景領域から単位背景領域間の位置関係を検出する単位背景領域関係検出ステップと、
    前記単位背景領域間の位置関係から表構造を抽出し、記憶する表構造抽出ステップと
    を有することを特徴とする画像処理方法。
  7. コンピュータに、
    表画像を有する文書画像を入力する文書画像入力手順と、
    前記表画像の表を構成する罫線に途切れがあるか否かを判断する判断手順と、
    前記判断手順において前記表画像の表を構成する罫線に途切れがあると判断された場合には、当該途切れが無くなるまで、前記表画像または前記文書画像入力手順において入力された文書画像を縮小する縮小手順と、
    前記表画像または前記縮小手順において縮小された表を構成する罫線によって囲まれた部分における背景領域の最小単位を検出する単位背景領域検出手順と、
    前記単位背景領域内に表を構成する罫線以外の線で囲まれた背景領域が存在する場合には、該表を構成する罫線以外の線で囲まれた背景領域を前記単位背景領域に統合する単位背景領域統合手順と、
    前記単位背景領域から単位背景領域間の関係を検出する単位背景領域関係検出手順と、
    前記単位背景領域間の関係から表構造を抽出する表構造手順と
    を実行させるためのプログラム。
JP2005341432A 2005-11-28 2005-11-28 画像処理装置、方法及びプログラム Expired - Fee Related JP4810995B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005341432A JP4810995B2 (ja) 2005-11-28 2005-11-28 画像処理装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005341432A JP4810995B2 (ja) 2005-11-28 2005-11-28 画像処理装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2007148719A JP2007148719A (ja) 2007-06-14
JP4810995B2 true JP4810995B2 (ja) 2011-11-09

Family

ID=38210077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005341432A Expired - Fee Related JP4810995B2 (ja) 2005-11-28 2005-11-28 画像処理装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4810995B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6468463B2 (ja) * 2015-07-30 2019-02-13 京セラドキュメントソリューションズ株式会社 画像処理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0573721A (ja) * 1991-09-13 1993-03-26 Matsushita Electric Ind Co Ltd 表認識装置
JPH0660220A (ja) * 1992-08-07 1994-03-04 Oki Electric Ind Co Ltd 文書画像の領域抽出方法
JPH0822510A (ja) * 1994-07-06 1996-01-23 Matsushita Electric Ind Co Ltd 文書認識装置
JPH08320914A (ja) * 1995-05-24 1996-12-03 Hitachi Ltd 表認識方法および装置
JP4450888B2 (ja) * 1999-05-28 2010-04-14 富士通株式会社 帳票認識方法
JP3615179B2 (ja) * 2001-10-29 2005-01-26 株式会社東芝 文字認識装置及び文字認識方法
JP2004127203A (ja) * 2002-07-30 2004-04-22 Ricoh Co Ltd 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP2007148719A (ja) 2007-06-14

Similar Documents

Publication Publication Date Title
US5384864A (en) Method and apparatus for automatic determination of text line, word and character cell spatial features
JP4574503B2 (ja) 画像処理装置、画像処理方法およびプログラム
KR20050090945A (ko) 문자 인식 장치, 문자 인식 방법, 매체 처리 방법, 문자인식 프로그램 및 문자 인식 프로그램을 기록한 컴퓨터판독 가능한 기록 매체
JP2009265751A (ja) 文字認識装置、光学式文字認識システム及び文字認識プログラム
JP2018055255A (ja) 情報処理装置、情報処理方法及びプログラム
JP5337563B2 (ja) 帳票認識方法および装置
JP4393411B2 (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
JP4777024B2 (ja) 画像処理装置および画像処理装置の制御方法
JP4613397B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP6116531B2 (ja) 画像処理装置
JP7433887B2 (ja) 画像を処理するための装置、プログラム、画像処理方法
US20190057276A1 (en) Image analysis apparatus, image analysis method, and non-transitory computer readable medium
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
US10706337B2 (en) Character recognition device, character recognition method, and recording medium
JP4167680B2 (ja) 原稿読取装置および原稿読取方法
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP4974367B2 (ja) 領域分割方法及び装置、並びにプログラム
JPH07160810A (ja) 文字認識装置
JP2009272714A (ja) 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体
US8432555B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
JP2010044517A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体
JP2022167414A (ja) 画像処理装置、画像処理方法およびプログラム
JP2003030585A (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP2003259129A (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110726

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110808

R150 Certificate of patent or registration of utility model

Ref document number: 4810995

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees