JP2013065164A

JP2013065164A - 画像処理装置、画像処理方法および画像処理プログラム

Info

Publication number: JP2013065164A
Application number: JP2011202949A
Authority: JP
Inventors: Masaru Sekiguchi; 優関口
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2011-09-16
Filing date: 2011-09-16
Publication date: 2013-04-11

Abstract

【課題】文字画像処理において、行毎に２色で交互に塗りつぶして配置されている交互配置表に対して、表を抽出することができる。
【解決手段】画像入力部１１は、データアクセス部１２を起動させてデータ記憶部１３に記憶されている、多値の画像データを取得する。領域識別処理部１４は、取得された多値の画像データに対して、文字領域、図領域、写真領域、表領域を識別する。罫線抽出処理部１５は、得られた領域データに対して、罫線抽出処理を施す。領域識別処理部１４は、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップ値を算出する。領域識別処理部１４は、得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出する。領域識別処理部１４は、得られた罫線行から、罫線行内の各セルを抽出する。結果出力部１６は、得られた罫線抽出結果データを出力する。
【選択図】図１

Description

本発明は、表で構成された帳票画像から罫線（表）を抽出するための画像処理装置、画像処理方法および画像処理プログラムに関する。

従来、帳票認識処理において、表で構成された帳票画像から罫線（表）を抽出して、表中のセル単位で文字認識したり、抽出された罫線をベクトルデータに変換したり、抽出された箇所を再利用したりする場合がある。そのような帳票画像中の罫線（表）に対して、罫線抽出処理を行うための罫線抽出手順が既に知られている。
例えば、特許文献１では、罫線を利用して該帳票類を判別する場合に、画像の変動に起因する判別精度の低下を防ぎ、もって精度良く帳票類を判別することを目的としている。
特許文献１では、判別対象となる帳票類の入力画像の画像データの特徴量をあらかじめ記憶した参照画像の画像データの特徴量と比較して帳票類を判別する帳票類判別装置において、入力画像または参照画像の画像データの各画素から水平方向または垂直方向にそれぞれ連接する所定数の画素列内に所在する黒画素の割合を示す黒画素割合を画素ごとに算定する算定手段と、画像データを複数のブロックに分割し、該分割したブロックごとにブロック内に位置する各画素の黒画素割合を加算して画像データの特徴量を抽出する抽出手段と、を備えたことを特徴とする帳票類判別装置が開示されている。

しかし、従来の技術にあっては、図１１に示す入力文字画像の例、図１２に示す表の例、すなわち、行毎に２色で交互に塗りつぶして配置されている表（以下、交互配置表という）に対して、罫線抽出処理を行うことを前提としていなかった。
このため、上述した交互配置表で構成された文書画像に対して、誤抽出が発生するといった問題があった。
特許文献１にあっては、文書画像から罫線（表）を抽出する点が開示されているが、図１２に示すような、行毎に２色で交互に塗りつぶして配置されている交互配置表に対しては、罫線そのものが存在しないため、罫線抽出処理を行うことができず、誤抽出が発生するといった問題があった。
そこで、本発明は、上記に鑑みてなされたもので、その目的としては、文字画像処理において、行毎に２色で交互に塗りつぶして配置されている交互配置表に対して、表を抽出することができ、抽出結果の罫線・文字を認識処理して閲覧・再利用することが可能な画像処理装置、画像処理方法および画像処理プログラムを提供する。

請求項１記載の本発明は、原稿から多値で構成されている画像データを取得する画像入力処理手段と、前記画像入力処理手段によって取得された多値画像データに対して、文字領域、図領域、写真領域、表領域を識別する領域識別手段と、前記領域識別手段によって得られた領域データに対して、罫線抽出処理をする罫線抽出処理手段と、前記領域識別手段によって得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップを算出するカラーマップ算出手段と、前記カラーマップ算出手段によって得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出する罫線行抽出処理手段と、前記罫線行抽出処理手段によって得られた罫線行から、罫線行内の各セルを抽出するセル抽出処理手段と、前記罫線抽出理手段によって得られた罫線抽出結果データを出力する結果出力手段と、を有することを特徴とする画像処理装置である。

本発明によれば、多値の画像データから得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップを算出し、得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出し、得られた罫線行から罫線行内の各セルデータを抽出するので、行毎に２色で交互に塗りつぶして配置されている交互配置表に対して、確実に表領域を抽出することができる。

本発明の第１実施形態に係る画像処理装置１の構成を示すブロック図である。本発明の第２実施形態に係る画像処理装置２０の構成を示すブロック図である。図２に示す画像処理装置２０の処理内容について説明するためのフローチャートである。図２に示す画像処理部２７による領域識別処理の結果を示す図である。図２に示す画像処理部２７による抽出結果の罫線を示す図である。図２に示す画像処理部２７による交互配置表に対する罫線抽出処理について説明するためのフローチャートである。行単位で交互に異なる背景色が配置してある表領域４４の例を示す図である。カラーマップとラベル値の例を示すカラーマップ表８１である。罫線抽出処理部１５により抽出されたセルの例を示す図である。図６に示すフローチャートの変形例２を示すフローチャートである。入力文字画像の例を示す図である。表の例を示す図である。

本発明の実施の形態に係る画像処理装置について図面を参照して説明する。
具体的には、帳票認識処理において、帳票画像データにある行毎に２色で交互に塗りつぶして配置されている交互配置表に対して、罫線（表）およびセル内の要素を抽出する場合に、帳票画像データ中にある表中の行が２色に規則通り交互配置され、各ラインのカラーマップ値が同一かつ連続しているというパターンを用いて、罫線を抽出することにより、より高い精度で罫線抽出処理を行うことを特徴としている。
＜第１実施形態＞
図１は、本発明の第１実施形態に係る画像処理装置１の構成を示すブロック図である。
画像入力部１１は、原稿から多値で構成されている画像データを取得する。すなわち、画像入力部１１は、スキャナを走査して取得した画像データ、ファイルを読み出して取得した画像データ、ネットワークを経由して取得した画像データ、デジタルカメラで撮影した画像データ等を入力して取得する。
データアクセス部１２は、実際に画像データを蓄積しているデータディスクなどのデータ記憶部１３にアクセスして画像データを取得し、この画像データを画像入力部１１に出力する。
領域識別処理部１４は、画像入力部１１によって取得された多値画像データに対して、文字領域、図領域、写真領域、表領域を識別する。
罫線抽出処理部１５は、領域識別処理部１４で識別された表領域データに対して、罫線を抽出する。
結果出力部１６は、罫線抽出処理部１５によって得られた結果データを出力する。
処理制御部１７は、画像処理装置１に設けられた各部１１〜１６による処理を制御する。

次に、図１に示す画像処理装置１の動作について説明する。
まず、画像入力部１１は、データアクセス部１２を起動させてデータ記憶部１３に記憶されている、多値で構成されている画像データを取得する。
次いで、領域識別処理部１４は、画像入力部１１によって取得された多値の画像データに対して、文字領域、図領域、写真領域、表領域を識別する。
次いで、罫線抽出処理部１５は、領域識別処理部１４によって得られた領域データに対して、罫線抽出処理を施す。
次いで、領域識別処理部１４は、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップを算出する。次いで、領域識別処理部１４は、得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出する。次いで、領域識別処理部１４は、得られた罫線行から、罫線行内の各セルを抽出する。次いで、結果出力部１６は、領域識別処理部１４によって得られた罫線抽出結果データを出力する。
これにより、多値の画像データに対して、文字領域、図領域、写真領域、表領域を識別し、得られた領域データに対して罫線抽出処理を施し、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップを算出し、得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出し、得られた罫線行から罫線行内の各セルデータを抽出し、得られた罫線抽出結果データを出力するので、行毎に２色で交互に塗りつぶして配置されている交互配置表に対して、表を抽出することができ、抽出結果の罫線・文字を認識処理して閲覧・再利用することが可能になる。

＜変形例１＞
図１を参照して、本発明の第１実施形態に係る画像処理装置１についての変形例１について説明する。
図１に示す領域識別処理部１４は、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の最頻値を算出することを特徴とする。

次に、図１に示す画像処理装置１の変形例１の動作について説明する。
まず、画像入力部１１は、データアクセス部１２を起動させてデータ記憶部１３に記憶されている、多値で構成されている画像データを取得する。
次いで、領域識別処理部１４は、画像入力部１１によって取得された多値の画像データに対して、文字領域、図領域、写真領域、表領域を識別する。
次いで、罫線抽出処理部１５は、領域識別処理部１４によって得られた領域データに対して、罫線抽出処理を施す。
次いで、領域識別処理部１４は、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の最頻値を算出する。次いで、領域識別処理部１４は、得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出する。次いで、領域識別処理部１４は、得られた罫線行から、罫線行内の各セルを抽出する。次いで、結果出力部１６は、領域識別処理部１４によって得られた罫線抽出結果データを出力する。
これにより、多値の画像データに対して、文字領域、図領域、写真領域、表領域を識別し、得られた領域データに対して罫線抽出処理を施し、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の最頻値を算出し、得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出し、得られた罫線行から罫線行内の各セルデータを抽出し、得られた罫線抽出結果データを出力するので、行毎に２色で交互に塗りつぶして配置されている交互配置表に対して、表を抽出することができ、抽出結果の罫線・文字を認識処理して閲覧・再利用することが可能になる。

＜第２実施形態＞
図２は、本発明の第２実施形態に係る画像処理装置２０の具体的な構成を示すブロック図である。
図２において、ＣＰＵ２１は各部の制御および演算を行う。入力画像メモリ部２４は、原稿から画像データを読み取るスキャナ部２２、または、ハードディスク３２やＣＤ／ＤＶＤ／メモリカード３１などの外部記憶部２３から原稿ファイルを取得して入力画像としてメモリ上に展開して記憶する。
表示部２５は入力画像をプレビュー表示し、操作部２６はユーザ操作を入力する。画像処理部２７は、領域識別や罫線抽出処理を行う。画像処理部２７はメモリ部２７ａを有し、メモリ部２７ａ内には後述する画像処理の工程毎に別々のワークエリア＃１〜ｎを有している。
画像処理部２７で抽出された各特徴量データを特徴保管部２８に格納して保管する。
また、通信制御部２９を介して、ネットワーク網３０から入力画像を取得したり、ネットワーク網３０を介して処理結果の情報を他の装置に配信したりする。

図３は、図２に示す画像処理装置２０の処理内容について説明するためのフローチャートである。
まず、ステップＳ５では、ＣＰＵ２１は、原稿から多値で構成されている画像データを取得する。例えば、スキャナ部２２により原稿を走査して入力画像データとして取得する、またはデジタルカメラなどで撮影した画像データ、ネットワーク網３０経由で通信制御部２９が取得した画像データなど、様々な手段で取得した画像データの何れか１つを入力し、入力画像メモリ部２４上に展開して記憶する。
次いで、ステップＳ１０では、ＣＰＵ２１は、ステップＳ５で取得した入力画像メモリ部２４上に記憶した帳票画像データを画像処理部２７に設けられたメモリ部２７ａにあるワークエリア＃１に転送する。
そして、画像処理部２７では、ワークエリア＃１に記憶された帳票画像データに対して、文字領域、図写真領域、表領域などの要素として、長方形状の開始点と終点を示す画素のアドレスを識別して領域データとして抽出してワークエリア＃２に記憶するとともに、特徴保管部２８に保管する。

ここで、画像処理部２７での周知の領域識別処理について説明する。
具体的には、画像処理部２７は、文書画像を画像データとしてメモリ部２７ａのワークエリア＃１上に展開して記憶した該文書画像の背景色を特定し、必要に応じて画像を縮小し、該背景色を用いて該文書画像から背景領域以外の画素を抽出し、該画素を統合して連結成分を生成し、該連結成分を少なくとも形状特徴を用いて所定の領域に分類して、該文書画像の領域識別の結果となる長方形状の開始点と終点を示す画素のアドレスを含む領域データ（文字領域、図写真領域、表領域）をワークエリア＃２に記憶させるとともに、特徴保管部２８に保管する。
この結果、図４に示すように、画像処理部２７による領域識別処理の結果として、タイトル領域４１、文字領域４２、写真領域（実際は写真である）４３、表領域（罫線領域）４４についての領域データを取得してワークエリア＃２と特徴保管部２８とに保管することができる。
なお、図４において紙面上方から下方に向かうｙ方向を主走査方向とし、紙面左から右に向かうｘ方向を副走査方向とし、図５、図７、図１１、図１２においても同様のこととする。

次いで、ステップＳ１５では、ＣＰＵ２１は、画像処理部２７に対して、ステップＳ１０で抽出された各領域データのうち、ワークエリア＃２に展開して記憶した表領域４４に対して、罫線抽出処理を行わせ、その結果である罫線内のセルに関する座標データをワークエリア＃３に記憶させる。なお。罫線抽出処理の詳細については後述して説明する。

ここで、画像処理部２７による抽出結果の罫線を図５に示す。なお、説明の都合上、図５に示す領域は一部のみ表示しているが、実際は全て表示するものである。
図５に示すように、表領域４４は、文字色、罫線色、罫線行５１（図中枠線にて囲み表示）の行色、背景色から構成されている。なお、セル５２（図中枠線にて囲み表示）については、後述することとする。
次いで、ステップＳ２０では、ＣＰＵ２１は、画像処理部２７に対して、ワークエリア＃３に得られた結果データを表示部２５の画面に出力し、またはファイルとして特徴保管部２８に出力して保管し、処理を終了する。

次に、画像処理部２７による交互配置表に対する罫線抽出処理について、図６に示すフローチャートを参照して説明する。なお、本実施形態では、帳票画像データ中にある表中の行が２色に規則通り交互配置され、各ラインのカラーマップ値が同一かつ連続しているので、画像処理部２７による処理においては、罫線行の行色に着目することとする。
まず、ステップＳ３０では、画像処理部２７は、ワークエリア＃２に展開して記憶されている表領域４４の傾きが水平になるようにスキュー（傾き）補正を行う。

ここで、周知の形状補正であるスキュー補正について説明する。
ワークエリア＃２に展開して記憶されている表領域４４に対して、主走査方向の各ライン上での最大輝度値の中で、副走査方向において最小値を与える位置を最小輝度の代表位置として決定しておく。
次に、画像を副走査方向に貫く中心線との交点を起点とし、画像の上方と下方の各方向に向かって、各主走査方向位置における最小輝度位置を追跡し、その軌跡を画像の縁部とする。
さらに、求めた軌跡により示される直線と主走査方向のなす角度θをスキュー角度θとし、これを基にワークエリア＃２に展開して記憶されている表領域４４に対してスキュー補正処理を行い、スキュー補正処理後の表領域４４の画像データをワークエリア＃４に記憶する。

次に、図６に戻り、ステップＳ３５では、画像処理部２７は、罫線行には行色だけでなく、文字色も含まれているため、行色を均一化するために、ワークエリア＃４に展開して記憶されているスキュー補正処理後の表領域４４内の同一ライン上の隣り合う画素に対して、両者の画素値（Ｒ，Ｇ，Ｂ）の成分毎の平均を求め、順次に副走査方向にシフトしてライン毎の平滑化処理を行う。なお、平滑処理後の画像データは、ワークエリア＃５に記憶し、これとは別に特徴保管部２８に保管して管理する。
次に、ステップＳ４０では、罫線行の色が交互に配置している特徴を見つけるために、画像処理部２７は、ワークエリア＃５に展開して記憶されている平滑処理後の表領域４４の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップを算出する。
具体的には、画像処理部２７は、カラーマップの平均値の場合、ワークエリア＃５に展開されている平滑処理後の多値画像データに対して、主走査方向へスキャンして、表領域４４内の副走査方向の画素値（Ｒ，Ｇ，Ｂ）の成分毎の全平均値を求めるようにして副走査方向のカラーマップの平均値を求めて、その値を特徴保管部２８のカラーマップ表８１に保管する。
また、画像処理部２７は、カラーマップの平均値の場合、ワークエリア＃５に展開されている多値画像データに対して、副走査方向へスキャンして、表領域４４内の主走査方向の画素値（Ｒ，Ｇ，Ｂ）の成分毎の全平均値を求めるようにして主走査方向のカラーマップの平均値を求めて、その値を特徴保管部２８のカラーマップ表８１に保管する。

ここで、図７は、行単位で交互に２色の異なる背景色が配置してある表領域４４の例を示す図である。図７に示すように、表領域４４の内部には行単位で交互に２色の異なる背景色が配置してあり、画像処理部２７がワークエリア＃５に展開されている平滑処理後の多値画像データに対して、主走査方向７１へスキャンすることを示す。図中、ハッチングによって示されている部分が緑の背景色、その他の部分が白の背景色であるとする。
なお、カラーマップ値は、ＲＧＢ値を（Ｒ，Ｇ，Ｂ）と表記するものである。図７の場合、緑であることを示すカラーマップ値は（０，２５５，０）、白であることを示すカラーマップ値は（２５５，２５５，２５５）である。
図７に示す表領域４４の場合、カラーマップ、ラベル値は、図８に示すカラーマップ表８１のようになる。
図８に示すカラーマップ表８１に示すように、ラインＬ、カラーマップ（Ｒ，Ｇ，Ｂ）、ラベル値、備考の順に記載しており、図７に示す表領域４４に対して、画像処理部２７がワークエリア＃５の主走査方向７１へスキャンするのに応じて、図８に示すカラーマップ表８１のラインＬの値が大きくなるように構成されている。なお、図８に示すカラーマップ表８１は、特徴保管部２８に保管する。

ステップＳ４５では、画像処理部２７は、これらのカラーマップ値の近似値ＡＰ（Ｒ，Ｇ，Ｂ）を定め、この近似値の範囲（Ｒ±ｒ，Ｇ±ｇ，Ｂ±ｂ）内であれば同一のラベル値を特徴保管部２８に保管されているカラーマップ表８１に付与していく。
次いで、ステップＳ５０では、画像処理部２７は、罫線行抽出処理を行う。ここで、特徴保管部２８に保管されているカラーマップ表において、同一のラベル値が連続しているものを一括りにして、罫線行として定義する。図８に示すカラーマップ表８１の場合、ラベルが１で付与されたライン１〜１６までが罫線行１、ライン１７〜２２までが罫線行２であり、以降はこの繰り返しとなる。

また、画像処理部２７は、特徴保管部２８に保管されているカラーマップ表８１において、同一のラベル値が連続している範囲Ｈが一定値であれば、１つの表として見なす。範囲Ｈは、ラベル値が連続している値の平均値を用いる。図８に示すカラーマップ表８１の場合、同一のラベル値が連続している範囲Ｈは１６±αである（αはユーザが指定するものとする）。以上の処理により、罫線行を抽出することができる。
次いで、ステップＳ５５では、画像処理部２７は、ワークエリア＃５に展開して記憶されている平滑処理後の表領域４４の領域データに対して、セル抽出処理を行う。ここで、罫線行内の各セル（図５中、枠線にて囲み表示されたセル５２に相当）については、抽出された罫線行に対して、文字抽出処理を行い、抽出されたセル内にある文字領域の間隔から判定して、１つのセルＲｎ（Ｘｓ，Ｙｓ，Ｘｅ，Ｙｅ）として抽出する。

ここで、図９は、画像処理部２７により抽出されたセルの例を示す図である。図９には、セル９１、セル９２、セル９３が示されており、セル９１の開始点座標（Ｘｓ，Ｙｓ）と終点座標（Ｘｅ，Ｙｅ）から、セル９１の座標を例えばＲｎ（Ｘｓ，Ｙｓ，Ｘｅ，Ｙｅ）で示す。
ここで、セル９１の開始点座標（Ｘｓ，Ｙｓ）と終点座標（Ｘｅ，Ｙｅ）の位置関係から、同一のラベル値が連続している範囲では、開始点座標のｙ成分Ｙｓと終点座標のｙ成分Ｙｅとの差が１６−α＜Ｙｓ−Ｙｅ＜１６＋αと表すことができる。

以上のようにして、図６に示すフローチャートに従った罫線抽出処理を終了すると、図３に示すステップＳ２０に戻る。
これにより、多値の画像データに対して、文字領域、図領域、写真領域、表領域を識別し、得られた領域データに対して罫線抽出処理を施し、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップを算出し、得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出し、得られた罫線行から罫線行内の各セルデータを抽出し、得られた罫線抽出結果データを出力するので、行毎に２色で交互に塗りつぶして配置されている交互配置表に対して、表を抽出することができ、抽出結果の罫線・文字を認識処理して閲覧・再利用することが可能になる。

＜変形例２＞
図１０を参照して、本発明の第２実施形態に係る画像処理装置の変形例２における、画像処理部２７による交互配置表に対する罫線抽出処理について説明する。図１０は、図６に示すフローチャートの変形例２を示すフローチャートである。
なお、図１０に示すフローチャートと、図６に示すフローチャートとに付与された同じ符号を有する処理については上述した処理内容と同様であるので、その説明を省略する。
ステップＳ７０では、画像処理部２７は、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の最頻値を算出する。
すなわち、画像処理部２７は、カラーマップの最頻値の場合、ワークエリア＃５に展開されている多値画像データに対して、主走査方向へスキャンして、表領域４４内の副走査方向の画素値（Ｒ，Ｇ，Ｂ）の成分毎の最頻値を求めるようにして副走査方向のカラーマップの最頻値を求めて、その値を特徴保管部２８に保管する。

また、画像処理部２７は、カラーマップの最頻値の場合、ワークエリア＃５に展開されている多値画像データに対して、副走査方向へスキャンして、表領域４４内の主走査方向の画素値（Ｒ，Ｇ，Ｂ）の成分毎の最頻値（最も頻繁に出現する値）を求めるようにして主走査方向のカラーマップの最頻値を求めて、その値を特徴保管部２８に保管する。
なお、統計学における最頻値とは、データ群や確率分布で最も頻繁に出現する値である。平均や中央値と同様、最頻値は確率変数または何らかの単一の量についての母集団に関しての重要な情報を得る手段の１つである。最頻値は一般に平均や中央値とは異なり、特に歪度の大きい分布では大きく異なることがある。
最も頻繁に出現する値は１つとは限らないため、最頻値は一意に定まらないことがある。特に一様分布ではどの値も同じ確率で出現するため、最頻値が定まらない。
これにより、多値の画像データに対して、文字領域、図領域、写真領域、表領域を識別し、得られた領域データに対して罫線抽出処理を施し、得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の最頻値を算出し、得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出し、得られた罫線行から罫線行内の各セルデータを抽出し、得られた罫線抽出結果データを出力するので、行毎に２色で交互に塗りつぶして配置されている交互配置表に対して、表を抽出することができ、抽出結果の罫線・文字を認識処理して閲覧・再利用することが可能になる。
以上説明した本発明に係る画像処理装置は、据え置き型コンピュータ、複写機、組み込み端末、電子計算機、画像データベースに搭載することが可能である。

１画像処理装置、１１画像入力部、１２データアクセス部、１３データ記憶部、１４領域識別処理部、１５罫線抽出処理部、１６結果出力部、１７処理制御部、２０画像処理装置、２１ＣＰＵ、２４入力画像メモリ部、２２スキャナ部、２３外部記憶部、２５表示部、２６操作部、２７画像処理部、２８特徴保管部、２９通信制御部、３０ネットワーク網、３１ＣＤ／ＤＶＤ、３２ハードディスク、

特開２００１−２８３１５２公報

Claims

原稿から多値で構成されている画像データを取得する画像入力処理手段と、
前記画像入力処理手段によって取得された多値画像データに対して、文字領域、図領域、写真領域、表領域を識別する領域識別手段と、
前記領域識別手段によって得られた領域データに対して、罫線抽出処理をする罫線抽出処理手段と、
前記領域識別手段によって得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップを算出するカラーマップ算出手段と、
前記カラーマップ算出手段によって得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出する罫線行抽出処理手段と、
前記罫線行抽出処理手段によって得られた罫線行から、罫線行内の各セルを抽出するセル抽出処理手段と、
前記罫線抽出理手段によって得られた罫線抽出結果データを出力する結果出力手段と、
を有することを特徴とする画像処理装置。
原稿から多値で構成されている画像データを取得する画像入力処理手段と、
前記画像入力処理手段によって取得された多値画像データに対して、文字領域、図領域、写真領域、表領域を識別する領域識別手段と、
前記領域識別手段によって得られた領域データに対して、罫線抽出処理をする罫線抽出処理手段と、
前記領域識別手段によって得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分のカラーマップの最頻値を算出するカラーマップ算出手段と、
前記カラーマップ算出手段によって得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出する罫線行抽出処理手段と、
前記罫線行抽出処理手段によって得られた罫線行から、罫線行内の各セルを抽出するセル抽出処理手段と、
前記罫線抽出理手段によって得られた罫線抽出結果データを出力する結果出力手段と、
を有することを特徴とする画像処理装置。
前記領域識別手段には、文書画像を画像データとして入力し、該文書画像の背景色を特定し、必要に応じて画像を縮小し、該背景色を用いて該文書画像から背景領域以外の画素を抽出し、該画素を統合して連結成分を生成し、該連結成分を少なくとも形状特徴を用いて所定の領域に分類して、該文書画像の領域識別の結果を得ることにより領域データを取得することを特徴とする請求項１または２に記載の画像処理装置。
原稿から多値で構成されている画像データを取得する画像入力処理ステップと、
前記画像入力処理ステップによって取得された多値画像データに対して、文字領域、図領域、写真領域、表領域を識別する領域識別ステップと、
前記領域識別ステップによって得られた領域データに対して、罫線抽出処理をする罫線抽出処理ステップと、
前記領域識別ステップによって得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分の平均カラーマップを算出するカラーマップ算出ステップと、
前記カラーマップ算出ステップによって得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出する罫線行抽出処理ステップと、
前記罫線行抽出処理ステップによって得られた罫線行から、罫線行内の各セルを抽出するセル抽出処理ステップと、
前記罫線抽出理ステップによって得られた罫線抽出結果データを出力する結果出力ステップと、
を行うことを特徴とする画像処理方法。
原稿から多値で構成されている画像データを取得する画像入力処理ステップと、
前記画像入力処理ステップによって取得された多値画像データに対して、文字領域、図領域、写真領域、表領域を識別する領域識別ステップと、
前記領域識別ステップによって得られた領域データに対して、罫線抽出処理をする罫線抽出処理ステップと、
前記領域識別ステップによって得られた表領域の領域データに対して、主走査方向または副走査方向の各ラインに与えられている色成分のカラーマップの最頻値を算出するカラーマップ算出ステップと、
前記カラーマップ算出ステップによって得られた各ラインのカラーマップ値が同一かつ連続している場合に、罫線行として抽出する罫線行抽出処理ステップと、
前記罫線行抽出処理ステップによって得られた罫線行から、罫線行内の各セルを抽出するセル抽出処理ステップと、
前記罫線抽出理ステップによって得られた罫線抽出結果データを出力する結果出力ステップと、
を行うことを特徴とする画像処理方法。
請求項４または５に記載の各ステップをプロセッサに実行させることを特徴とする画像処理プログラム。