JP2007081458A

JP2007081458A - 画像処理装置および画像処理装置の制御方法

Info

Publication number: JP2007081458A
Application number: JP2005262703A
Authority: JP
Inventors: Nobuyuki Sakauchi; 宣行坂内
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2005-09-09
Filing date: 2005-09-09
Publication date: 2007-03-29
Anticipated expiration: 2025-09-09
Also published as: US20080018951A1; JP4574503B2

Abstract

【課題】原稿と原稿台の圧板との色差がわずかである場合や、読取装置の読取センサとしてＣＣＤが使用されている場合でも、原稿領域を検出することが容易である画像処理装置および画像処理装置の制御方法を提供することを目的とするものである。

【解決手段】原稿領域を抽出する画像処理装置において、原稿を読み取る読取手段と、上記読取手段が出力した読取データに基づいて、原稿領域を抽出する原稿領域抽出手段と、上記原稿領域抽出手段が抽出した原稿が、非矩形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識する原稿領域認識手段と、上記原稿領域抽出手段が抽出した複数の原稿領域が互いに重なっているか否かを判定する原稿重なり判定手段とを有することを特徴とする画像処理装置である。

【選択図】図１

Description

本発明は、画像処理装置およびその制御方法に係り、特に、原稿領域を抽出して読み取り、その読み取った画像を保存または印刷する画像処理装置およびその制御方法に関する。

従来の画像処理装置において、原画像から矩形領域を検出し、切り出すためのアルゴリズムが多く提案されている。また、抽出された矩形領域の重なり判定を行う装置が知られている。

輪郭抽出を行い、輪郭が直線を成す部分を探すことによって、矩形領域を探索する画像処理装置が知られている（たとえば、特許文献１参照）。この従来例は、ノイズの多い環境下では、矩形輪郭の直線部分を検出することが困難であり、また、４つの直線を関連付けて１個の矩形を検出することが困難であるという問題がある。上記「ノイズ」は、原稿台の汚れ、原稿台の圧板の汚れ、原稿台の歪み等によって発生する。

また、ノイズの多い環境下でも検出精度を向上させるために、２値化した原画像データから、水平方向と垂直方向との黒画素数のヒストグラムを作成し、この作成されたヒストグラムに基づいて、それを台形近似する。これによって、矩形の存在と傾き方向とを検出する画像処理装置が知られている（たとえば、特許文献２参照）。

この従来例では、原稿領域と背景との境界が曖昧である場合、つまり、読取装置において、原稿と原稿台の圧板との色差がわずかである場合等には、原稿領域を検出することが困難であるという問題がある。

さらに、検出した矩形領域が重なっているか否かを判定する対象である領域が、多角形形状であるかどうかを判定する画像処理装置が知られている（たとえば、特許文献３参照）。この従来例は、互いに重なっているか否かの判定は可能であるが、矩形領域の分離や重なり領域のサイズ等を把握することが不可能であるという問題がある。

そして、各領域の画素に、互いに異なる値を付与することによって、領域同士の重なり判定を行う画像処理装置が知られている（たとえば、特許文献４参照）。この従来例は、各領域サイズと画像データの解像度とが大きくなればなる程、値付与の処理回数が大幅に増加し、これに応じて処理時間が増大するという問題がある。
特開平８−２３７５３７号公報（第１５頁、図１０）特開２００４−３０４３０号公報（第１７頁、図９）特開２００４−２６０４５７号公報（第９頁、図３および図６）特開平９−１０６４６０号公報（第８頁、図５）

つまり、上記従来例は、原稿と原稿台の圧板との色差がわずかである場合には、原稿領域を検出することが困難であるという問題がある。また、矩形領域の分離や重なり領域のサイズ等を把握することができないという問題がある。そして、各領域サイズと画像データの解像度とが大きくなればなるほど、各領域の画素に付与する値付与の処理回数が大幅に増加し、これに応じて処理時間が増大するという問題がある。

本発明は、原稿と原稿台の圧板との色差がわずかである場合でも、原稿領域を検出することが容易である画像処理装置および画像処理装置の制御方法を提供することを目的とするものである。

また、本発明は、矩形領域の分離や重なり領域のサイズ等を把握することができる画像処理装置および画像処理装置の制御方法を提供することを目的とするものである。

さらに、本発明は、各領域サイズと画像データの解像度とが大きくなっても、処理時間が増大しない画像処理装置および画像処理装置の制御方法を提供することを目的とするものである。

本発明は、原稿領域を抽出する画像処理装置において、原稿を読み取る読取手段と、上記読取手段が出力した読取データに基づいて、原稿領域を抽出する原稿領域抽出手段と、上記原稿領域抽出手段が抽出した原稿が、非矩形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識する原稿領域認識手段と、上記原稿領域抽出手段が抽出した複数の原稿領域が互いに重なっているか否かを判定する原稿重なり判定手段とを有することを特徴とする画像処理装置である。

本発明によれば、画像処理装置で読み取った読取画像から抽出された複数の原稿領域が互いに重なっている場合、互いに重なっている原稿領域に対して双方または一方の原稿領域を無視するので、複数の原稿が互いに重なったままで抽出されることを防止できる。

また、本発明によれば、互いに重なっている領域を加工するので、重なっている双方の原稿領域を抽出することが可能となる。

発明を実施するための最良の形態は、次の実施例である。

図１は、本発明の実施例１である画像処理装置１００を示すブロック図である。

画像処理装置１００は、原画像データ中の原稿領域を検出する装置であり、外部インタフェース部１と、入力操作部２と、印刷部３と、読取部４と、表示部５と、制御部６と、汎用記憶部７とを有する。

外部インタフェース部１は、ディジタルカメラで撮影した画像データ等を本体装置に入力するためのインタフェースである。通常、各種メモリカードのスロットや、ディジタルカメラやＰＣと接続するためのＵＳＢコネクタ等を備えている。メモリカード用の物理的な受け口として、ＰＣＭＣＩＡスロットをはじめ、各種メモリカードへの対応も物理的に接続可能な専用スロットが設けられている。また、非接触のインタフェースとして、ＩｒＤＡ（赤外線通信）ポート等によるデータ伝送を行うようにしてもよい。

入力操作部２は、ユーザが画像処理装置１００を操作する部分である。印刷部３は、インクジェット方式のプリンタであり、外部Ｉ／Ｆ１に接続されているＰＣやメモリカード等からのデータや、読取部４が読み取った画像データを印刷する。その印刷方式等に制限はない。

読取部４は、銀塩写真や雑誌等を画像データ（ディジタルデータ）として読み取るＣＣＤ方式、または、ＣＩＳ方式のカラースキャナである。表示部５は、読み込んだ画像データや、装置の状態情報や入力操作部２からのユーザによる入力情報等を表示する。制御部６は、実施例１の各制御手順を実行し、各種センサが画像処理装置１００の状態を取得するためのものである。図２に示すフローチャートの動作を実行する。

汎用記憶部７は、実施例１における各種制御手段を実現するプログラムおよびデータ等を納め、制御実行のために必要に応じて作業領域としても使用する。

次に、画像処理装置１００が原稿領域を検出する動作について説明する。

図２は、画像処理装置１００が原稿領域検出する動作を示すフローチャートである。

まず、画像処理装置１００は、Ｓ１で、開始し、ユーザからの操作を待ち受けるスタンバイ状態になる。

次に、ユーザの操作によって複数原稿領域自動検出が指示された場合等、複数原稿領域自動検出が必要である場合、Ｓ２で、本来の読取としてユーザが指定している色、解像度ではなく、ＲＧＢカラー、７５ｄｐｉで前読み取りを行う。ここで、解像度を７５ｄｐｉとしたが、画像処理装置１００に使用される読取センサの仕様によって、他の解像度で読み取るようにしてもよい。なお、原稿領域検出の解析処理を高速化するために、本読み取り時の解像度よりも低い解像度で読み取ることが望ましい。

次に、Ｓ２で、前読み取りし、ＲＧＢカラー、７５ｄｐｉで読み取ったデータを、Ｓ３では、彩度（Ｓ）と明度（Ｖ）との情報を含む色空間であるＨＳＶ色空間データへ変換する。ここで、彩度（Ｓ）と明度（Ｖ）との情報を含む色空間として、ＨＳＶ色空間を示したが、ＨＳＶ色空間にこだわることはなく、彩度（Ｓ）と明度（Ｖ）との情報を含む色空間であれば、どの色空間に変換するようにしてもよい。ＲＧＢ色空間からＨＳＶ色空間への変換方式は多様であるが、画像処理装置１００においては、色差（Ｈ）、彩度（Ｓ）および明度（Ｖ）への色空間の変換式として、それぞれ下記の式を用いる。

Ｖ＝ｍａｘ（Ｒ，Ｇ，Ｂ）
ただし、上式中のｍａｘ（Ｒ，Ｇ，Ｂ）は、各要素値の中の最大値であり、ｍｉｎ（Ｒ，Ｇ，Ｂ）は、各要素値の中の最小値である。また、各データ値は、０〜２５５の範囲（整数値）になるように、スケール変換を行う。

次に、Ｓ４〜Ｓ６の処理を、互いに並行に実行する。

Ｓ４では、Ｓ３で取得したＨＳＶ色空間データの明度成分（Ｖ）データに対し、閾値τによって２値化し、２値データＢｉｎａｒｙ１を得る。明度（Ｖ）データが、閾値τよりも小さければ、黒（以下の式において黒を１と表す）とし、それ以外の場合は、白（以下の式において白を０と表す）とする。

図３は、実施例１において使用するフィルタの例を示す図である。

Ｓ５では、Ｓ３で取得したＨＳＶ色空間データの明度成分（Ｖ）データを、３×３ウィンドウ毎に分割する。そして、図３に示す８つのＫｉｒｓｃｈエッジ検出フィルタＦ１〜Ｆ８を、それぞれ掛け合わせた値Ｂｉｎａｒｙ２_ｉ（ただし、ｉ＝１〜８）に対し、Ｓ４と同様に、閾値τによる２値化処理を行う。

ちなみに、図３に示すフィルタＦ１〜Ｆ８は、それぞれ上、左斜め上、左、左斜め下、下、右斜め下、右、右斜め上方向から、エッジを検出するフィルタ（３×３行列）である。また、フィルタＦ１〜Ｆ８のそれぞれを掛けて閾値処理を行うことによって、２値データＢｉｎａｒｙ２_ｉ（ただし、ｉ＝１〜８）を得る。そして、この得た２値データＢｉｎａｒｙ２_ｉ（ただし、ｉ＝１〜８）を、論理和演算によって重ね合わせることによって、８方向の全てのエッジ情報を含む２値データＢｉｎａｒｙ２を得る。

実施例１では、エッジ検出フィルタとして、Ｋｉｒｓｃｈフィルタを用いているが、他の代表的なエッジ検出フィルタや、それらを改良したフィルタを用いるようにしてもよい。分割ウィンドウサイズも、３×３にする必要はなく、それに合わせてフィルタの形も多様である。

Ｓ６では、Ｓ３で取得したＨＳＶ色空間データの彩度成分（Ｓ）データに対し、閾値κによって２値化し、２値データＢｉｎａｒｙ３を得る。彩度（Ｓ）データが、閾値κよりも小さければ、黒（１）であるとし、それ以外の場合は白（０）であるとする。

次に、Ｓ４〜Ｓ６で取得した各２値化データＢｉｎａｒｙ１〜Ｂｉｎａｒｙ３を、Ｓ７で、論理和演算で重ね合わせることによって、最終的な２値データＢｉｎａｒｙとする。

Ｂｉｎａｒｙ＝Ｂｉｎａｒｙ１∪Ｂｉｎａｒｙ２∪Ｂｉｎａｒｙ３
Ｓ８では、画像処理装置１００に搭載されている読取センサの種類を、制御部６の情報から、ＣＣＤであるか、またはＣＩＳであるかを識別する。

本装置に実装されている読取センサの種類がＣＩＳであれば、センサの照明系の構造から、光源の光量がさほど大きくはなく、原稿単部に影が出やすく原稿のエッジを検出しやすいので、何もせずに、Ｓ１０へ進む。

一方、本装置に実装されている読取センサの種類がＣＣＤであれば、その光学的構造から、光源の光量が大きいので、原稿単部に影が出にくく原稿の端部を直線として検出し難い（点線として途切れることが多々ある）。したがって、Ｓ７で得た最終的な２値データＢｉｎａｒｙから、直接原稿領域の検出処理に移行した場合、原稿領域を正確に検出することが難しい。

そこで、読取センサがＣＣＤであれば、Ｓ９では、Ｓ７で得た２値データＢｉｎａｒｙに対し、黒画素データの膨張処理、収縮処理を連続的に複数回実行することによって、点線として途切れた原稿の端部を修復し、原稿領域を正確に検出する。

ちなみに、Ｓ９で行う「膨張収縮処理」は、膨張処理と、収縮処理とを、連続的に複数回実行する処理である。上記「膨張処理」は、２値データＢｉｎａｒｙを３×３ウィンドウ毎に分割し、そのウィンドウ内に１つでも黒画素（１）が存在したら、そのウィンドウの中心画素を黒画素（１）とする処理である。上記「収縮処理」は、ウィンドウ内に１つでも白画素（０）が存在したら、そのウィンドウの中心画素を白画素（０）とする処理である。なお、ウィンドウサイズを、３×３以外のサイズにしてもよい。

図４は、実施例１において、原稿の端部が点線であり、途切れた原稿画像と、端部を修復した後の原稿画像とを示す図である。

図４（１）は、原稿の端部が点線であり、途切れた原稿画像２１を示す図である。この途切れた原稿画像２１は、ＣＣＤ読取センサで取得したデータを２値化し、２値データＢｉｎａｒｙとした例である。

図４（２）は、黒画素データの膨張処理、収縮処理を連続的に複数回実行することによって、端部を修復した後の原稿画像２２を示す図である。

Ｓ１０では、２値データＢｉｎａｒｙから、原稿の各頂点位置を検出する。Ｓ１０の原稿の頂点を検出する場合、原稿は矩形原稿であると仮定し、原稿が傾いていることを想定し、以下のように、原稿の頂点を検出する。

図５は、２枚の原稿を原稿台に置いて読み取る場合における例を示す図である。

Ｓ１０の説明のために、図５（１）には、２枚の原稿を原稿台に置いて読み取る例を示す。図５（２）には、Ｓ２〜Ｓ９の処理によって、画像を２値化した画像データを示す。Ｓ１０では、まず、図２（２）に示す画像の中で、黒画素が連続する画像に、ラベル番号を付与する。このときに、連続する黒画素のそれぞれの画素には、同一のラベル番号を付与する。そして、この同一ラベル番号を付与した黒画素の塊を、ラベル画像と呼ぶ。

次に、ラベル画像毎の画素数のヒストグラムを作成し、画素数が所定数以下であるものを、ノイズとし、以降の処理から除外する。

次に、原稿領域を抽出する方法を示す。

図６は、原稿領域検出方法を説明する図である。

図６（１）に点線で示す矩形の各辺が、ラベル画像１に接するように、矩形の位置を設定する。次に、図６（２）に示すように、矩形の傾き角度を少しずつ変化させ、矩形の各辺がラベル画像１に接するように、矩形の位置を設定する。そして、少しずつ傾き角度を変化させた矩形の面積を比較する。これらの矩形の面積が一番小さいものが、原稿画像と一致すると判断し、その矩形の各頂点の位置と傾き角度を原稿領域として汎用機億部７に記憶する。

そして、原稿領域検出を、全てのラベル画像に対して行う。図６（２）に示す例では、ラベル画像２がノイズとして除外されるので、ラベル画像１の次は、ラベル画像３に対して、原稿領域検出が行われる。

ここで、ラベル番号とラベル画像とについて説明する。

図７は、２値画像データを示す図である。

図７には、ＡＢという文字が書かれている。

図８は、ラベル番号を管理する管理テーブルを示す図である。

ラベル番号管理テーブルは、画像データの１画素ごとに、１つの番号記入欄を持ち、各画素の位置と同一位置に対応付けて、番号記入欄が設けられている。

図８に示す例では、文字「Ａ」の２値画像データに、ラベル番号１を付与し、文字「Ｂ」の２値画像データに、ラベル番号２を付与した例である。なお、図８では、番号記入欄の位置が、画素位置と同一位置にあることを分かり易くするために、文字「Ａ」と「Ｂ」との画素位置に対応する番号記入欄を、グレーで着色してある（網点表示してある）。

図８に示すラベル番号管理テーブルは、汎用記憶部７に記憶され、制御部６によって書き替えられる。ラベル管理テーブルは、初期化された状態では、全ての番号記入欄に「０」が記入されている。ラベルを付与する場合は、各番号記入欄の初期値「０」を、ラベル番号に書き替える。

図９は、実際の写真画像を読み取った場合の例として、図５（２）に示す画像データのラベル管理テーブルを示す図である。

Ｓ１１では、検出した原稿領域を表示する。ここで、Ｓ１０で検出された原稿領域は、１つであるとは限らない。

図１０は、原稿領域候補リストを示す図である。

検出された原稿領域は、図１０に示す候補リストに格納される。

図１１は、実施例１の説明図である。

原稿自体が、４つの直角を有する四角形ではなく、図１１に示すように、台形ＰＱＲＳであれば、検出された各頂点の座標を比較し、台形ＰＱＲＳを、矩形ＰＱ’ＲＳに置き換える。このように、原稿を含む最小の矩形領域ＰＱ’ＲＳを、原稿領域として検出する。

図１２は、実施例１の動作を示すフローチャートである。

Ｓ２２では、検出した原稿領域を、原稿領域候補リストへ登録する。Ｓ２３では、検出した原稿領域を、原稿領域候補リストから、２つの原稿領域候補を選択する。Ｓ２４では、選択された２つの原稿領域候補が互いに重なっているかどうかを調べる。選択された２つの原稿領域候補が互いに重なっていれば、Ｓ２５では、検出した原稿領域を、原稿領域候補リストから削除し、終了する（Ｓ２６）。

図１３は、実施例１の説明図であり、矩形の原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３と、矩形に置き換えられた原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３とが重なっている状態を示す図である。

図１３に示すように、矩形の原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３と、矩形に置き換えられた原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３とが検出されたとする。

ここで、まず、矩形の原稿Ｐ_０Ｐ_１Ｐ_２Ｐ_３を、基本原稿とし、矩形に置き換えられた原稿領域原稿Ｑ_０Ｑ_１Ｑ_２Ｑ_３を、参照原稿とする。各原稿の幅（ｐＷｉｄｔｈ，ｑＷｉｄｔｈ）と高さ（ｐＨｅｉｇｈｔ，ｑＨｅｉｇｈｔ）とを求める。原稿の幅と高さとは、２点間の距離計算（たとえば、Ｐ_０（ｘ_０，ｙ_０）と、Ｐ_１（ｘ_１，ｙ_１）間の距離

等によって容易に求めることができる。

次に、原稿Ｐ_０Ｐ_１Ｐ_２Ｐ_３の２頂点Ｐ_０とＰ_１、Ｐ_１とＰ_２、Ｐ_２とＰ_３、Ｐ_３とＰ_０を、それぞれ通過する直線式ｌ_０〜ｌ_３を求める。なお、２点Ｐ_０（ｘ_０，ｙ_０）とＰ_１（ｘ_１，ｙ_１）とを通過する直線の式は、

等を利用することによって求めることができる。

次に、原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３の頂点Ｑｎ（ｎは０〜３）から、直線ｌ_０〜ｌ_３への垂線の長さｄ_ｎ０〜ｄ_ｎ３を求める。

なお、点Ｐ_０（ｘ_０，ｙ_０）から、直線ａｘ＋ｂｙ＋ｃ＝０への垂線の長さｄは、

等を利用することによって、求めることができる。

次に、垂線の長さの和ｄ_ｎ０＋ｄ_ｎ２と、原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３の高さｐＨｅｉｇｈｔおよび垂線の長さの和ｄ_ｎ１＋ｄ_ｎ３と、原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３の幅ｐＷｉｄｔｈとを、それぞれ比較する。そして、ｄ_ｎ０＋ｄ_ｎ２≦ｐＨｅｉｇｈｔであり、かつｄ_ｎ１＋ｄ_ｎ３≦ｐＷｉｄｔｈであれば、原稿Ｑ_０Ｑ_１Ｑ_２Ｑ_３の頂点Ｑ_ｎは、原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３上に存在することが分かる。すなわち、原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３と原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３とは、互いに重なっている。

原稿が重なっていれば、これら重なっている原稿の双方を、原稿領域候補リストから除外する。ｄ_ｎ０＋ｄ_ｎ２＞ｐＨｅｉｇｈｔであり、または、ｄ_ｎ１＋ｄ_ｎ３＞ｐＷｉｄｔｈであれば、原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３と原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３とは互いに重なっていないと判断することが可能である。全ての頂点に対して重なり判定をしたら、原稿領域候補リストから、次の２つを選択し、基本原稿を、原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３とし、参照原稿を原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３として、上記と同様に、重なり判定を実施する。このようにして、原稿領域候補リストに登録されている全ての候補に対して、互いに重なっているか否かを判定する。

そして、Ｓ１２では、確定した原稿領域のみを本読み取りし、Ｓ１３に進み、この本読み取りした原稿領域データを印刷し、終了する。

上記説明では、原稿が互いに重なっている場合、双方の原稿を、リストから除外する。しかし、図１３に示すような重なりの場合、重なり判定の結果、原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３と、原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３は、相互に領域が重なっていると判断されるので、どちらかに他方の画像の一部が入り込んでいると判断することができる。したがって、原稿領域の一部が入り込まれている原稿領域（図１３では、領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３）のみを、原稿領域候補リストから除外し、他方の原稿領域（図１３では、領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３）を抽出するようにしてもよい。

つまり、原稿領域として検出された原稿同士が重なり合っている場合、原稿領域として、一方の原稿領域を抽出しないようにすることができる。

具体的には、以下の判定を行う。

図１４は、ラベル管理テーブルの例として、図１３に示す画像に対応するラベル管理テーブルを示す図である。

図１２に示す処理によって、ラベル１が付与されているラベル画像１と、ラベル２が付与されているラベル画像２とが重なっていると判断されると、領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３の面積分の画素数に対するラベル画像１の画素数の比率１を求める。これと同様に、領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３の面積分の画素数に対するラベル画像２の画素数の比率２を求める。これらの比率が１に近ければ、ラベル画像の面積と、図１３で説明した矩形領域（領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３と領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３）の面積との差が小さく、ラベル画像は、矩形に近いと判断できる。一方、この比率が小さければ、ラベル画像の形状が矩形でないと判断できる。よって、比率１と比率２とを比較し、比率が１に近い方を矩形画像と判断し、比率が低い方を原稿領域の一部が入り込まれている原稿領域（図１３では、領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３）であると判断する。

なお、比率１、比率２ともに、その値が１より低い所定値以下であれば、両方とも矩形画像ではないと判断し、この場合、どちらがどちらに入り込まれているのかを判断することができないので、両方とも原稿領域候補リストから除外する。

図９に示すように、ラベル画像の中間に白領域があるので、ラベル画素数が低くなっていることも考えられるので、上記比率を求める際には、ラベル画像の中にある空白領域の画素数を、ラベル画像の画素数に加えてもよい。このようにすれば、ラベル画像の中に存在している空白領域によって、ラベル画像の画素数が少なくならずに済み、上記比率が下がり、矩形ではないと判断されることを防止することができる。

次に、ユーザが複数の原稿をわざと重ねた場合について説明する。

図１５は、原稿１と原稿２とを重ねた場合の説明図である。

図１５（１）に示すように、原稿１と原稿２とを重ねると、図１５（２）に示すように、原稿１と原稿２との画素が連続するので、連続画素の塊は１つになる。

よって、ラベル画像は１つになり、原稿は１枚であると判断される。この場合、原稿領域は、図１５（２）に示すように、点線のように判断される。

なお、上記実施例において、抽出した原稿が、台形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識する。このようにする代わりに、抽出した原稿が、三角形、円形、楕円形等の原稿、つまり、非矩形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識するようにしてもよい。

実施例１では、検出した原稿領域が互いに重なり合っている場合、それらを原稿領域候補リストから除外することによって、本読み取りすべき原稿領域ではないと判断する。

下記に示すように、その処理を変更することによって、互いに重なり合った領域を除去した双方の原稿領域候補を原稿領域として扱うことができる。

たとえば、図１３に示すように、原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３と、原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３とが互いに重なっていると判断された場合、双方の原稿領域を抽出すると、原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３に、原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３の一部が入り込む。しかし、実施例１で示したように、原稿領域のどの頂点が相手側の原稿領域に重なっているかは、既に分かっているので、原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３上の重なり領域を導き出すことができる。相手側の領域に入り込んでいる側と、入り込まれている側との判断は、実施例１のように、ラベル画像が各辺に接する矩形の面積に対応する画素数と、ラベル画像の画素数との比率に基づいて断する。

図１３に示す場合、頂点Ｐ_１，Ｐ_２，Ｐ_３の座標を、それぞれ、（ｘ_ｐ１，ｙ_ｐ１），（ｘ_ｐ２，ｙ_ｐ２），（ｘ_ｐ３，ｙ_ｐ３）とし、頂点Ｑ_０の座標を、（ｘ_ｑ０，ｙ_ｑ０）とすると、重なり領域は、
ｘ_ｑ０≦ｘ≦ｘ_ｍａｘ
ｙ_ｑ０≦ｙ≦ｙ_ｍａｘ
の範囲となる。

ただし、ｘ_ｍａｘ＝ｍａｘ（［ｘ_ｐ１ｘ_ｐ２ｘ_ｐ３ｘ_ｑ０］）、ｙ_ｍａｘ＝ｍａｘ（［ｙ_ｐ１ｙ_ｐ２ｙ_ｐ３ｙ_ｑ０］）である。そして、その重なり領域を白色等で塗りつぶすことによって、入り込んだ相手側の原稿の一部を除去した原稿領域を抽出することができる。

以上によって、原稿領域として検出されたもの同士が重なり合っている場合、入り込まれている側の画像から、他方の画像が入り込んだ部分の領域を除去することができる。

上記実施例によれば、２つの原稿を検出した場合、たとえば、その一方の原稿が矩形であり、他方の原稿が台形であり、しかも、矩形原稿の近くに台形原稿が存在している場合、矩形原稿と台形原稿との相対位置によって、これらの原稿の処理が異常にならない。ここでいう「異常」は、重なり判定によってエラーとなり、本スキャンが出来ないことである。

本発明の実施例３は、２つの原稿が完全に重なり合っているときに、各原稿の２辺の長さを比較し、小さい原稿の２辺の長さがともに、大きい原稿の２辺の長さの７０％以上であれば、小さい原稿を残し、大きい原稿を除去する実施例である。

図１６は、フチあり原稿の例を示す図である。

図１６に示すようなフチあり原稿を読み取ったときに、フチ部のエッジがハッキリと捕らえられない場合がある。この場合、１枚のフチあり原稿を読み取ったにもかかわらず、これを判定すると、２枚の原稿が重なっていると誤判定し、原稿領域抽出に失敗することがある。

図１７は、図１６に示す原稿を内部処理し、２値化した状態を示す図である。

図１７（１）は、図１６に示す原稿を内部処理し、２値化した状態を示す図であり、フチのエッジがハッキリと捕らえられない。したがって、１枚のフチあり原稿を、図１７（２）に示す矩形領域Ｒ１と、図１７（３）に示す矩形領域Ｒ２との２つの原稿であると誤認識する。この場合、実施例１のアルゴリズムであれば、双方の原稿が除去される。

しかし、実施例３による処理では、図１７（３）に示す矩形領域Ｒ２、つまり、フチなし原稿領域がきちんと抽出される。

すなわち、２つの原稿が完全に重なり合っているときに、各原稿の２辺の長さを比較し、小さい原稿の２辺の長さがともに、大きい原稿の２辺の長さの７０％以上であれば、小さい原稿を残し、大きい原稿を除去するので、フチなし原稿領域がきちんと抽出される。

なお、実施例３において、２つの原稿が完全に重なり合っているときに、各原稿の２辺の長さを比較し、小さい原稿の２辺の長さがともに、大きい原稿の２辺の長さの７０％以上であれば、小さい原稿を残し、大きい原稿を除去する。この「７０％」の代わりに、所定の割合を使用するようにしてもよい。

また、実施例３において、２つの原稿が完全に重なり合っているときに、各原稿の面積を比較し、小さい面積の原稿の面積が、大きい面積の原稿の面積の所定割合以上であれば、小さい面積の原稿を残し、大きい面積の原稿を除去するようにしてもよい。

本発明の実施例４は、２つの原稿が完全に重なり合っているときに、各原稿の２辺の長さを比較し、小さい原稿の２辺の長さがともに、大きい原稿の２辺の長さの７０％未満である場合、大きい原稿を残し、小さい原稿を除去する。この場合、完全に重なり合っていること、すなわち、大きい原稿内に小さい原稿が完全に含まれている事を確認する必要がある。

図１８は、原稿内部に原稿と思われる領域が存在する原稿の例を示す図である。

つまり、たとえば名刺４１という原稿に、その写真４２が存在している場合、写真４２が、名刺４１という原稿とは別の原稿であると認識される可能性がある。

図１９は、図１８に示す原稿（名刺４１）の２値化データと、名刺４１という原稿の原稿領域４３、４４を示す図である。

図１９（１）は、図１８に示す名刺４１という原稿の２値化データを示す図である。図１９（２）は、名刺４１という原稿から抽出された原稿領域４３、４４を示す図である。原稿領域４３は、名刺４１の外縁であり、原稿領域４４は、名刺４１に記載されている写真４３の外縁である。なお、図１９（２）は、原稿領域のみを示すので、図１９（１）に記載されている画像内容（たとえば名刺に記載されている文字、図形、人物等）は、表示されない。

図１９（２）の外側矩形部（原稿領域４３）と、図１９（２）の内側矩形部（原稿領域４４）との２つの原稿領域が抽出される。

ここで、単純に内側の原稿のみを残すと、本来残すべき原稿内容（たとえば名刺４１に記載されている文字、図形、人物等）を抽出できない。この状態を阻止するために、２つの原稿が完全に重なり合っているときに、各原稿の２辺の長さを比較し、小さい原稿の２辺の長さがともに、大きい原稿の２辺の長さの７０％未満である場合、大きい原稿を残し、小さい原稿を除去する。このようにして、大きい原稿を残すことによって、本スキャンでは、大きい原稿領域が本スキャンされ、図形、人物写真が記載されている名刺等の原稿全域を読み取ることが出来る。

なお、実施例４において、２つの原稿が完全に重なり合っているときに、各原稿の２辺の長さを比較し、小さい原稿の２辺の長さがともに、大きい原稿の２辺の長さの７０％未満であれば、大きい原稿を残し、小さい原稿を除去する。この「７０％」の代わりに、所定の割合を使用するようにしてもよい。

また、実施例４において、２つの原稿が完全に重なり合っているときに、各原稿の面積を比較し、小さい面積の原稿の面積が、大きい面積の原稿の面積の所定割合未満であれば、小さい面積の原稿を残し、大きい面積の原稿を除去するようにしてもよい。

本発明の実施例１である画像処理装置１００を示すブロック図である。画像処理装置１００が原稿領域検出する動作を示すフローチャートである。実施例１において使用するフィルタの例を示す図である。実施例１において、原稿の端部が点線であり、途切れた原稿画像と、端部を修復した後の原稿画像とを示す図である。２枚の原稿を原稿台に置いて読み取る例を示す図である。原稿領域検出方法を説明する図である。ラベル番号とラベル画像の元になる２値画像を説明する図である。ラベル番号とラベル画像を説明する図である。ラベル管理テーブルの例を示す図である。原稿領域候補リストを示す図である。実施例１の説明図である。実施例１の動作を示すフローチャートである。実施例１の説明図であり、矩形の原稿領域Ｐ_０Ｐ_１Ｐ_２Ｐ_３と、矩形に置き換えられた原稿領域Ｑ_０Ｑ_１Ｑ_２Ｑ_３とが重なっている状態を示す図である。ラベル管理テーブルの例を示す図である。原稿１と原稿２とを重ねた場合の説明図である。フチあり原稿の例を示す図である。図１６に示す原稿を内部処理し、２値化した状態を示す図である。原稿内部に原稿と思われる領域が存在する原稿の例を示す図である。図１８に示す原稿（名刺４１）の２値化データと、名刺４１という原稿の原稿領域４３、４４を示す図である。

符号の説明

１００…画像処理装置、
１…外部Ｉ／Ｆ、
２…入力操作部、
３…印刷部、
４…読取部、
５…表示部、
６…制御部、
７…汎用記憶部。

Claims

原稿領域を抽出する画像処理装置において、
原稿を読み取る読取手段と；
上記読取手段が出力した読取データに基づいて、原稿領域を抽出する原稿領域抽出手段と；
上記原稿領域抽出手段が抽出した原稿が、非矩形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識する原稿領域認識手段と；
上記原稿領域抽出手段が抽出した複数の原稿領域が互いに重なっているか否かを判定する原稿重なり判定手段と；
を有することを特徴とする画像処理装置。
請求項１において、
上記原稿重なり判定手段が、複数の原稿が互いに重なっていると判定した場合、複数の原稿が互いに重なっていることを、ユーザに通知する通知手段を有することを特徴とする画像処理装置。
請求項１において、
上記原稿重なり判定手段が、複数の原稿が互いに重なっていると判定した場合、重なっている複数の原稿のうちで、大きい面積の原稿を残し、小さい面積の原稿を削除する原稿削除手段を有することを特徴とする画像処理装置。
請求項１において、
上記原稿重なり判定手段が、第１の原稿の上に第２の原稿が重なり、上記第１の原稿から上記第２の原稿がはみ出さず、しかも、上記第２の原稿の面積が、上記第１の原稿の面積の所定割合以上の面積である場合、上記第２の原稿を残し、上記第１の原稿を削除する原稿削除手段を有することを特徴とする画像処理装置。
請求項１において、
上記原稿領域抽出手段が抽出した１つまたは複数の原稿領域候補を、原稿領域候補リストとして保持する原稿領域候補登録手段を有することを特徴とする画像処理装置。
請求項１において、
上記原稿領域認識手段は、上記複数の原稿領域が互いに重なっていると、上記原稿重なり判定手段が判定した場合、上記複数の原稿領域のうちの１つの原稿領域を、原稿領域として識別しない手段であることを特徴とする画像処理装置。
請求項１において、
原稿の重なり領域を加工する重なり領域加工手段を有し、
上記原稿重なり判定手段が、原稿領域が互いに重なっていると判定した場合は、上記領域加工手段が、互いの原稿領域から重なり部分を除去し、複数の原稿領域として抽出することを特徴とする画像処理装置。
原稿領域を抽出する画像処理装置の制御方法において、
原稿を読み取る読取工程と；
上記読取工程で出力された読取データに基づいて、原稿領域を抽出する原稿領域抽出工程と；
上記原稿領域抽出工程で抽出した原稿が、非矩形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識する原稿領域認識工程と；
上記原稿領域抽出工程で抽出された複数の原稿領域が互いに重なっているか否かを判定する原稿重なり判定工程と；
を有することを特徴とする画像処理装置の制御方法。