JP2007081458A - 画像処理装置および画像処理装置の制御方法 - Google Patents

画像処理装置および画像処理装置の制御方法 Download PDF

Info

Publication number
JP2007081458A
JP2007081458A JP2005262703A JP2005262703A JP2007081458A JP 2007081458 A JP2007081458 A JP 2007081458A JP 2005262703 A JP2005262703 A JP 2005262703A JP 2005262703 A JP2005262703 A JP 2005262703A JP 2007081458 A JP2007081458 A JP 2007081458A
Authority
JP
Japan
Prior art keywords
document
area
overlap
processing apparatus
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005262703A
Other languages
English (en)
Other versions
JP4574503B2 (ja
Inventor
Nobuyuki Sakauchi
宣行 坂内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005262703A priority Critical patent/JP4574503B2/ja
Priority to US11/470,694 priority patent/US20080018951A1/en
Publication of JP2007081458A publication Critical patent/JP2007081458A/ja
Application granted granted Critical
Publication of JP4574503B2 publication Critical patent/JP4574503B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimiles In General (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract


【課題】 原稿と原稿台の圧板との色差がわずかである場合や、読取装置の読取センサとしてCCDが使用されている場合でも、原稿領域を検出することが容易である画像処理装置および画像処理装置の制御方法を提供することを目的とするものである。

【解決手段】 原稿領域を抽出する画像処理装置において、原稿を読み取る読取手段と、上記読取手段が出力した読取データに基づいて、原稿領域を抽出する原稿領域抽出手段と、上記原稿領域抽出手段が抽出した原稿が、非矩形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識する原稿領域認識手段と、上記原稿領域抽出手段が抽出した複数の原稿領域が互いに重なっているか否かを判定する原稿重なり判定手段とを有することを特徴とする画像処理装置である。

【選択図】 図1

Description

本発明は、画像処理装置およびその制御方法に係り、特に、原稿領域を抽出して読み取り、その読み取った画像を保存または印刷する画像処理装置およびその制御方法に関する。
従来の画像処理装置において、原画像から矩形領域を検出し、切り出すためのアルゴリズムが多く提案されている。また、抽出された矩形領域の重なり判定を行う装置が知られている。
輪郭抽出を行い、輪郭が直線を成す部分を探すことによって、矩形領域を探索する画像処理装置が知られている(たとえば、特許文献1参照)。この従来例は、ノイズの多い環境下では、矩形輪郭の直線部分を検出することが困難であり、また、4つの直線を関連付けて1個の矩形を検出することが困難であるという問題がある。上記「ノイズ」は、原稿台の汚れ、原稿台の圧板の汚れ、原稿台の歪み等によって発生する。
また、ノイズの多い環境下でも検出精度を向上させるために、2値化した原画像データから、水平方向と垂直方向との黒画素数のヒストグラムを作成し、この作成されたヒストグラムに基づいて、それを台形近似する。これによって、矩形の存在と傾き方向とを検出する画像処理装置が知られている(たとえば、特許文献2参照)。
この従来例では、原稿領域と背景との境界が曖昧である場合、つまり、読取装置において、原稿と原稿台の圧板との色差がわずかである場合等には、原稿領域を検出することが困難であるという問題がある。
さらに、検出した矩形領域が重なっているか否かを判定する対象である領域が、多角形形状であるかどうかを判定する画像処理装置が知られている(たとえば、特許文献3参照)。この従来例は、互いに重なっているか否かの判定は可能であるが、矩形領域の分離や重なり領域のサイズ等を把握することが不可能であるという問題がある。
そして、各領域の画素に、互いに異なる値を付与することによって、領域同士の重なり判定を行う画像処理装置が知られている(たとえば、特許文献4参照)。この従来例は、各領域サイズと画像データの解像度とが大きくなればなる程、値付与の処理回数が大幅に増加し、これに応じて処理時間が増大するという問題がある。
特開平8−237537号公報(第15頁、図10) 特開2004−30430号公報(第17頁、図9) 特開2004−260457号公報(第9頁、図3および図6) 特開平9−106460号公報(第8頁、図5)
つまり、上記従来例は、原稿と原稿台の圧板との色差がわずかである場合には、原稿領域を検出することが困難であるという問題がある。また、矩形領域の分離や重なり領域のサイズ等を把握することができないという問題がある。そして、各領域サイズと画像データの解像度とが大きくなればなるほど、各領域の画素に付与する値付与の処理回数が大幅に増加し、これに応じて処理時間が増大するという問題がある。
本発明は、原稿と原稿台の圧板との色差がわずかである場合でも、原稿領域を検出することが容易である画像処理装置および画像処理装置の制御方法を提供することを目的とするものである。
また、本発明は、矩形領域の分離や重なり領域のサイズ等を把握することができる画像処理装置および画像処理装置の制御方法を提供することを目的とするものである。
さらに、本発明は、各領域サイズと画像データの解像度とが大きくなっても、処理時間が増大しない画像処理装置および画像処理装置の制御方法を提供することを目的とするものである。
本発明は、原稿領域を抽出する画像処理装置において、原稿を読み取る読取手段と、上記読取手段が出力した読取データに基づいて、原稿領域を抽出する原稿領域抽出手段と、上記原稿領域抽出手段が抽出した原稿が、非矩形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識する原稿領域認識手段と、上記原稿領域抽出手段が抽出した複数の原稿領域が互いに重なっているか否かを判定する原稿重なり判定手段とを有することを特徴とする画像処理装置である。
本発明によれば、画像処理装置で読み取った読取画像から抽出された複数の原稿領域が互いに重なっている場合、互いに重なっている原稿領域に対して双方または一方の原稿領域を無視するので、複数の原稿が互いに重なったままで抽出されることを防止できる。
また、本発明によれば、互いに重なっている領域を加工するので、重なっている双方の原稿領域を抽出することが可能となる。
発明を実施するための最良の形態は、次の実施例である。
図1は、本発明の実施例1である画像処理装置100を示すブロック図である。
画像処理装置100は、原画像データ中の原稿領域を検出する装置であり、外部インタフェース部1と、入力操作部2と、印刷部3と、読取部4と、表示部5と、制御部6と、汎用記憶部7とを有する。
外部インタフェース部1は、ディジタルカメラで撮影した画像データ等を本体装置に入力するためのインタフェースである。通常、各種メモリカードのスロットや、ディジタルカメラやPCと接続するためのUSBコネクタ等を備えている。メモリカード用の物理的な受け口として、PCMCIAスロットをはじめ、各種メモリカードへの対応も物理的に接続可能な専用スロットが設けられている。また、非接触のインタフェースとして、IrDA(赤外線通信)ポート等によるデータ伝送を行うようにしてもよい。
入力操作部2は、ユーザが画像処理装置100を操作する部分である。印刷部3は、インクジェット方式のプリンタであり、外部I/F1に接続されているPCやメモリカード等からのデータや、読取部4が読み取った画像データを印刷する。その印刷方式等に制限はない。
読取部4は、銀塩写真や雑誌等を画像データ(ディジタルデータ)として読み取るCCD方式、または、CIS方式のカラースキャナである。表示部5は、読み込んだ画像データや、装置の状態情報や入力操作部2からのユーザによる入力情報等を表示する。制御部6は、実施例1の各制御手順を実行し、各種センサが画像処理装置100の状態を取得するためのものである。図2に示すフローチャートの動作を実行する。
汎用記憶部7は、実施例1における各種制御手段を実現するプログラムおよびデータ等を納め、制御実行のために必要に応じて作業領域としても使用する。
次に、画像処理装置100が原稿領域を検出する動作について説明する。
図2は、画像処理装置100が原稿領域検出する動作を示すフローチャートである。
まず、画像処理装置100は、S1で、開始し、ユーザからの操作を待ち受けるスタンバイ状態になる。
次に、ユーザの操作によって複数原稿領域自動検出が指示された場合等、複数原稿領域自動検出が必要である場合、S2で、本来の読取としてユーザが指定している色、解像度ではなく、RGBカラー、75dpiで前読み取りを行う。ここで、解像度を75dpiとしたが、画像処理装置100に使用される読取センサの仕様によって、他の解像度で読み取るようにしてもよい。なお、原稿領域検出の解析処理を高速化するために、本読み取り時の解像度よりも低い解像度で読み取ることが望ましい。
次に、S2で、前読み取りし、RGBカラー、75dpiで読み取ったデータを、S3では、彩度(S)と明度(V)との情報を含む色空間であるHSV色空間データへ変換する。ここで、彩度(S)と明度(V)との情報を含む色空間として、HSV色空間を示したが、HSV色空間にこだわることはなく、彩度(S)と明度(V)との情報を含む色空間であれば、どの色空間に変換するようにしてもよい。RGB色空間からHSV色空間への変換方式は多様であるが、画像処理装置100においては、色差(H)、彩度(S)および明度(V)への色空間の変換式として、それぞれ下記の式を用いる。
Figure 2007081458
Figure 2007081458
V=max(R,G,B)
ただし、上式中のmax(R,G,B)は、各要素値の中の最大値であり、min(R,G,B)は、各要素値の中の最小値である。また、各データ値は、0〜255の範囲(整数値)になるように、スケール変換を行う。
次に、S4〜S6の処理を、互いに並行に実行する。
S4では、S3で取得したHSV色空間データの明度成分(V)データに対し、閾値τによって2値化し、2値データBinary1を得る。明度(V)データが、閾値τよりも小さければ、黒(以下の式において黒を1と表す)とし、それ以外の場合は、白(以下の式において白を0と表す)とする。
Figure 2007081458
図3は、実施例1において使用するフィルタの例を示す図である。
S5では、S3で取得したHSV色空間データの明度成分(V)データを、3×3ウィンドウ毎に分割する。そして、図3に示す8つのKirschエッジ検出フィルタF1〜F8を、それぞれ掛け合わせた値Binary2(ただし、i=1〜8)に対し、S4と同様に、閾値τによる2値化処理を行う。
ちなみに、図3に示すフィルタF1〜F8は、それぞれ上、左斜め上、左、左斜め下、下、右斜め下、右、右斜め上方向から、エッジを検出するフィルタ(3×3行列)である。また、フィルタF1〜F8のそれぞれを掛けて閾値処理を行うことによって、2値データBinary2(ただし、i=1〜8)を得る。そして、この得た2値データBinary2(ただし、i=1〜8)を、論理和演算によって重ね合わせることによって、8方向の全てのエッジ情報を含む2値データBinary2を得る。
Figure 2007081458
実施例1では、エッジ検出フィルタとして、Kirschフィルタを用いているが、他の代表的なエッジ検出フィルタや、それらを改良したフィルタを用いるようにしてもよい。分割ウィンドウサイズも、3×3にする必要はなく、それに合わせてフィルタの形も多様である。
S6では、S3で取得したHSV色空間データの彩度成分(S)データに対し、閾値κによって2値化し、2値データBinary3を得る。彩度(S)データが、閾値κよりも小さければ、黒(1)であるとし、それ以外の場合は白(0)であるとする。
Figure 2007081458
次に、S4〜S6で取得した各2値化データBinary1〜Binary3を、S7で、論理和演算で重ね合わせることによって、最終的な2値データBinaryとする。
Binary=Binary1∪Binary2∪Binary3
S8では、画像処理装置100に搭載されている読取センサの種類を、制御部6の情報から、CCDであるか、またはCISであるかを識別する。
本装置に実装されている読取センサの種類がCISであれば、センサの照明系の構造から、光源の光量がさほど大きくはなく、原稿単部に影が出やすく原稿のエッジを検出しやすいので、何もせずに、S10へ進む。
一方、本装置に実装されている読取センサの種類がCCDであれば、その光学的構造から、光源の光量が大きいので、原稿単部に影が出にくく原稿の端部を直線として検出し難い(点線として途切れることが多々ある)。したがって、S7で得た最終的な2値データBinaryから、直接原稿領域の検出処理に移行した場合、原稿領域を正確に検出することが難しい。
そこで、読取センサがCCDであれば、S9では、S7で得た2値データBinaryに対し、黒画素データの膨張処理、収縮処理を連続的に複数回実行することによって、点線として途切れた原稿の端部を修復し、原稿領域を正確に検出する。
ちなみに、S9で行う「膨張収縮処理」は、膨張処理と、収縮処理とを、連続的に複数回実行する処理である。上記「膨張処理」は、2値データBinaryを3×3ウィンドウ毎に分割し、そのウィンドウ内に1つでも黒画素(1)が存在したら、そのウィンドウの中心画素を黒画素(1)とする処理である。上記「収縮処理」は、ウィンドウ内に1つでも白画素(0)が存在したら、そのウィンドウの中心画素を白画素(0)とする処理である。なお、ウィンドウサイズを、3×3以外のサイズにしてもよい。
図4は、実施例1において、原稿の端部が点線であり、途切れた原稿画像と、端部を修復した後の原稿画像とを示す図である。
図4(1)は、原稿の端部が点線であり、途切れた原稿画像21を示す図である。この途切れた原稿画像21は、CCD読取センサで取得したデータを2値化し、2値データBinaryとした例である。
図4(2)は、黒画素データの膨張処理、収縮処理を連続的に複数回実行することによって、端部を修復した後の原稿画像22を示す図である。
S10では、2値データBinaryから、原稿の各頂点位置を検出する。S10の原稿の頂点を検出する場合、原稿は矩形原稿であると仮定し、原稿が傾いていることを想定し、以下のように、原稿の頂点を検出する。
図5は、2枚の原稿を原稿台に置いて読み取る場合における例を示す図である。
S10の説明のために、図5(1)には、2枚の原稿を原稿台に置いて読み取る例を示す。図5(2)には、S2〜S9の処理によって、画像を2値化した画像データを示す。S10では、まず、図2(2)に示す画像の中で、黒画素が連続する画像に、ラベル番号を付与する。このときに、連続する黒画素のそれぞれの画素には、同一のラベル番号を付与する。そして、この同一ラベル番号を付与した黒画素の塊を、ラベル画像と呼ぶ。
次に、ラベル画像毎の画素数のヒストグラムを作成し、画素数が所定数以下であるものを、ノイズとし、以降の処理から除外する。
次に、原稿領域を抽出する方法を示す。
図6は、原稿領域検出方法を説明する図である。
図6(1)に点線で示す矩形の各辺が、ラベル画像1に接するように、矩形の位置を設定する。次に、図6(2)に示すように、矩形の傾き角度を少しずつ変化させ、矩形の各辺がラベル画像1に接するように、矩形の位置を設定する。そして、少しずつ傾き角度を変化させた矩形の面積を比較する。これらの矩形の面積が一番小さいものが、原稿画像と一致すると判断し、その矩形の各頂点の位置と傾き角度を原稿領域として汎用機億部7に記憶する。
そして、原稿領域検出を、全てのラベル画像に対して行う。図6(2)に示す例では、ラベル画像2がノイズとして除外されるので、ラベル画像1の次は、ラベル画像3に対して、原稿領域検出が行われる。
ここで、ラベル番号とラベル画像とについて説明する。
図7は、2値画像データを示す図である。
図7には、ABという文字が書かれている。
図8は、ラベル番号を管理する管理テーブルを示す図である。
ラベル番号管理テーブルは、画像データの1画素ごとに、1つの番号記入欄を持ち、各画素の位置と同一位置に対応付けて、番号記入欄が設けられている。
図8に示す例では、文字「A」の2値画像データに、ラベル番号1を付与し、文字「B」の2値画像データに、ラベル番号2を付与した例である。なお、図8では、番号記入欄の位置が、画素位置と同一位置にあることを分かり易くするために、文字「A」と「B」との画素位置に対応する番号記入欄を、グレーで着色してある(網点表示してある)。
図8に示すラベル番号管理テーブルは、汎用記憶部7に記憶され、制御部6によって書き替えられる。ラベル管理テーブルは、初期化された状態では、全ての番号記入欄に「0」が記入されている。ラベルを付与する場合は、各番号記入欄の初期値「0」を、ラベル番号に書き替える。
図9は、実際の写真画像を読み取った場合の例として、図5(2)に示す画像データのラベル管理テーブルを示す図である。
S11では、検出した原稿領域を表示する。ここで、S10で検出された原稿領域は、1つであるとは限らない。
図10は、原稿領域候補リストを示す図である。
検出された原稿領域は、図10に示す候補リストに格納される。
図11は、実施例1の説明図である。
原稿自体が、4つの直角を有する四角形ではなく、図11に示すように、台形PQRSであれば、検出された各頂点の座標を比較し、台形PQRSを、矩形PQ’RSに置き換える。このように、原稿を含む最小の矩形領域PQ’RSを、原稿領域として検出する。
図12は、実施例1の動作を示すフローチャートである。
S22では、検出した原稿領域を、原稿領域候補リストへ登録する。S23では、検出した原稿領域を、原稿領域候補リストから、2つの原稿領域候補を選択する。S24では、選択された2つの原稿領域候補が互いに重なっているかどうかを調べる。選択された2つの原稿領域候補が互いに重なっていれば、S25では、検出した原稿領域を、原稿領域候補リストから削除し、終了する(S26)。
図13は、実施例1の説明図であり、矩形の原稿領域Pと、矩形に置き換えられた原稿領域Qとが重なっている状態を示す図である。
図13に示すように、矩形の原稿領域Pと、矩形に置き換えられた原稿領域Qとが検出されたとする。
ここで、まず、矩形の原稿Pを、基本原稿とし、矩形に置き換えられた原稿領域原稿Qを、参照原稿とする。各原稿の幅(pWidth,qWidth)と高さ(pHeight,qHeight)とを求める。原稿の幅と高さとは、2点間の距離計算(たとえば、P(x,y)と、P(x,y)間の距離
Figure 2007081458
等によって容易に求めることができる。
次に、原稿Pの2頂点PとP、PとP、PとP、PとPを、それぞれ通過する直線式l〜lを求める。なお、2点P(x,y)とP(x,y)とを通過する直線の式は、
Figure 2007081458
等を利用することによって求めることができる。
次に、原稿領域Qの頂点Qn(nは0〜3)から、直線l〜lへの垂線の長さdn0〜dn3を求める。
なお、点P(x,y)から、直線ax+by+c=0への垂線の長さdは、
Figure 2007081458
等を利用することによって、求めることができる。
次に、垂線の長さの和dn0+dn2と、原稿領域Pの高さpHeightおよび垂線の長さの和dn1+dn3と、原稿領域Pの幅pWidthとを、それぞれ比較する。そして、dn0+dn2≦pHeightであり、かつdn1+dn3≦pWidthであれば、原稿Qの頂点Qは、原稿領域P上に存在することが分かる。すなわち、原稿領域Pと原稿領域Qとは、互いに重なっている。
原稿が重なっていれば、これら重なっている原稿の双方を、原稿領域候補リストから除外する。dn0+dn2>pHeightであり、または、dn1+dn3>pWidthであれば、原稿領域Pと原稿領域Qとは互いに重なっていないと判断することが可能である。全ての頂点に対して重なり判定をしたら、原稿領域候補リストから、次の2つを選択し、基本原稿を、原稿領域Pとし、参照原稿を原稿領域Qとして、上記と同様に、重なり判定を実施する。このようにして、原稿領域候補リストに登録されている全ての候補に対して、互いに重なっているか否かを判定する。
そして、S12では、確定した原稿領域のみを本読み取りし、S13に進み、この本読み取りした原稿領域データを印刷し、終了する。
上記説明では、原稿が互いに重なっている場合、双方の原稿を、リストから除外する。しかし、図13に示すような重なりの場合、重なり判定の結果、原稿領域Qと、原稿領域Pは、相互に領域が重なっていると判断されるので、どちらかに他方の画像の一部が入り込んでいると判断することができる。したがって、原稿領域の一部が入り込まれている原稿領域(図13では、領域Q)のみを、原稿領域候補リストから除外し、他方の原稿領域(図13では、領域P)を抽出するようにしてもよい。
つまり、原稿領域として検出された原稿同士が重なり合っている場合、原稿領域として、一方の原稿領域を抽出しないようにすることができる。
具体的には、以下の判定を行う。
図14は、ラベル管理テーブルの例として、図13に示す画像に対応するラベル管理テーブルを示す図である。
図12に示す処理によって、ラベル1が付与されているラベル画像1と、ラベル2が付与されているラベル画像2とが重なっていると判断されると、領域Pの面積分の画素数に対するラベル画像1の画素数の比率1を求める。これと同様に、領域Qの面積分の画素数に対するラベル画像2の画素数の比率2を求める。これらの比率が1に近ければ、ラベル画像の面積と、図13で説明した矩形領域(領域Pと領域Q)の面積との差が小さく、ラベル画像は、矩形に近いと判断できる。一方、この比率が小さければ、ラベル画像の形状が矩形でないと判断できる。よって、比率1と比率2とを比較し、比率が1に近い方を矩形画像と判断し、比率が低い方を原稿領域の一部が入り込まれている原稿領域(図13では、領域Q)であると判断する。
なお、比率1、比率2ともに、その値が1より低い所定値以下であれば、両方とも矩形画像ではないと判断し、この場合、どちらがどちらに入り込まれているのかを判断することができないので、両方とも原稿領域候補リストから除外する。
図9に示すように、ラベル画像の中間に白領域があるので、ラベル画素数が低くなっていることも考えられるので、上記比率を求める際には、ラベル画像の中にある空白領域の画素数を、ラベル画像の画素数に加えてもよい。このようにすれば、ラベル画像の中に存在している空白領域によって、ラベル画像の画素数が少なくならずに済み、上記比率が下がり、矩形ではないと判断されることを防止することができる。
次に、ユーザが複数の原稿をわざと重ねた場合について説明する。
図15は、原稿1と原稿2とを重ねた場合の説明図である。
図15(1)に示すように、原稿1と原稿2とを重ねると、図15(2)に示すように、原稿1と原稿2との画素が連続するので、連続画素の塊は1つになる。
よって、ラベル画像は1つになり、原稿は1枚であると判断される。この場合、原稿領域は、図15(2)に示すように、点線のように判断される。
なお、上記実施例において、抽出した原稿が、台形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識する。このようにする代わりに、抽出した原稿が、三角形、円形、楕円形等の原稿、つまり、非矩形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識するようにしてもよい。
実施例1では、検出した原稿領域が互いに重なり合っている場合、それらを原稿領域候補リストから除外することによって、本読み取りすべき原稿領域ではないと判断する。
下記に示すように、その処理を変更することによって、互いに重なり合った領域を除去した双方の原稿領域候補を原稿領域として扱うことができる。
たとえば、図13に示すように、原稿領域Pと、原稿領域Qとが互いに重なっていると判断された場合、双方の原稿領域を抽出すると、原稿領域Qに、原稿領域Pの一部が入り込む。しかし、実施例1で示したように、原稿領域のどの頂点が相手側の原稿領域に重なっているかは、既に分かっているので、原稿領域Q上の重なり領域を導き出すことができる。相手側の領域に入り込んでいる側と、入り込まれている側との判断は、実施例1のように、ラベル画像が各辺に接する矩形の面積に対応する画素数と、ラベル画像の画素数との比率に基づいて断する。
図13に示す場合、頂点P,P,Pの座標を、それぞれ、(xp1,yp1),(xp2,yp2),(xp3,yp3)とし、頂点Qの座標を、(xq0,yq0)とすると、重なり領域は、
q0≦x≦xmax
q0≦y≦ymax
の範囲となる。
ただし、xmax=max([xp1p2p3q0])、ymax=max([yp1p2p3q0])である。そして、その重なり領域を白色等で塗りつぶすことによって、入り込んだ相手側の原稿の一部を除去した原稿領域を抽出することができる。
以上によって、原稿領域として検出されたもの同士が重なり合っている場合、入り込まれている側の画像から、他方の画像が入り込んだ部分の領域を除去することができる。
上記実施例によれば、2つの原稿を検出した場合、たとえば、その一方の原稿が矩形であり、他方の原稿が台形であり、しかも、矩形原稿の近くに台形原稿が存在している場合、矩形原稿と台形原稿との相対位置によって、これらの原稿の処理が異常にならない。ここでいう「異常」は、重なり判定によってエラーとなり、本スキャンが出来ないことである。
本発明の実施例3は、2つの原稿が完全に重なり合っているときに、各原稿の2辺の長さを比較し、小さい原稿の2辺の長さがともに、大きい原稿の2辺の長さの70%以上であれば、小さい原稿を残し、大きい原稿を除去する実施例である。
図16は、フチあり原稿の例を示す図である。
図16に示すようなフチあり原稿を読み取ったときに、フチ部のエッジがハッキリと捕らえられない場合がある。この場合、1枚のフチあり原稿を読み取ったにもかかわらず、これを判定すると、2枚の原稿が重なっていると誤判定し、原稿領域抽出に失敗することがある。
図17は、図16に示す原稿を内部処理し、2値化した状態を示す図である。
図17(1)は、図16に示す原稿を内部処理し、2値化した状態を示す図であり、フチのエッジがハッキリと捕らえられない。したがって、1枚のフチあり原稿を、図17(2)に示す矩形領域R1と、図17(3)に示す矩形領域R2との2つの原稿であると誤認識する。この場合、実施例1のアルゴリズムであれば、双方の原稿が除去される。
しかし、実施例3による処理では、図17(3)に示す矩形領域R2、つまり、フチなし原稿領域がきちんと抽出される。
すなわち、2つの原稿が完全に重なり合っているときに、各原稿の2辺の長さを比較し、小さい原稿の2辺の長さがともに、大きい原稿の2辺の長さの70%以上であれば、小さい原稿を残し、大きい原稿を除去するので、フチなし原稿領域がきちんと抽出される。
なお、実施例3において、2つの原稿が完全に重なり合っているときに、各原稿の2辺の長さを比較し、小さい原稿の2辺の長さがともに、大きい原稿の2辺の長さの70%以上であれば、小さい原稿を残し、大きい原稿を除去する。この「70%」の代わりに、所定の割合を使用するようにしてもよい。
また、実施例3において、2つの原稿が完全に重なり合っているときに、各原稿の面積を比較し、小さい面積の原稿の面積が、大きい面積の原稿の面積の所定割合以上であれば、小さい面積の原稿を残し、大きい面積の原稿を除去するようにしてもよい。
本発明の実施例4は、2つの原稿が完全に重なり合っているときに、各原稿の2辺の長さを比較し、小さい原稿の2辺の長さがともに、大きい原稿の2辺の長さの70%未満である場合、大きい原稿を残し、小さい原稿を除去する。この場合、完全に重なり合っていること、すなわち、大きい原稿内に小さい原稿が完全に含まれている事を確認する必要がある。
図18は、原稿内部に原稿と思われる領域が存在する原稿の例を示す図である。
つまり、たとえば名刺41という原稿に、その写真42が存在している場合、写真42が、名刺41という原稿とは別の原稿であると認識される可能性がある。
図19は、図18に示す原稿(名刺41)の2値化データと、名刺41という原稿の原稿領域43、44を示す図である。
図19(1)は、図18に示す名刺41という原稿の2値化データを示す図である。図19(2)は、名刺41という原稿から抽出された原稿領域43、44を示す図である。原稿領域43は、名刺41の外縁であり、原稿領域44は、名刺41に記載されている写真43の外縁である。なお、図19(2)は、原稿領域のみを示すので、図19(1)に記載されている画像内容(たとえば名刺に記載されている文字、図形、人物等)は、表示されない。
図19(2)の外側矩形部(原稿領域43)と、図19(2)の内側矩形部(原稿領域44)との2つの原稿領域が抽出される。
ここで、単純に内側の原稿のみを残すと、本来残すべき原稿内容(たとえば名刺41に記載されている文字、図形、人物等)を抽出できない。この状態を阻止するために、2つの原稿が完全に重なり合っているときに、各原稿の2辺の長さを比較し、小さい原稿の2辺の長さがともに、大きい原稿の2辺の長さの70%未満である場合、大きい原稿を残し、小さい原稿を除去する。このようにして、大きい原稿を残すことによって、本スキャンでは、大きい原稿領域が本スキャンされ、図形、人物写真が記載されている名刺等の原稿全域を読み取ることが出来る。
なお、実施例4において、2つの原稿が完全に重なり合っているときに、各原稿の2辺の長さを比較し、小さい原稿の2辺の長さがともに、大きい原稿の2辺の長さの70%未満であれば、大きい原稿を残し、小さい原稿を除去する。この「70%」の代わりに、所定の割合を使用するようにしてもよい。
また、実施例4において、2つの原稿が完全に重なり合っているときに、各原稿の面積を比較し、小さい面積の原稿の面積が、大きい面積の原稿の面積の所定割合未満であれば、小さい面積の原稿を残し、大きい面積の原稿を除去するようにしてもよい。
本発明の実施例1である画像処理装置100を示すブロック図である。 画像処理装置100が原稿領域検出する動作を示すフローチャートである。 実施例1において使用するフィルタの例を示す図である。 実施例1において、原稿の端部が点線であり、途切れた原稿画像と、端部を修復した後の原稿画像とを示す図である。 2枚の原稿を原稿台に置いて読み取る例を示す図である。 原稿領域検出方法を説明する図である。 ラベル番号とラベル画像の元になる2値画像を説明する図である。 ラベル番号とラベル画像を説明する図である。 ラベル管理テーブルの例を示す図である。 原稿領域候補リストを示す図である。 実施例1の説明図である。 実施例1の動作を示すフローチャートである。 実施例1の説明図であり、矩形の原稿領域Pと、矩形に置き換えられた原稿領域Qとが重なっている状態を示す図である。 ラベル管理テーブルの例を示す図である。 原稿1と原稿2とを重ねた場合の説明図である。 フチあり原稿の例を示す図である。 図16に示す原稿を内部処理し、2値化した状態を示す図である。 原稿内部に原稿と思われる領域が存在する原稿の例を示す図である。 図18に示す原稿(名刺41)の2値化データと、名刺41という原稿の原稿領域43、44を示す図である。
符号の説明
100…画像処理装置、
1…外部I/F、
2…入力操作部、
3…印刷部、
4…読取部、
5…表示部、
6…制御部、
7…汎用記憶部。

Claims (8)

  1. 原稿領域を抽出する画像処理装置において、
    原稿を読み取る読取手段と;
    上記読取手段が出力した読取データに基づいて、原稿領域を抽出する原稿領域抽出手段と;
    上記原稿領域抽出手段が抽出した原稿が、非矩形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識する原稿領域認識手段と;
    上記原稿領域抽出手段が抽出した複数の原稿領域が互いに重なっているか否かを判定する原稿重なり判定手段と;
    を有することを特徴とする画像処理装置。
  2. 請求項1において、
    上記原稿重なり判定手段が、複数の原稿が互いに重なっていると判定した場合、複数の原稿が互いに重なっていることを、ユーザに通知する通知手段を有することを特徴とする画像処理装置。
  3. 請求項1において、
    上記原稿重なり判定手段が、複数の原稿が互いに重なっていると判定した場合、重なっている複数の原稿のうちで、大きい面積の原稿を残し、小さい面積の原稿を削除する原稿削除手段を有することを特徴とする画像処理装置。
  4. 請求項1において、
    上記原稿重なり判定手段が、第1の原稿の上に第2の原稿が重なり、上記第1の原稿から上記第2の原稿がはみ出さず、しかも、上記第2の原稿の面積が、上記第1の原稿の面積の所定割合以上の面積である場合、上記第2の原稿を残し、上記第1の原稿を削除する原稿削除手段を有することを特徴とする画像処理装置。
  5. 請求項1において、
    上記原稿領域抽出手段が抽出した1つまたは複数の原稿領域候補を、原稿領域候補リストとして保持する原稿領域候補登録手段を有することを特徴とする画像処理装置。
  6. 請求項1において、
    上記原稿領域認識手段は、上記複数の原稿領域が互いに重なっていると、上記原稿重なり判定手段が判定した場合、上記複数の原稿領域のうちの1つの原稿領域を、原稿領域として識別しない手段であることを特徴とする画像処理装置。
  7. 請求項1において、
    原稿の重なり領域を加工する重なり領域加工手段を有し、
    上記原稿重なり判定手段が、原稿領域が互いに重なっていると判定した場合は、上記領域加工手段が、互いの原稿領域から重なり部分を除去し、複数の原稿領域として抽出することを特徴とする画像処理装置。
  8. 原稿領域を抽出する画像処理装置の制御方法において、
    原稿を読み取る読取工程と;
    上記読取工程で出力された読取データに基づいて、原稿領域を抽出する原稿領域抽出工程と;
    上記原稿領域抽出工程で抽出した原稿が、非矩形の原稿であれば、上記原稿を含む矩形領域を、原稿領域として認識する原稿領域認識工程と;
    上記原稿領域抽出工程で抽出された複数の原稿領域が互いに重なっているか否かを判定する原稿重なり判定工程と;
    を有することを特徴とする画像処理装置の制御方法。
JP2005262703A 2005-09-09 2005-09-09 画像処理装置、画像処理方法およびプログラム Expired - Fee Related JP4574503B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005262703A JP4574503B2 (ja) 2005-09-09 2005-09-09 画像処理装置、画像処理方法およびプログラム
US11/470,694 US20080018951A1 (en) 2005-09-09 2006-09-07 Image processing apparatus and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005262703A JP4574503B2 (ja) 2005-09-09 2005-09-09 画像処理装置、画像処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2007081458A true JP2007081458A (ja) 2007-03-29
JP4574503B2 JP4574503B2 (ja) 2010-11-04

Family

ID=37941350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005262703A Expired - Fee Related JP4574503B2 (ja) 2005-09-09 2005-09-09 画像処理装置、画像処理方法およびプログラム

Country Status (2)

Country Link
US (1) US20080018951A1 (ja)
JP (1) JP4574503B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011029997A (ja) * 2009-07-27 2011-02-10 Brother Industries Ltd 画像読取装置
JP2016119633A (ja) * 2014-12-22 2016-06-30 京セラドキュメントソリューションズ株式会社 画像処理装置、画像形成装置、画像処理方法、および画像処理プログラム
JP2016178552A (ja) * 2015-03-20 2016-10-06 株式会社Pfu 画像処理装置、領域検出方法及びコンピュータプログラム
JP2017130811A (ja) * 2016-01-20 2017-07-27 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2018152629A (ja) * 2017-03-09 2018-09-27 富士ゼロックス株式会社 画像処理装置及びプログラム
JP2018201174A (ja) * 2017-05-29 2018-12-20 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像読取方法
JP2019029882A (ja) * 2017-08-01 2019-02-21 株式会社東芝 画像処理装置
JP2019029884A (ja) * 2017-08-01 2019-02-21 株式会社東芝 画像処理装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261305B2 (ja) * 2013-11-29 2018-01-17 キヤノン株式会社 原稿読取装置、原稿読取装置の制御方法、及びプログラム
JP6033257B2 (ja) * 2014-06-18 2016-11-30 キヤノン株式会社 原稿読取装置、原稿読取装置の制御方法、プログラム、及び記憶媒体
JP7415634B2 (ja) 2020-02-10 2024-01-17 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07105378A (ja) * 1993-10-05 1995-04-21 Nippon Steel Corp 濃淡画像の特徴領域抽出装置
JPH10283476A (ja) * 1997-04-04 1998-10-23 Minolta Co Ltd 画像処理方法及び装置
JP2002010059A (ja) * 2000-06-20 2002-01-11 Sharp Corp 画像処理装置
JP2004260457A (ja) * 2003-02-25 2004-09-16 Canon Inc 画像読取装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100228618B1 (ko) * 1994-05-31 1999-11-01 아끼구사 나오유끼 연결영역의 추출장치 및 방법
US5774579A (en) * 1995-08-11 1998-06-30 Canon Kabushiki Kaisha Block selection system in which overlapping blocks are decomposed
US6141462A (en) * 1995-10-11 2000-10-31 Dainippon Screen Mfg. Co., Ltd. Image processing using adjoining relationships between image parts
US6373590B1 (en) * 1999-02-04 2002-04-16 Seiko Epson Corporation Method and apparatus for slant adjustment and photo layout
US20030083835A1 (en) * 2001-10-29 2003-05-01 Chung-Wei Cheng Image-autocrop method for calibrating image-input
JP2003179738A (ja) * 2001-12-11 2003-06-27 Minolta Co Ltd 画像処理装置
US7321687B2 (en) * 2002-03-07 2008-01-22 Canon Kabushiki Kaisha Apparatus and method for image processing to label an object in a binary image
JP4277768B2 (ja) * 2004-05-14 2009-06-10 セイコーエプソン株式会社 写真イメージ領域抽出装置およびコピー装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07105378A (ja) * 1993-10-05 1995-04-21 Nippon Steel Corp 濃淡画像の特徴領域抽出装置
JPH10283476A (ja) * 1997-04-04 1998-10-23 Minolta Co Ltd 画像処理方法及び装置
JP2002010059A (ja) * 2000-06-20 2002-01-11 Sharp Corp 画像処理装置
JP2004260457A (ja) * 2003-02-25 2004-09-16 Canon Inc 画像読取装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011029997A (ja) * 2009-07-27 2011-02-10 Brother Industries Ltd 画像読取装置
JP2016119633A (ja) * 2014-12-22 2016-06-30 京セラドキュメントソリューションズ株式会社 画像処理装置、画像形成装置、画像処理方法、および画像処理プログラム
JP2016178552A (ja) * 2015-03-20 2016-10-06 株式会社Pfu 画像処理装置、領域検出方法及びコンピュータプログラム
JP2017130811A (ja) * 2016-01-20 2017-07-27 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2018152629A (ja) * 2017-03-09 2018-09-27 富士ゼロックス株式会社 画像処理装置及びプログラム
JP2018201174A (ja) * 2017-05-29 2018-12-20 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像読取方法
JP2019029882A (ja) * 2017-08-01 2019-02-21 株式会社東芝 画像処理装置
JP2019029884A (ja) * 2017-08-01 2019-02-21 株式会社東芝 画像処理装置
US11240399B2 (en) 2017-08-01 2022-02-01 Kabushiki Kaisha Toshiba Image processing apparatus

Also Published As

Publication number Publication date
US20080018951A1 (en) 2008-01-24
JP4574503B2 (ja) 2010-11-04

Similar Documents

Publication Publication Date Title
JP4574503B2 (ja) 画像処理装置、画像処理方法およびプログラム
US8712188B2 (en) System and method for document orientation detection
US8559748B2 (en) Edge detection
EP1909215B1 (en) Image region detection method, recording medium, and device therefor
EP2974261A2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
EP2973226A1 (en) Classifying objects in digital images captured using mobile devices
KR102090973B1 (ko) 정보 처리장치, 정보 처리방법, 및 기억매체
JP2001351066A (ja) 文書認識処理のための装置、方法及び記録媒体
US20150010233A1 (en) Method Of Improving Contrast For Text Extraction And Recognition Applications
US7864985B1 (en) Automatic operator-induced artifact detection in document images
JP6021665B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
US11881043B2 (en) Image processing system, image processing method, and program
TW202013239A (zh) 影像處理系統、影像處理方法及程式產品
JP4777024B2 (ja) 画像処理装置および画像処理装置の制御方法
JP6630341B2 (ja) シンボルの光学的検出方法
CN110210467B (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
JP5887242B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP4167680B2 (ja) 原稿読取装置および原稿読取方法
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP5222127B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6639257B2 (ja) 情報処理装置及びその制御方法
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
JP7457903B2 (ja) 画像処理装置
EP1018694A2 (en) System and method for automatic graph parsing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100528

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100813

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100818

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03

LAPS Cancellation because of no payment of annual fees