JP6099686B2 - 画像処理装置、領域検出方法及びコンピュータプログラム - Google Patents

画像処理装置、領域検出方法及びコンピュータプログラム Download PDF

Info

Publication number
JP6099686B2
JP6099686B2 JP2015058637A JP2015058637A JP6099686B2 JP 6099686 B2 JP6099686 B2 JP 6099686B2 JP 2015058637 A JP2015058637 A JP 2015058637A JP 2015058637 A JP2015058637 A JP 2015058637A JP 6099686 B2 JP6099686 B2 JP 6099686B2
Authority
JP
Japan
Prior art keywords
image
edge
pixels
area
edge pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015058637A
Other languages
English (en)
Other versions
JP2016178552A (ja
Inventor
諒 林
諒 林
清人 小坂
清人 小坂
正義 林
正義 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP2015058637A priority Critical patent/JP6099686B2/ja
Priority to US14/831,596 priority patent/US9712717B2/en
Publication of JP2016178552A publication Critical patent/JP2016178552A/ja
Application granted granted Critical
Publication of JP6099686B2 publication Critical patent/JP6099686B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00702Position
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00729Detection means
    • H04N1/00734Optical detectors
    • H04N1/00737Optical detectors using the scanning elements as detectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00742Detection methods
    • H04N1/00748Detecting edges, e.g. of a stationary sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00763Action taken as a result of detection
    • H04N1/00769Comparing, e.g. with threshold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/393Enlarging or reducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/48Picture signal generators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6016Conversion to subtractive colour signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0081Image reader

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)
  • Image Input (AREA)
  • Facsimile Scanning Arrangements (AREA)

Description

本発明は、画像処理装置、領域検出方法及びコンピュータプログラムに関し、特に、入力画像から原稿の画像を切出すべき領域を検出する画像処理装置、領域決定方法及びコンピュータプログラムに関する。
スキャナ装置等で原稿を読み取って画像データとして保存するためには、読み取った画像から原稿領域を正確に検出する必要がある。一般に、フラットベッドタイプ又は自動原稿送りタイプのスキャナ装置では、白色、黒色等の単調色の裏当てを用いることにより原稿領域とそれ以外の領域を容易に識別できる。一方、近年では、机等に載置された原稿を読み取る、いわゆるオーバーヘッドタイプのスキャナ装置が利用されており、机の模様と原稿とを正確に識別することが必要となっている。
読み取った画像から原稿領域を求める画像読取装置が開示されている。この画像読取装置は、全ての対象物を包含する第1の矩形の頂点座標と、全ての対象物のうち原稿の内容物であると判定した全ての対象物を包含し面積が最小である第2の矩形の頂点座標との一致度に基づいて原稿領域の切出し方法を決定する(特許文献1を参照)。
また、全幅が裏当て部である領域のイメージデータにより原稿エッジ検出用の基準データを作成し、基準データと画像データとの差異を求めることにより原稿のエッジ検出を行う画像読取装置が開示されている。この画像読取装置は、エッジ検出を水平方向および垂直方向に所定のラインだけ行うことにより原稿の四辺を検出し、原稿画像の自動認識を行う(特許文献2を参照)。
また、入力画像から原稿の境界を検出する画像処理装置が開示されている。この画像処理装置は、入力画像からエッジ画素を抽出し、エッジ画素から複数の直線を抽出し、抽出した直線から矩形候補を抽出し、各矩形候補の各辺から所定距離内にあるエッジ画素の数と各角の角らしさの度合いに基づいて矩形を選択する(特許文献3を参照)。
また、読み取った画像から原稿の画像を切出すべき領域を決定する画像処理装置が開示されている。この画像処理装置は、入力画像から対象領域を検出し、対象領域内において矩形を検出し、その矩形が対象領域と一致する場合、その矩形を切出し領域に決定し、一致しない場合、対象領域を含む領域を切出し領域に決定する(特許文献4を参照)。
特開2009−272676号公報 特開2007−88654号公報 特開2013−106160号公報 特開2014−195148号公報
スキャナ装置等の画像処理装置では、読み取った画像から原稿の画像を切出すべき領域をより精度良く検出することを求められている。
本発明の目的は、読み取った画像から原稿の画像を切出すべき領域を精度良く検出することが可能な画像処理装置、領域検出方法及びそのような領域検出方法をコンピュータに実行させるコンピュータプログラムを提供することにある。
本実施形態の一側面に係る画像処理装置は、入力画像から、背景が写っていると推定される推定背景領域を抽出する推定背景領域抽出部と、推定背景領域内の画素に基づいて閾値を決定する閾値決定部と、閾値を用いて入力画像からエッジ画素を抽出するエッジ画素抽出部と、エッジ画素から原稿領域を検出する原稿領域検出部と、を有する。
また、本実施形態の一側面に係る領域決定方法は、入力画像から、背景が写っていると推定される推定背景領域を抽出し、推定背景領域内の画素に基づいて閾値を決定し、閾値を用いて入力画像からエッジ画素を抽出し、エッジ画素から原稿領域を検出することを含む。
また、本実施形態の一側面に係るコンピュータプログラムは、入力画像から、背景が写っていると推定される推定背景領域を抽出し、推定背景領域内の画素に基づいて閾値を決定し、閾値を用いて入力画像からエッジ画素を抽出し、エッジ画素から原稿領域を検出することをコンピュータに実行させる。
本発明によれば、読み取った画像から原稿の画像を切出すべき領域を精度良く検出することが可能な画像処理装置、領域検出方法及びそのような領域検出方法をコンピュータに実行させるコンピュータプログラムを提供することができる。
実施形態に従った画像処理システム1を示す図である。 実施形態に従った画像処理システム1の概略構成を示す図である。 画像処理回路27の概略構成を示す図である。 画像読取処理の動作を示すフローチャートである。 原稿切出し処理の動作を示すフローチャートである。 原稿切出し処理における画像について説明するための模式図である。 原稿切出し処理における画像について説明するための模式図である。 隣接差分値のヒストグラムの例を示す図である。 第1入力画像の他の例を示す模式図である。 切出し領域決定処理の動作の例を示すフローチャートである。 候補領域検出処理の動作の例を示すフローチャートである。 候補領域検出処理における画像について説明するための模式図である。 候補領域検出処理における画像について説明するための模式図である。 候補領域検出処理における画像について説明するための模式図である。 候補領域検出処理における画像について説明するための模式図である。 候補領域検出処理における画像について説明するための模式図である。 矩形検出処理の動作の例を示すフローチャートである。 外側エッジ画素の抽出処理について説明するための模式図である。 外側エッジ画素の抽出処理について説明するための模式図である。 候補領域と入力画像の端部が近接している例を示す模式図である。 候補領域と入力画像の端部が近接している例を示す模式図である。 近似直線について説明するための模式図である。 近似直線について説明するための模式図である。 矩形候補の各角の評価点について説明するための模式図である。 矩形検出処理について説明するための模式図である。 矩形検出処理について説明するための模式図である。 矩形検出処理について説明するための模式図である。 非矩形検出処理の動作の例を示すフローチャートである。 非矩形検出処理における各画像について説明するための模式図である。 非矩形検出処理における各画像について説明するための模式図である。 原稿切出し処理の動作の他の例を示すフローチャートである。 原稿切出し処理の動作のさらに他の例を示すフローチャートである。 候補領域検出処理の動作の他の例を示すフローチャートである。 他の画像処理システム2の概略構成を示す図である。
以下、本発明に係る画像処理装置、領域決定方法及びコンピュータプログラムについて図を参照しつつ説明する。但し、本発明の技術的範囲はそれらの実施の形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶ点に留意されたい。
図1は、実施形態に従った画像処理システムを示す図である。図1に示すように、画像処理システム1は、画像読取装置10と、情報処理装置20とを有する。画像読取装置10は、例えばイメージスキャナ、デジタルカメラ等である。本実施形態では、画像読取装置10がオーバーヘッドタイプタイプのスキャナ装置である場合を例にして説明する。情報処理装置20は、例えば画像読取装置10に接続して用いられるパーソナルコンピュータ等である。
図2は、実施形態に従った画像処理システムの概略構成を示す図である。画像読取装置10は、画像入力装置11と、第1画像メモリ12と、第1インターフェース装置13と、第1記憶装置14と、第1CPU(Control Processing Unit)15とを有する。以下、画像読取装置10の各部について詳細に説明する。
画像入力装置11は、撮像対象物である原稿等を撮像する撮像センサを有する。この撮像センサは、撮像素子と、撮像素子に撮像対象物の像を結像する光学系を備える。各撮像素子は、RGB各色に対応するアナログ値を出力する。撮像素子は、1次元又は2次元に配列されたCCD(Charge Coupled Device)、CMOS(Complementary Metal Oxide Semiconductor)等である。画像入力装置11は、撮像センサが出力した各アナログ値をデジタル値に変換して画素データを生成し、生成した各画素データから構成される画像データ(以下、RGB画像と称する)を生成する。このRGB画像は、各画素データが、例えばRGB各色毎に8bitで表される計24bitのRGB値からなるカラー画像データとなる。
画像入力装置11は、RGB画像又はRGB画像の各画素のRGB値を輝度値及び色差値(YUV値)に変換した画像(以下、読取画像と称する)を生成し、第1画像メモリ12に保存する。なお、YUV値は、例えば以下の式により算出することができる。
Y値= 0.30×R値+0.59×G値+0.11×B値 (1)
U値=−0.17×R値−0.33×G値+0.50×B値 (2)
V値= 0.50×R値−0.42×G値−0.08×B値 (3)
第1画像メモリ12は、不揮発性半導体メモリ、揮発性半導体メモリ、磁気ディスク等の記憶装置を有する。第1画像メモリ12は、画像入力装置11と接続され、画像入力装置11により生成された読取画像を保存する。
第1インターフェース装置13は、USB(Universal Serial Bus)等のシリアルバスに準じるインターフェース回路を有し、情報処理装置20と電気的に接続して画像データ及び各種の情報を送受信する。また、第1インターフェース装置13にフラッシュメモリ等を接続して第1画像メモリ12に保存されている画像データを一旦保存し、情報処理装置20に複写するようにしてもよい。
第1記憶装置14は、RAM(Random Access Memory)、ROM(Read Only Memory)等のメモリ装置、ハードディスク等の固定ディスク装置、又はフレキシブルディスク、光ディスク等の可搬用の記憶装置等を有する。また、第1記憶装置14には、画像読取装置10の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、コンピュータ読み取り可能な可搬型記録媒体から公知のセットアッププログラム等を用いて第1記憶装置14にインストールされてもよい。可搬型記録媒体は、例えばCD−ROM(compact disk read only memory)、DVD−ROM(digital versatile disk read only memory)等である。
第1CPU15は、画像入力装置11、第1画像メモリ12、第1インターフェース装置13及び第1記憶装置14と接続され、これらの各部を制御する。第1CPU15は、画像入力装置11の読取画像生成制御、第1画像メモリ12の制御、第1インターフェース装置13を介した情報処理装置20とのデータ送受信制御、第1記憶装置14の制御等を行う。
情報処理装置20は、第2インターフェース装置21と、第2画像メモリ22と、表示装置23と、入力装置24と、第2記憶装置25と、第2CPU26と、画像処理回路27とを有する。以下、情報処理装置20の各部について詳細に説明する。
第2インターフェース装置21は、画像読取装置10の第1インターフェース装置13と同様のインターフェース回路を有し、情報処理装置20と画像読取装置10とを接続する。
第2画像メモリ22は、画像読取装置10の第1画像メモリ12と同様の記憶装置を有する。第2画像メモリ22には、第2インターフェース装置21を介して画像読取装置10から受信した読取画像を保存するとともに、画像処理回路27と接続され、画像処理回路27により読取画像に対して画像処理がなされた各種の処理画像を保存する。
表示装置23は、液晶、有機EL等から構成されるディスプレイ及びディスプレイに画像データを出力するインターフェース回路を有し、第2画像メモリ22と接続されて第2画像メモリ22に保存されている画像データをディスプレイに表示する。
入力装置24は、キーボード、マウス等の入力装置及び入力装置から信号を取得するインターフェース回路を有し、利用者の操作に応じた信号を第2CPU26に出力する。
第2記憶装置25は、画像読取装置10の第1記憶装置14と同様のメモリ装置、固定ディスク装置、可搬用の記憶装置等を有する。第2記憶装置25には、情報処理装置20の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、例えばCD−ROM、DVD−ROM等のコンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラム等を用いて第2記憶装置25にインストールされてもよい。
第2CPU26は、第2インターフェース装置21、第2画像メモリ22、表示装置23、入力装置24、第2記憶装置25及び画像処理回路27と接続され、これらの各部を制御する。第2CPU26は、第2インターフェース装置21を介した画像読取装置10とのデータ送受信制御、第2画像メモリ22の制御、表示装置23の表示制御、入力装置24の入力制御、第2記憶装置25の制御、画像処理回路27による画像処理の制御等を行う。
画像処理回路27は、第2画像メモリ22に接続され、原稿切出し処理を行う。この画像処理回路27は、第2CPU26に接続され、第2CPU26からの制御により予め第2記憶装置25に記憶されているプログラムに基づいて動作する。なお、画像処理回路27は、独立した集積回路、マイクロプロセッサ、ファームウェア等で構成されてもよい。
図3は、画像処理回路27の概略構成を示す図である。図3に示すように画像処理回路27は、推定背景領域抽出部201、閾値決定部202、選択部203、第1エッジ画素抽出部204、膨張用エッジ画素抽出部205、膨張画像生成部206、第2エッジ画素抽出部207、候補領域検出部208、外側エッジ画素抽出部209、直線検出部210、矩形検出部211、外周エッジ画素抽出部212、非矩形検出部213、マスク生成部214、原稿領域検出部215、切出し部216及び記憶制御部217を有する。これらの各部は、プロセッサ上で動作するソフトウェアにより実装される機能モジュールである。なお、これらの各部はそれぞれ独立した集積回路、マイクロプロセッサ、ファームウェア等で構成されてもよい。
図4は、画像読取装置10による画像読取処理の動作を示すフローチャートである。以下、図4に示したフローチャートを参照しつつ、画像読取処理の動作を説明する。なお、以下に説明する動作のフローは、予め第1記憶装置14に記憶されているプログラムに基づき主に第1CPU15により画像読取装置10の各要素と協働して実行される。
最初に、画像入力装置11は、撮像対象物である原稿を撮影した読取画像を生成し、第1画像メモリ12に保存する(ステップS101)。
次に、第1CPU15は、第1画像メモリ12に保存された読取画像を第1インターフェース装置13を介して情報処理装置20に送信し(ステップS102)、一連のステップを終了する。
図5は、情報処理装置20による原稿切出し処理の動作を示すフローチャートである。以下、図5に示したフローチャートを参照しつつ、原稿切出し処理の動作を説明する。なお、以下に説明する動作のフローは、予め第2記憶装置25に記憶されているプログラムに基づき主に第2CPU26により情報処理装置20の各要素と協同して実行される。
最初に、第2CPU26は、読取画像を第2インターフェース装置21を介して画像読取装置10から取得し、第2画像メモリ22に保存する(ステップS201)。
次に、画像処理回路27は、第2画像メモリ22に保存された読取画像を読み出し、読取画像について水平方向及び垂直方向に画素を間引いた第1入力画像を生成し、第2画像メモリ22に保存する(ステップS202)。第1入力画像は、入力画像の一例である。
一般に、情報処理装置20は処理する画像の画素数により処理速度が大きく異なるため、画素を間引く割合は、第2CPU26等の処理能力と情報処理装置20に要求される処理速度に応じて定められる。なお、画素を間引かなくても要求される処理速度を満たす場合は読取画像をそのまま第1入力画像としてもよい。
図6A〜図6Bは、原稿切出し処理における各画像について説明するための模式図である。図6Aに示す画像600は、第1入力画像の例である。第1入力画像600は、木目調等の模様602を有する机に載置された本601を原稿として撮像した画像である。本601には、網掛け部分603、文字604等が含まれる。また、第1入力画像600には、第1入力画像600を撮像した画像読取装置10の筐体の内、台座の一部605が含まれている。さらに、第1入力画像600には、画像読取装置10の画像入力装置11の撮像素子及び光学系の影響により生じるランダムノイズ606が撮像されている。
次に、画像処理回路27は、第1入力画像からさらに水平方向及び垂直方向に画素を間引いた第2入力画像を生成し、第2画像メモリ22に保存する(ステップS203)。第2入力画像は、入力画像の他の例である。
図6Bに示す画像610は、第2入力画像の例である。第1入力画像600から第2入力画像610への間引き率は、ランダムノイズ606が除去されるが、原稿内の網掛け部分603、文字604等は除去されないように予め定められる。
なお、画像処理回路27は、第2入力画像を生成する代わりに、第1入力画像に平滑化フィルタを適用することによりランダムノイズ606を除去してもよい。または、第1エッジ画素抽出部204は、第2入力画像にさらに平滑化フィルタを適用してもよい。
次に、推定背景領域抽出部201は、第2入力画像から、背景が写っていると推定される推定背景領域を抽出する(ステップS204)。
オーバーヘッドタイプのスキャナ装置を利用する利用者が、スキャナ装置の台座の近傍に原稿を載置する可能性は低く、スキャナ装置の台座の近傍には背景が写っている可能性が高い。そこで、推定背景領域抽出部201は、第2入力画像に含まれる画像読取装置10の一部の近傍領域を背景領域として抽出する。近傍領域は、例えば第2入力画像に含まれる画像読取装置10の一部から所定範囲内(例えば50mmに相当する距離内)に設定される。なお、第2入力画像に画像読取装置10の一部が含まれる場合、第2入力画像において、その含まれる部分と同じ水平ライン上に原稿が写っている可能性はさらに低い。そこで、図6Bに示すように、推定背景領域抽出部201は、画像読取装置10の一部613の水平方向の所定範囲内の領域614を推定背景領域として抽出してもよい。
なお、推定背景領域抽出部201は、第2入力画像において予め定められた原稿読取範囲615の外側の領域を推定背景領域として抽出してもよい。これにより、画像読取装置10の一部が第2入力画像に含まれない場合でも、推定背景領域を抽出することができる。なお、画像読取装置10の撮影範囲の内、画像読取装置10の設置位置と対向する側の領域、即ち第2入力画像内の下側の領域には、利用者の手等が写り込む可能性が高い。そこで、推定背景領域抽出部201は、原稿読取範囲615の外側の領域の内、原稿読取範囲615の下側の領域については推定背景領域から除外してもよい。
原稿読取範囲615の外側の領域を推定背景領域として抽出する場合、利用者に、原稿を載置する机に原稿読取範囲を示すマットを敷いてから原稿を撮影させることにより、利用者に原稿読取範囲を認識させることができる。なお、画像読取装置10が光照射部(不図示)から、原稿を載置する机に原稿読取範囲を示す光を照射させることにより、利用者に原稿読取範囲を認識させてもよい。これにより、推定背景領域として、確実に机の模様が写っている領域を抽出することができる。
また、推定背景領域抽出部201は、第2入力画像の四隅に位置する四つの領域616〜619に基づいて推定背景領域を抽出してもよい。その場合、推定背景領域抽出部201は、四つの領域616〜619の内の二つずつに対して、それぞれ正規化相互相関を算出する。推定背景領域抽出部201は、算出した正規化相互相関に基づいて、四つの領域616〜619の内の二以上の所定数(例えば三)の領域が相互に類似するか否かを判定する。推定背景領域抽出部201は、各領域が相互に類似する場合、相互に類似する領域を推定背景領域として抽出する。これにより、机の模様が写っていない領域を推定背景領域から除去することができる。
次に、閾値決定部202は、推定背景領域抽出部201が抽出した推定背景領域内の画素に基づいて、エッジ画素を抽出するための第1閾値を決定する(ステップS205)。閾値決定部202は、推定背景領域内の各画素の水平方向の両隣の画素の画素値の差の絶対値(以下、隣接差分値と称する)と、垂直方向の隣接差分値とを算出し、算出した隣接差分値のヒストグラムを生成する。
図7は、隣接差分値のヒストグラムの例を示す図である。図7の横軸は推定背景領域内の各画素の隣接差分値を示し、縦軸は分布値を示す。図7のヒストグラム700には、相互に略同一の画素値を有する画素間の隣接差分値701と、机の模様の端部に位置する画素による隣接差分値702と、他の画素による隣接差分値703の近傍において分布値のピークが発生している。
閾値決定部202は、例えば大津の二値化方法により、第1閾値が、机の模様の端部に位置する画素による隣接差分値702と、他の画素による隣接差分値703の間の値となるように、第1閾値を決定する。この第1閾値を用いて、第2入力画像の各画素の隣接差分値を二値化することにより、机の模様の端部がエッジ画素として抽出されることを抑制することが可能となる。
なお、閾値決定部202は、隣接差分値のヒストグラムの内、隣接差分値の高い側から所定割合(例えば1%)に係る部分については除去してから、第1閾値を算出してもよい。これにより、利用者の手、原稿以外の物体等の異物が推定背景領域に含まれる場合でも、第1閾値を適切に算出することが可能となる。
また、推定背景領域抽出部201が推定背景領域を複数抽出し、閾値決定部202は、抽出された複数の推定背景領域のそれぞれについて閾値を算出し、算出した各閾値の中央値を第1閾値として用いてもよい。例えば、推定背景領域抽出部201は、原稿読取範囲615の外側の領域の内、上側の領域と、左側の領域と、右側の領域をそれぞれ推定背景領域として抽出する。これにより、第2入力画像の上端、左端又は右端の内の何れかに原稿又は異物が写っている場合でも、その部分による影響は除去されるので、第1閾値を適切に算出することが可能となる。
次に、選択部203は、原稿領域の検出方法として、第1閾値を用いて検出される第1エッジ画素に基づいて原稿領域を検出する第1処理を選択する(ステップS206)。次に、画像処理回路27の各部は、第1処理に従って切出し領域決定処理を実施する(ステップS207)。切出し領域決定処理において、画像処理回路27の各部は、第1入力画像から原稿の画像を切出す切出し領域を決定する。また、切出し領域決定処理において、原稿の領域として非矩形の領域が検出された場合、マスク生成部214は、検出された非矩形に基づいて、切出される画像から背景を分離するためのマスクを生成する。切出し領域決定処理の詳細については後述する。
次に、選択部203は、第1処理に基づく切出し領域決定処理において矩形が検出されたか否かを判定する(ステップS208)。
図8は、第1入力画像の他の例を示す模式図である。図8に示す第1入力画像800では、本601が載置される机が大理石等で形成されており、模様802内のコントラストが大きく、机の模様の端部に位置する画素による隣接差分値と、原稿の端部に位置する画素による隣接差分値の差が小さい。したがって、第1閾値を用いて第2入力画像の各画素の隣接差分値を二値化した場合、原稿の端部をエッジ画素として抽出できない可能性がある。
選択部203は、第1処理に基づく切出し領域決定処理において矩形が検出されなかった場合、原稿領域の検出方法として、後述する膨張画像から検出される第2エッジ画素に基づいて原稿領域を検出する第2処理を選択する(ステップS209)。次に、画像処理回路27の各部は、第2処理に従って切出し領域決定処理を実施する(ステップS210)。即ち、選択部203は、第1処理に基づく切出し領域決定処理において矩形が検出された場合、原稿領域を検出するために第1エッジ画素を用いることを選択し、矩形が検出されなかった場合、第2エッジ画素を用いることを選択している。
次に、切出し部216は、切出し領域決定処理において決定された切出し領域を第1入力画像から切出す(ステップS211)。なお、切出し部216は、切出し領域決定処理において原稿の領域として非矩形の領域が検出された場合、マスク生成部214が生成したマスクを使用して、切出した画像から背景を分離した、原稿のみを表す分離画像を抽出する。
次に、記憶制御部217は、切出した画像及び分離画像を第2画像メモリ22に記憶し(ステップS212)、一連のステップを終了する。記憶制御部217は、切出した画像を、第2画像メモリ22の内、不揮発性半導体メモリ等の、画像を長期的に記憶する記憶媒体に記憶し、分離画像を揮発性半導体メモリ等の、画像を一時的に記憶する記憶媒体に記憶する。なお、記憶制御部217は、切出した画像を第2記憶装置25のハードディスク等に記憶し、分離画像をRAMに記憶してもよい。第2画像メモリ22又は第2記憶装置25に記憶された画像は、入力装置24を用いた利用者からの要求に従って、表示装置23に表示される。
また、記憶制御部217は、切出した画像をファイルとして記憶し、一方、分離画像を例えばクリップボードに記憶することにより特定のアプリケーションで利用可能に記憶する。これにより、利用者は、文書編集ソフト、画像編集ソフト、表計算ソフト等において、貼付けコマンドのみを実行することにより、分離画像を利用することが可能となり、利用者の利便性を向上させることが可能となる。
なお、記憶制御部217は、矩形を検出した場合と非矩形を検出した場合とで切出した画像(及び分離画像)を保存するファイル形式を変更してもよい。例えば、記憶制御部217は、矩形を検出した場合、切出した画像をJPEG(Joint Photographic Experts Group)形式で保存する。一方、記憶制御部217は、非矩形を検出した場合、切出した画像を透過PNG(Portable Network Graphics)形式で保存する。これにより、情報処理装置20は、形状に適した形式で画像を保存することが可能となり、利用者の利便性を向上させることが可能となる。
図9は、切出し領域決定処理の動作の例を示すフローチャートである。図9に示す動作のフローは、図5に示すフローチャートのステップS207及びS210において実行される。
最初に、画像処理回路27の各部は、候補領域検出処理を実施する(ステップS301)。候補領域検出処理において、第1エッジ画素抽出部204又は第2エッジ画素抽出部207は、エッジ画素を抽出し、候補領域検出部208は、抽出されたエッジ画素のうち連結するエッジ画素によって囲まれる候補領域を検出する。候補領域検出処理の詳細については後述する。
次に、候補領域検出部208は、候補領域検出処理において候補領域を検出したか否かを判定する(ステップS302)。候補領域検出部208は、候補領域を全く検出していない場合、特に処理を行わず、一連のステップを終了し、一方、候補領域を検出している場合、処理をステップS303へ移行する。ステップS303〜S308の処理は、抽出された候補領域ごとに実施される。
次に、画像処理回路27の各部は、候補領域について矩形検出処理を実施する(ステップS303)。矩形検出処理において、第1エッジ画素抽出部204又は第2エッジ画素抽出部207は、エッジ画素を抽出し、外側エッジ画素抽出部209は、エッジ画素のうち外側に位置する外側エッジ画素を抽出する。さらに、直線検出部210は、外側エッジ画素から複数の直線を検出し、矩形検出部211は、検出された複数の直線のうち二本ずつが略直交する四本の直線から構成される矩形を検出する。矩形検出処理の詳細については後述する。
次に、原稿領域検出部215は、矩形検出処理において、矩形検出部211により矩形が検出されたか否かを判定する(ステップS304)。原稿領域検出部215は、矩形検出部211により矩形が検出された場合、その検出された矩形を原稿領域に決定し、第1入力画像から原稿の画像を切出す切出し領域に決定する(ステップS305)。
一方、画像処理回路27の各部は、矩形検出部211により矩形が検出されなかった場合、候補領域について非矩形検出処理を実施する(ステップS306)。非矩形検出処理において、第1エッジ画素抽出部204又は第2エッジ画素抽出部207は、エッジ画素を抽出し、外周エッジ画素抽出部212は、抽出されたエッジ画素のうち連結するエッジ画素の外周を構成する外周エッジ画素を抽出する。さらに、非矩形検出部213は、外周エッジ画素で囲まれる非矩形を検出する。非矩形検出処理の詳細については後述する。
次に、原稿領域検出部215は、非矩形検出処理において検出された非矩形を含む領域を原稿領域に決定し、第1入力画像から原稿の画像を切出す切出し領域に決定する(ステップS307)。原稿領域検出部215は、検出された非矩形の外接矩形を切出し領域に決定する。なお、原稿領域検出部215は、検出された非矩形自体を切出し領域に決定してもよい。
このように、原稿領域検出部215は、第1エッジ画素又は第2エッジ画素から原稿領域を検出する。
次に、画像処理回路27は、全ての候補領域について処理したか否かを判定する(ステップS308)。画像処理回路27は、まだ処理していない候補領域がある場合は処理をステップS303に戻して、ステップS303〜S308の処理を繰り返し、全ての候補領域について処理した場合は一連のステップを終了する。
図10は、候補領域検出処理の動作の例を示すフローチャートである。図10に示す動作のフローは、図9に示すフローチャートのステップS301において実行される。
最初に、画像処理回路27は、選択部203により、第1処理又は第2処理の内の何れが選択されているかを判定する(ステップS401)。
第1処理が選択されている場合、第1エッジ画素抽出部204は、第1閾値を用いて第2入力画像から水平方向及び垂直方向における第1エッジ画素を抽出する。第1エッジ画素抽出部204は、第2入力画像の水平方向及び垂直方向の何れかにおいて第1エッジ画素として抽出された画素からなる画像を第1エッジ画像として生成し、第2画像メモリ22に保存する(ステップS402)。
第1エッジ画素抽出部204は、第2入力画像の各画素の水平方向の隣接差分値を算出し、隣接差分値が第1閾値を越える場合、その画像上の画素を垂直エッジ画素とする。また、第1エッジ画素抽出部204は、各画像について垂直方向にも同様の処理を行い、水平エッジ画素を抽出する。
図11A〜図11Eは、候補領域検出処理における各画像について説明するための模式図である。図11Aに示す画像1100は、図6Bの第2入力画像610から生成された第1エッジ画像1100の例である。第1エッジ画像1100では、第2入力画像610に含まれる本612の端部及びコンテンツの位置においてエッジ画素1101が検出されているが、机の模様611の位置においてはエッジ画素が検出されていない。
なお、第1エッジ画素抽出部204は、抽出した垂直エッジ画素及び水平エッジ画素をそれぞれラベリングによりグループ化し、水平方向の大きさ又は垂直方向の大きさが閾値Th2以下となるグループに含まれる第1エッジ画素を除去してもよい。閾値Th2は、原稿の載置面の汚れとして想定される値(例えば3mmに相当する値)に設定される。また、第1エッジ画素抽出部204は、各グループの面積もしくは各グループの外接矩形の面積が閾値以下である場合にそのグループに含まれる第1エッジ画素を除去してもよい。これらにより、原稿の載置面の汚れにより生じたエッジ画素を除去することができる。
第1エッジ画素抽出部204は、第2入力画像において垂直エッジ画素又は水平エッジ画素として抽出された画素からなる画像を第1エッジ画像として生成する。なお、第1エッジ画素抽出部204は、生成した第1エッジ画像に対して膨張・収縮処理を実施してもよい。これにより、第2入力画像において連結している部分の一部が第1エッジ画素として抽出されない場合でも、第1エッジ画像においてその部分を連結させることができる。
一方、第2処理が選択されている場合、膨張用エッジ画素抽出部205は、第2閾値を用いて第2入力画像から水平方向及び垂直方向における膨張用エッジ画素を抽出する。膨張用エッジ画素抽出部205は、第2入力画像の水平方向及び垂直方向の何れかにおいて膨張用エッジ画素として抽出された画素からなる膨張用エッジ画像を生成する(ステップS403)。
膨張用エッジ画素抽出部205は、第2入力画像の各画素の水平方向の隣接差分値を算出し、隣接差分値が第2閾値を越える場合、その画像上の画素を垂直エッジ画素とする。また、膨張用エッジ画素抽出部205は、各画像について垂直方向にも同様の処理を行い、水平エッジ画素を抽出する。なお、第2閾値は、膨張用エッジ画素がより多く抽出されるように、第1閾値より低い値に設定される。
図11Bに示す画像1110は、図8の第1入力画像800から生成された膨張用エッジ画像の例である。膨張用エッジ画像1110では、第1入力画像800に含まれる本801の端部及びコンテンツの位置においてエッジ画素1111が検出され、さらに机の模様802の位置においてエッジ画素1112が検出されている。
次に、膨張画像生成部206は、推定背景領域内の画素に基づいて、後述する膨張画像を生成するための膨張係数を決定する(ステップS404)。膨張画像は、背景におけるエッジ画素を膨張させ、相互に近傍に位置するエッジ画素同士を結合させることにより、エッジ画素を埋没させるために用いられる。膨張画像生成部206は、推定背景領域内の全画素数に対する膨張用エッジ画素数の比率が小さいほど膨張係数が大きくなり、その比率が大きいほど膨張係数が小さくなるように膨張係数を決定する。これにより、膨張画像において、相互に近傍に位置するエッジ画素同士を適切に結合させることが可能となる。
なお、膨張画像生成部206は、膨張係数に基づいて生成される膨張画像から抽出される第エッジ画素の数が所定数(例えば全画素数の10%)以下となるように膨張係数を決定してもよい。その場合、膨張画像生成部206は、膨張係数を1から順にインクリメントしながら、後述するステップS405、S406の処理を、膨張画像から抽出される第エッジ画素の数が所定数以下になるまで繰り返す。これにより、膨張画像において、縞模様における相互に隣接する筋に対応する画素同士をより確実に結合させることが可能となる。また、膨張画像生成部206は、予め定められた数(例えば5)を膨張係数として用いてもよい。
次に、膨張画像生成部206は、決定した膨張係数に基づいて、膨張用エッジ画素を膨張させることにより膨張画像を生成する(ステップS405)。膨張画像生成部206は、膨張用エッジ画素として抽出された画素からなる画像内の各画素について、その画素から膨張係数の範囲内に膨張用エッジ画素が含まれる場合、その画素を膨張用エッジ画素に置換することにより、膨張画像を生成する。
図11Cに示す画像1120は、図11Bの画像1110から生成された膨張画像の例である。膨張画像1120では、机の模様802から検出された各エッジ画素1112が膨張し、結合している。
次に、第2エッジ画素抽出部207は、膨張画像から水平方向及び垂直方向における第2エッジ画素を抽出する。第2エッジ画素抽出部207は、膨張画像の水平方向及び垂直方向の何れかにおいて第2エッジ画素として抽出された画素からなる画像を第1エッジ画像として生成する(ステップS406)。
膨張画像は、膨張用エッジ画素又は非膨張用エッジ画素の二種類の画素から構成されており、各画素の画素値は二値を有する。第2エッジ画素抽出部207は、膨張画像の各画素の水平方向の隣接差分値を算出し、隣接差分値が0でない場合、その画像上の画素を垂直エッジ画素とする。また、第2エッジ画素抽出部207は、各画像について垂直方向にも同様の処理を行い、水平エッジ画素を抽出する。
図11Dに示す画像1130は、図11Cの膨張画像1120から生成された第1エッジ画像の例である。第1エッジ画像1130では、図11Aに示す第1エッジ画像1100と同様に、本の端部及びコンテンツの位置においてエッジ画素1131が検出されているが、机の模様の位置においてはエッジ画素が検出されていない。
次に、候補領域検出部208は、第1エッジ画像について、各エッジ画素(即ち、第1エッジ画素又は第2エッジ画素)が他のエッジ画素と連結しているか否かを判定し、連結しているエッジ画素を一つのグループとしてラベリングする(ステップS407)。候補領域検出部208は、水平方向、垂直方向又は斜め方向(8近傍)に相互に隣接するエッジ画素を連結していると判定する。なお、第1エッジ画素抽出部204は、水平方向又は垂直方向のみ(4近傍)に相互に隣接するエッジ画素を連結していると判定してもよい。
次に、候補領域検出部208は、各グループの水平方向及び垂直方向の両方の大きさが閾値Th3以下か否かを判定する。候補領域検出部208は、水平方向及び垂直方向の両方の大きさが閾値Th3以下となるグループに含まれるエッジ画素を第1エッジ画像から除去する(ステップS408)。閾値Th3は、情報処理装置40が検出を保証する原稿の最小サイズ(例えば1inchに相当する値)に設定される。なお、候補領域検出部208は、各グループの水平方向及び垂直方向の何れかの大きさが閾値Th3以下である場合、又は各グループの面積もしくは各グループの外接矩形の面積が閾値以下である場合にエッジ画素を除去してもよい。外接矩形の面積と比較する閾値は、例えば1inch四方に相当する値とすることができる。
次に、候補領域検出部208は、各グループが他のグループに包含されるか否かを判定し、他のグループに包含されるグループに含まれるエッジ画素をエッジ画像から除去する(ステップS409)。
図11Eに示す画像1140は、所定の大きさ以下となるグループに含まれるエッジ画素、及び他のグループに包含されるグループに含まれるエッジ画素を除去したエッジ画像の例である。画像1140では、所定の大きさ以下となるグループに含まれるエッジ画素として画像読取装置10の一部によるエッジ画素が除去され、他のグループに包含されるグループに含まれるエッジ画素として原稿内のコンテンツによるエッジ画素が除去されている。
次に、候補領域検出部208は、除去されずに残った各グループについて、そのグループに含まれるエッジ画素によって囲まれる領域を検出し、検出した領域に対応する第1入力画像内の領域を候補領域として検出する。候補領域検出部208は、第1入力画像内の候補領域の外接矩形を第2画像メモリ22に保存し(ステップS410)、一連のステップを終了する。
図11Eに示す画像1140では、連結するエッジ画素によって囲まれる領域は、その連結するエッジ画素のグループの最も外側の外周1141及びその内側の領域である。その領域にはエッジ画素だけでなく、外周1141の内側に存在する全ての画素1142が含まれる。
なお、連結するエッジ画素によって囲まれる領域を、連結するエッジ画素のグループの最も外側の外周を含まない領域としてもよい。または、連結するエッジ画素によって囲まれる領域を、連結するエッジ画素のグループの最も外側の外周及びその内側の領域を所定画素分だけ膨張又は収縮させた領域としてもよい。また、連結するエッジ画素について、上記したようにエッジ画像に対して膨張・収縮処理を実施することにより、相互に隣接するエッジ画素だけでなく、相互に所定距離内に位置するエッジ画素とその間に位置する画素を含めてもよい。また、連結するエッジ画素の両端に位置するエッジ画素が、所定距離内にある場合は、両端のエッジ画素の間に位置する画素を連結するエッジ画素に含めてもよい。この所定距離は、例えば連結するエッジ画素の長さに所定比率(例えば80%)を乗じた長さとすることができる。これにより、例えばエッジ画素がU字型に連結している場合に、両端のエッジ画素を連結させて囲まれた領域を形成させることができる。
図12は、矩形検出処理の動作の例を示すフローチャートである。図12に示す動作のフローは、図9に示すフローチャートのステップS303において実行される。
ステップS501〜S506において、画像処理回路27の各部は、図10のステップS401〜S406と同様にして、第1エッジ画素又は第2エッジ画素を抽出し、抽出した画素からなる画像を第2エッジ画像として生成する。但し、画像処理回路27の各部は、候補領域内において第1エッジ画素又は第2エッジ画素を抽出する。
なお、画像処理回路27は、候補領域内の画素に基づいて閾値を算出し、算出した閾値を第1閾値の代わりに用いてエッジ画素を抽出し、抽出した画素からなる画像を第2エッジ画像として生成してもよい。その場合、画像処理回路27は、候補領域内の各画素の水平方向の隣接差分値と、垂直方向の隣接差分値とを算出し、算出した隣接差分値のヒストグラムを生成する。そして、画像処理回路27は、例えば大津の二値化方法により閾値を決定し、決定した閾値を用いて、第2入力画像の各画素の隣接差分値を二値化することによりエッジ画素を抽出する。
また、画像処理回路27は、他の方法により垂直エッジ画素及び水平エッジ画素を抽出してもよい。例えば、画像処理回路27は、第1入力画像からそれぞれ異なる間引き率で画素を間引いた複数の間引き画像を生成し、第1入力画像及び各間引き画像からそれぞれ垂直エッジ画素を抽出して垂直エッジ画素からなるエッジ画像を生成する。画像処理回路27は、最も小さい間引き画像から生成したエッジ画像をその次に小さい間引き画像から生成したエッジ画像と同一の解像度に拡大し、同一の解像度にした二つのエッジ画像において同一の位置に存在する垂直エッジ画素からなる画像を生成する。画像処理回路27は、生成した画像と、その次に小さい間引き画像から生成したエッジ画像に対して同様の処理を繰り返し、最終的に、第1入力画像から生成したエッジ画像の垂直エッジ画素と同一の位置に存在する垂直エッジ画素を抽出する。また、画像処理回路27は、同様の処理により水平エッジ画素を抽出する。これにより、ノイズを低減しつつ、垂直エッジ画素及び水平エッジ画素を抽出することができる。
なお、画像処理回路27の各部は、生成した第2エッジ画像に対して膨張・収縮処理を実施しない。これにより、第2エッジ画像では、机の模様、ノイズ等が誤って連結されることが防止される。
次に、外側エッジ画素抽出部209は、候補領域の端部が第1入力画像の端部と近接しているか否かを判定する(ステップS507)。外側エッジ画素抽出部209は、候補領域の左端、右端、上端及び下端の何れかが、第1入力画像の左端、右端、上端又は下端から所定距離内にある場合、近接していると判定し、所定距離内にない場合、近接していないと判定する。所定距離は、候補領域に写っている物が第1入力画像の端部と交わっているにも関わらずエッジ画素が抽出されない可能性のある第1入力画像の端部からの最大距離に定められ、例えば10mmに相当する距離に定められる。
なお、外側エッジ画素抽出部209は、候補領域が、第1入力画像内において予め定められた原稿読取範囲に納まらずにはみ出している場合に候補領域の端部が第1入力画像の端部と近接していると判定し、納まっている場合に近接していないと判定してもよい。
外側エッジ画素抽出部209は、候補領域の端部が第1入力画像の端部と近接していない場合、抽出したエッジ画素のうち外側に位置する外側エッジ画素を抽出する。外側エッジ画素抽出部209は、外側エッジ画素として抽出された画素からなる画像を第3エッジ画像として生成する(ステップS508)。
図13A、図13Bは、外側エッジ画素の抽出処理について説明するための模式図である。図13Aに示す画像1300は第2エッジ画像の例である。図13Aに示すように、外側エッジ画素抽出部209は、第2エッジ画像1300の各水平ラインを矢印1301のように左端側から右端側に向かって走査し、最初に検出したエッジ画素1302を外側エッジ画素として抽出する。同様に、外側エッジ画素抽出部209は、第2エッジ画像1300の各水平ラインを右端側から左端側に向かって走査し、最初に検出したエッジ画素1303も外側エッジ画素として抽出する。同様に、外側エッジ画素抽出部209は、第2エッジ画像1300の各垂直ラインを上端側から下端側、及び下端側から上端側に向かってそれぞれ走査し、最初に検出したエッジ画素1304、1305も外側エッジ画素として抽出する。即ち、外側エッジ画素抽出部209は、候補領域内の各水平ラインにおいて最も左端側及び右端側にそれぞれ位置するエッジ画素、及び候補領域内の各垂直ラインにおいて最も上端側及び下端側にそれぞれ位置するエッジ画素を外側エッジ画素として抽出する。
図13Bに示す画像1310は、抽出された外側エッジ画素の例である。図13Bに示すように、外側エッジ画素1311は、図13Aの第2エッジ画像1300から検出されたエッジ画素1302〜1305から構成される。
一方、外側エッジ画素抽出部209は、候補領域の端部が第1入力画像の端部と近接している場合、候補領域内の全てのエッジ画素からなる画像を第3エッジ画像として生成する(ステップS509)。この場合、後述する矩形処理において、矩形検出部211は、候補領域内の全てのエッジ画素から矩形を検出する。
図14A、図14Bは、候補領域の端部が第1入力画像の端部と近接している例について説明するための模式図である。図14Aに示す画像1400は、原稿1401が利用者の手1402及び1403によりおさえられている状態を示す。この例では、利用者の手1402及び1403によるエッジ画素は、原稿読取範囲1404に納まらずにはみ出し、第1入力画像の端部にまで位置している。図14Bに示す画像1410は、図14Aに示す画像1400から抽出される外側エッジ画素の例である。図14Bに示すように、利用者の手1402及び1403より内側に位置する原稿の端部1405及び1406は、外側エッジ画素1411として抽出されない。このような場合、候補領域内の全てのエッジ画素からなる画像を第3エッジ画像として生成することにより、原稿の端部が抽出されなくなることを防止することができる。
これにより、原稿が載置されている机の模様等のエッジ強度が高い場合にも同様に、原稿の端部から検出されたエッジ画素と机の模様から検出されたエッジ画素とが繋がってしまい、原稿の端部が抽出されなくなることを防止することができる。
なお、外側エッジ画素抽出部209は、候補領域の端部が第1入力画像の端部と近接している場合、候補領域内の一部のエッジ画素を第3エッジ画像から除去してもよい。例えば、外側エッジ画素抽出部209は、候補領域の端部が第1入力画像の水平方向の端部と近接している場合、候補領域内で垂直方向の直線を検出し、候補領域の端部が第1入力画像の垂直方向の端部と近接している場合、候補領域内で水平方向の直線を検出する。外側エッジ画素抽出部209は、最も外側に検出された二つの直線の間にあるエッジ画素を第3エッジ画像から除去する。これにより、原稿内のコンテンツ等を原稿の端部の検出対象から除去することができ、原稿の端部の検出精度を向上させることができる。
次に、直線検出部210は、第3エッジ画像から複数の直線を検出する(ステップS510)。直線検出部210は、ハフ変換を用いて直線を検出する。なお、直線検出部210は、最小二乗法を用いて直線を検出してもよい。または、直線検出部210は、ハフ変換を用いて検出した直線から所定距離内にあるエッジ画素に対して最小二乗法を用いて直線を検出してもよい。この所定距離は、画像処理システム1が使用される環境等に応じて適宜定められ、例えば2mmに相当する距離に設定される。
次に、直線検出部210は、第3エッジ画像から近似直線を検出する(ステップS511)。
図15A及び図15Bは、近似直線について説明するための模式図である。図15Aに示すような書籍原稿を撮影した第1入力画像1500において、書籍原稿の綴じ目部1501に対して平行な端部1502は直線として検出される。しかしながら、綴じ目部1501に対して直交する端部1503は綴じ目部1501の近傍で歪みが生じ、直線として検出されない場合がある。
そこで、直線検出部210は、図15Bのエッジ画像1510に示すように、相互に隣接するエッジ画素1511をラベリングにより一つのグループ1512としてまとめる。直線検出部210は、そのグループ1512に含まれるエッジ画素のうち、水平方向又は垂直方向における両端に位置するエッジ画素1513及びエッジ画素1514を結んだ直線1515を近似直線として検出する。
次に、矩形検出部211は、直線検出部210が検出した直線又は近似直線からなる矩形を検出し(ステップS512)、一連のステップを終了する。このように、矩形検出部211は、第1エッジ画素又は第2エッジ画素から矩形を検出する。
矩形検出部211は、直線検出部210が検出した複数の直線又は近似直線のうち二本ずつが略直交する四本の直線から構成される複数の矩形候補を抽出する。矩形検出部211は、まず水平方向の直線(以下、第1の水平線と称する)を一つ選択し、選択した直線と略平行(例えば±3°以内)かつ閾値Th4以上離れた水平方向の直線(以下、第2の水平線と称する)を抽出する。次に、矩形検出部211は、第1の水平線と略直交する(例えば90°に対して±3°以内)垂直方向の直線(以下、第1の垂直線と称する)を抽出する。次に、矩形検出部211は、第1の水平線と略直交し、かつ第1の垂直線と閾値Th5以上離れた垂直方向の直線(以下、第2の垂直線と称する)を抽出する。なお、閾値Th4及び閾値Th5は、画像読取装置10の読取りの対象となる原稿のサイズに応じて予め定められ、同じ値としてもよい。
矩形検出部211は、直線検出部210が検出した全ての直線又は近似直線について、上記の条件を満たす第1の水平線、第2の水平線、第1の垂直線及び第2の垂直線の全ての組合せを抽出し、抽出した各組合せから構成される矩形を矩形候補として抽出する。矩形検出部211は、抽出した矩形候補について面積を算出し、面積が所定値未満である矩形候補を除去する。矩形検出部211は、残った矩形候補の中で最も面積が大きい矩形候補を矩形として検出する。一方、矩形検出部211は、矩形候補が一つも残らなかった場合、矩形を検出しない。
なお、矩形検出部211は、各矩形候補について、矩形候補の各辺から所定距離(例えば2mmに相当する距離)内にある全ての画素の数に対する所定距離内にあるエッジ画素の数の割合を算出し、矩形候補の面積にその割合を乗じて重み付けしてもよい。これにより、原稿の境界を明確に表している直線から構成される矩形を検出することができる。または、矩形検出部211は、各矩形候補について、矩形候補の各角の角らしさの度合いを表す評価点を算出し、評価点を用いて矩形候補の面積を重み付けしてもよい。
図16は、矩形候補の各角の評価点について説明するための模式図である。図16に示す画像1600において、点1601は矩形候補の角を表し、直線1602、1603は矩形候補の各辺を表す。この直線1602、1603の端部が相互に接している場合は、点1601は矩形の角らしいと考えられるが、直線1602、1603の端部が接していない場合又は直線1602、1603が交差している場合は、点1601は矩形の角らしくないと考えられる。
評価点は0点を基準とする。そして、角1601の近傍における辺1602から所定距離内の領域1604において、水平方向のライン毎にエッジ画素が存在するか否かを判定し、水平方向のラインにエッジ画素が存在する場合、評価点に1点を加算する。なお、各角の近傍の範囲及び各辺からの所定距離は、画像処理システム1が使用される環境等に応じて適宜定められ、例えば各角から5mmに相当する距離内の範囲及び各辺から2mmに相当する距離に設定することができる。同様に、角1601の近傍における辺1603から所定距離内の領域1605において、垂直方向のライン毎にエッジ画素が存在するか否かを判定し、垂直方向のラインにエッジ画素が存在する場合、評価点に1点を加算する。また、角1601の近傍における辺1602の延長線から所定距離内の領域1606において、水平方向のライン毎にエッジ画素が存在するか否かを判定し、水平方向のラインにエッジ画素が存在する場合、評価点から1点を減算する。同様に、角1601の近傍における辺1603の延長線から所定距離内の領域1607において、垂直方向のライン毎にエッジ画素が存在するか否かを判定し、垂直方向のラインにエッジ画素が存在する場合、評価点から1点を減算する。矩形検出部211は、評価点の取り得る最低値が0、取り得る最高値が1となるように評価点を正規化した値を算出し、矩形候補の面積にその値を乗じて重み付けすることにより、四つの角を明確に表している矩形を検出することができる。
図17A〜図17Cは、非矩形の画像について矩形検出処理を実行した場合について説明するための模式図である。図17Aに示す画像1700は、矩形状の模様1702を有する、うちわ形状の物1701を撮像した第1入力画像の例である。図17Bに示す画像1710は、第1入力画像1700から生成された第3エッジ画像の例である。図17Bに示すように、第3エッジ画像1710は、外側エッジ画素1711から構成され、第3エッジ画像1710において矩形状の模様1702は抽出されない。図17Cに示す画像1720は、第3エッジ画像1710から抽出された直線の例である。図17Cに示すように、第3エッジ画像1710から、うちわ形状の柄の部分1721〜1723が直線として検出される。しかしながら、図17A〜図17Cに示す例では、二本ずつが略直交する四本の直線から構成される矩形は検出されない。
図18は、非矩形検出処理の動作の例を示すフローチャートである。図18に示す動作のフローは、図9に示すフローチャートのステップS306において実行される。
ステップS601〜S606において、画像処理回路27の各部は、図10のステップS401〜S406又は図12のステップS501〜S506と同様にして、第1エッジ画素又は第2エッジ画素を抽出する。画像処理回路27の各部は、抽出した画素からなる画像を第4エッジ画像として生成する。但し、画像処理回路27の各部は、候補領域内において、水平方向、垂直方向及び斜め方向に第1エッジ画素又は第2エッジ画素を抽出する。
第1エッジ画素抽出部204、膨張用エッジ画素抽出部205及び第2エッジ画素抽出部207は、各画像の各画素について、上から下へ向かう垂直方向、左から右へ向かう水平方向、左下から右上へ向かう斜め方向、及び右下から左上へ向かう斜め方向の隣接差分値をそれぞれ算出する。第1エッジ画素抽出部204、膨張用エッジ画素抽出部205及び第2エッジ画素抽出部207は、算出した何れかの隣接差分値の絶対値が第1閾値を越える場合、その画像上の画素をエッジ画素とする。
なお、画像処理回路27は、候補領域内の画素に基づいて閾値を算出し、算出した閾値を第1閾値の代わりに用いてエッジ画素を抽出し、抽出した画素からなる画像を第4エッジ画像として生成してもよい。その場合、画像処理回路27は、候補領域内の各画素の水平方向の隣接差分値と、垂直方向の隣接差分値と、斜め方向の隣接差分値とを算出し、算出した隣接差分値のヒストグラムを生成する。そして、画像処理回路27は、例えば大津の二値化方法により閾値を決定し、決定した閾値を用いて、第2入力画像の各画素の隣接差分値を二値化することによりエッジ画素を抽出する。
次に、第1エッジ画素抽出部204又は第2エッジ画素抽出部207は、抽出したエッジ画素をラベリングによりグループ化する。第1エッジ画素抽出部204又は第2エッジ画素抽出部207は、大きさが閾値Th2以下となるグループに含まれるエッジ画素を除去する(ステップS607)。これにより、第4エッジ画像に含まれるノイズ成分を除去することができる。
次に、第1エッジ画素抽出部204又は第2エッジ画素抽出部207は、生成した第4エッジ画像において、エッジ画素を膨張させた第2膨張画像を生成する(ステップS608)。これにより、第2入力画像において、連結している部分の一部がエッジ画素として抽出されない場合でも、第2膨張画像においてその部分を連結させることができる。
次に、外周エッジ画素抽出部212は、第2膨張画像に対して、エッジ画素以外の画素(非エッジ画素)についてラベリング処理を実行し、第2膨張画像の端部と連結しているグループを抽出する(ステップS609)。
図19A、図19Bは、非矩形検出処理における各画像について説明するための模式図である。図19Aに示す画像1900のように、第2膨張画像の端部と連結しているグループ1902は、原稿1901の外周の外側に位置する非エッジ画素のグループとなる。
次に、外周エッジ画素抽出部212は、抽出したグループに含まれる画素を無効画素とし、他の画素を有効画素とする画像を生成する(ステップS610)。
図19Bに示す画像1910は、ステップS610で生成される画像の例である。画像1910では、抽出したグループに含まれる画素1912が無効画素となり、他の画素1911が有効画素となる。
次に、外周エッジ画素抽出部212は、生成した画像において、有効画素を収縮させた収縮画像を生成する(ステップS611)。この収縮処理は、ステップS608で膨張させたエッジ画素を元のサイズに戻すために実行される。従って、非矩形検出部213は、ステップS608でエッジ画素を膨張させた膨張度合いと同じ度合いだけ非矩形を収縮させる。なお、非矩形検出部213は、ステップS608でエッジ画素を膨張させた膨張度合いより大きい度合いで非矩形を収縮させてもよい。その場合、原稿が載置されている机の模様等のエッジ強度が高い場合に、机の模様等により検出されたエッジ画素を有効画素から除去することができる。
次に、外周エッジ画素抽出部212は、収縮画像の有効画素の外周を構成するエッジ画素を外周エッジ画素として抽出する(ステップS612)。
図19Bに示すように、有効画素1911の外周を構成する外周エッジ画素1913は、連結するエッジ画素の外周を構成するエッジ画素となる。
次に、非矩形検出部213は、抽出された外周エッジ画素で囲まれる非矩形を検出する(ステップS613)。非矩形検出部213は、非矩形を複数検出した場合、最も面積が大きい非矩形のみを、検出した非矩形として選択する。これにより、机の模様等により発生するノイズを除去することができる。
次に、マスク生成部214は、検出された非矩形に基づいて、切出される画像から背景を分離するためのマスクを生成する(ステップS614)。マスクは、水平及び垂直方向のそれぞれにおいて、切出し画像と同数の画素を有し、且つ、検出された非矩形に対応する画素を有効画素とし、他の画素を無効画素とする画像で構成される。情報処理装置20は、マスクを用いて、切出される画像から、マスク内の有効画素の位置に対応する画素のみを抽出することにより、分離画像を抽出することができる。
なお、画像処理回路27は、図9のステップS301に示した候補領域検出処理を省略し、第1入力画像全体に対して、矩形検出処理及び非矩形検出処理を実行してもよい。その場合でも、情報処理装置20は、原稿の画像を切出すべき領域を適切に決定することができる。
また、画像処理回路27は、候補領域を検出するためのエッジ画素と、矩形を検出するためのエッジ画素と、非矩形を検出するためのエッジ画素とを別個に検出せずに、候補領域を検出するためのエッジ画素を用いて矩形又は非矩形を検出してもよい。その場合、情報処理装置20は、エッジ画素の検出処理による処理負荷を低減し、処理の高速化を図ることができる。
また、画像処理回路27は、図9のステップS306に示した非矩形検出処理を省略し、矩形が検出されなかった場合、候補領域を非矩形として用いてもよい。その場合、外周エッジ画素抽出部212は、候補領域の外周を構成するエッジ画素を外周エッジ画素として抽出し、非矩形検出部213は、候補領域を非矩形として検出する。
以上詳述したように、図5、図9、図10、図12、図18に示したフローチャートに従って動作することによって、情報処理装置20は、原稿の画像を切出すべき領域を適切に決定することが可能となった。特に、情報処理装置20は、入力画像が複雑な背景又はコントラストの大きい背景を有する場合でも、原稿の領域を精度良く検出することが可能となった。
また、情報処理装置20は、入力画像に応じて、背景に対応して検出されるエッジ画素の数を減少させる第1処理と、逆に、背景に対応して検出されるエッジ画素の数を増大させてエッジ画素を埋没させる第2処理とを切り替える。これにより、情報処理装置20は、原稿の端部におけるコントラストと背景の模様によるコントラストの差が大きい入力画像に対しては第1処理で、その差が小さい入力画像に対しては第2処理で、それぞれ原稿領域を適切に検出することが可能となった。
また、情報処理装置20は、撮影対象物が立体物、手、写真の切抜き等の非矩形の形状を有する場合でも、精度良く撮影対象物の輪郭線を検出し、背景を削除することが可能となった。
また、情報処理装置20は、矩形を検出するためのエッジ画素として垂直及び水平エッジ画素のみを使用し、非矩形を検出するためのエッジ画素として斜めエッジ画素も使用する。これにより、情報処理装置20は、エッジが多少欠落しても検出可能な直線で構成される矩形を検出するときは背景等によるノイズの影響を低減させつつ、エッジが欠落すると検出することが困難な曲線を有する非矩形を検出するときはエッジの欠落を防止できる。
図20は、原稿切出し処理の動作の他の例を示すフローチャートである。このフローチャートは、情報処理装置20において、前述した図5に示すフローチャートの代りに実行することが可能である。図20に示すフローチャートでは、図5に示すフローチャートと異なり、選択部203は、第1閾値が所定値以上であるか否かによって、第1処理と第2処理の何れを選択するかを切り替える。図20に示すステップS701〜S705、S710〜S711の処理は、図5に示すステップS201〜S205、S211〜S212の処理と同じであるため、説明を省略し、以下では、ステップS706〜S709の処理についてのみ説明する。
ステップS705において閾値決定部202が第1閾値を決定すると、選択部203は、決定された第1閾値が所定値以上であるか否かを判定する(ステップS706)。選択部203は、第1閾値が所定値未満である場合、原稿領域の検出方法として第1処理を選択し(ステップS707)、第1閾値が所定値以上である場合、原稿領域の検出方法として第2処理を選択する(ステップS708)。所定値は、例えば白色の原稿を白色の机に載置した際にその原稿の端部において算出される隣接差分値に定められる。なお、情報処理装置20は、第1入力画像全体の各画素の水平及び垂直方向の隣接差分値のヒストグラムから大津の二値化方法により閾値を決定し、決定した閾値を所定値として用いてもよい。
次に、画像処理回路27の各部は、選択部203が決定した処理に従って切出し領域決定処理を実施する(ステップS709)。即ち、選択部203は、第1閾値が所定値未満である場合、原稿領域を検出するために第1エッジ画素を用いることを選択し、第1閾値が所定値以上である場合、第2エッジ画素を用いることを選択する。
以上詳述したように、図20、図9、図10、図12、図18に示したフローチャートに従って動作することによって、情報処理装置20は、背景の模様によるコントラストが低い場合、背景に対応して検出されるエッジ画素の数を減少させる第1処理を実行する。逆に、情報処理装置20は、背景の模様によるコントラストが高い場合には、背景に対応して検出されるエッジ画素の数を増大させて、そのエッジ画素を埋没させる第2処理を実行する。したがって、情報処理装置20は、入力画像から背景を適切に除去することが可能となった。
図21は、原稿切出し処理の動作のさらに他の例を示すフローチャートである。このフローチャートは、情報処理装置20において、前述した図5に示すフローチャートの代りに実行することが可能である。図21に示すフローチャートでは、図5に示すフローチャートと異なり、原稿領域検出部215は、第1エッジ画素及び第2エッジ画素の両方から原稿領域を検出する。図21に示すステップS801〜S805、S807〜S808の処理は、図5に示すステップS201〜S205、S211〜S212の処理と同じであるため、説明を省略し、以下では、ステップS806の処理についてのみ説明する。
ステップS805において閾値決定部202が第1閾値を決定すると、画像処理回路27の各部は、切出し領域決定処理を実施する(ステップS806)。即ち、選択部203によって第1処理及び第2処理の何れかが選択されることなく、切出し領域決定処理が実施される。
図22は、候補領域検出処理の動作の他の例を示すフローチャートである。このフローチャートは、情報処理装置20において、図21のフローチャートが実行された場合に、前述した図10に示すフローチャートの代りに実行される。図22に示すフローチャートでは、図10に示すフローチャートと異なり、第1エッジ画像は、第1エッジ画素及び第2エッジ画素の両方から生成される。図22に示すステップS906〜S909の処理は、図10に示すステップS407〜S410の処理と同じであるため、説明を省略し、以下では、ステップS901〜S905の処理についてのみ説明する。
最初に、第1エッジ画素抽出部204は、第1閾値を用いて第2入力画像から第1エッジ画素を抽出する(ステップS901)。次に、膨張用エッジ画素抽出部205は、第2閾値を用いて第2入力画像から膨張用エッジ画素を抽出し、抽出した膨張用エッジ画素からなる膨張用エッジ画像を生成する(ステップS902)。次に、膨張画像生成部206は、推定背景領域内の画素に基づいて膨張係数を決定し(ステップS903)、決定した膨張係数に基づいて膨張画像を生成する(ステップS904)。次に、第2エッジ画素抽出部207は、膨張画像から第2エッジ画素を抽出し、第1エッジ画素として抽出された画素と、第2エッジ画素として抽出された画素に対応する画素を有効画素とする画像を第1エッジ画像として生成する(ステップS905)。
同様に、画像処理回路27の各部は、第1エッジ画素及び第2エッジ画素の両方から、第2エッジ画像及び第4エッジ画像をそれぞれ生成する。
以上詳述したように、図21、図9、図22、図12、図18に示したフローチャートに従って動作することによって、情報処理装置20は、背景の模様によるエッジ画素の検出を抑制しつつ、原稿の端部によるエッジ画素を適切に検出することが可能となった。
図23は、他の画像処理システム2の概略構成を示す図である。図23に示す画像処理システム2と、図1に示す画像処理システム1との差異は、画像処理回路を備える装置が異なる点である。すなわち、画像処理システム2では、情報処理装置40ではなく、画像読取装置30が画像処理回路36を有する。この画像処理回路36は、情報処理装置20の画像処理回路27と同様の機能を有する。
図23に示す画像処理システム2では、前述した図4、図5に示す処理とほぼ同様の処理を実行することができる。以下、図4のフローチャートに示される画像読取処理並びに図5のフローチャートに示される原稿切出し処理についてどのように適応されるかを説明する。画像処理システム2では、ステップS101の処理及びステップS202〜S212の処理は、予め第1記憶装置34に記憶されているプログラムに基づき主に第1CPU35により画像読取装置30の各要素と協働して実行される。
ステップS101において、画像読取装置30の画像入力装置31は、撮像対象物を撮影した読取画像を生成し、第1画像メモリ32に保存する。原稿切出し処理は、画像読取装置30で実施されるため、ステップS102、S201の読取画像の送受信処理は省略される。
ステップS202〜S212の処理は、画像読取装置30の画像処理回路36によって実行される。これらの処理の動作は、画像処理システム1について説明した情報処理装置20の画像処理回路27によって実行される場合と同様である。画像読取装置30の画像処理回路36は、切出した領域及び分離画像を第1インターフェース装置33を介して情報処理装置40に送信する。
このように、画像読取装置30が画像処理回路36を備えて原稿切出し処理を実行する場合も、情報処理装置が画像処理回路を備えて原稿切出し処理を実行する場合と同様の効果を得ることができる。
以上、本発明の好適な実施形態について説明してきたが、本発明はこれらの実施形態に限定されるものではない。例えば、画像読取装置と情報処理装置の機能分担は、図2及び図23に示す画像処理システムの例に限られず、画像処理回路内の各部を含めて画像読取装置及び情報処理装置の各部を画像読取装置と情報処理装置の何れに配置するかは適宜変更可能である。または、画像読取装置と情報処理装置を一つの装置で構成してもよい。
また、画像処理システム1において、第1インターフェース装置13と第2インターフェース装置21は、インターネット、電話回線網(携帯端末回線網、一般電話回線網を含む)、イントラネット等のネットワークを介して接続してもよい。その場合、第1インターフェース装置13及び第2インターフェース装置21に、接続するネットワークの通信インターフェース回路を備える。また、その場合、クラウドコンピューティングの形態で画像処理のサービスを提供できるように、ネットワーク上に複数の情報処理装置20を分散して配置し、各情報処理装置20が協働して、直線検出処理、矩形検出処理等を分担するようにしてもよい。これにより、画像処理システム1は、複数の画像読取装置10が読み取った読取画像について、効率よく原稿切出し処理を実施できる。
同様に、図23に示す画像処理システム2においても、画像読取装置30の第1インターフェース装置33と、情報処理装置40の第2インターフェース装置41をネットワークを介して接続してもよい。
1、2 画像処理システム
10、30 画像読取装置
20、40 情報処理装置
201 推定背景領域抽出部
202 閾値決定部
203 選択部
204 第1エッジ画素抽出部
205 膨張用エッジ画素抽出部
206 膨張画像生成部
207 第2エッジ画素抽出部
208 候補領域検出部
209 外側エッジ画素抽出部
210 直線検出部
211 矩形検出部
212 外周エッジ画素抽出部
213 非矩形検出部
214 マスク生成部
215 原稿領域検出部
216 切出し部
217 記憶制御部

Claims (11)

  1. 入力画像内の特定の位置にある領域を、背景が写っていると推定される推定背景領域として抽出する推定背景領域抽出部と、
    前記推定背景領域内の全画素数に対する、前記推定背景領域内の画素の隣接差分値に基づいて抽出される膨張用エッジ画素数の比率が小さいほど大きくなり、前記比率が大きいほど小さくなるように膨張係数を決定し、前記決定した膨張係数に基づいて膨張画像を生成する膨張画像生成部と、
    前記膨張画像から第2エッジ画素を抽出する第2エッジ画素抽出部と、
    前記抽出された第2エッジ画素のうち連結する第2エッジ画素によって囲まれる矩形領域を原稿領域として検出する原稿領域検出部と、
    を有することを特徴とする画像処理装置。
  2. 前記推定背景領域内の画素の隣接差分値に基づいて第1閾値を決定する閾値決定部と、
    前記第1閾値を用いて前記入力画像から第1エッジ画素を抽出する第1エッジ画素抽出部と、をさらに有し、
    前記原稿領域検出部は、前記第1エッジ画素又は前記第2エッジ画素から原稿領域を検出する、請求項1に記載の画像処理装置。
  3. 前記膨張画像生成部は、前記膨張係数に基づいて生成される膨張画像内の全画素数に対する、前記膨張画像から抽出される第2エッジ画素の数の比率が所定比率以下となるように、前記膨張係数を決定する、請求項2に記載の画像処理装置。
  4. 第2閾値を用いて前記入力画像から、前記入力画像内の画素の隣接差分値に基づいて、第3エッジ画素を抽出する第3エッジ画素抽出部をさらに有し、
    前記膨張画像生成部は、前記膨張係数に基づいて前記第3エッジ画素を膨張させることにより前記膨張画像を生成する、請求項2または3に記載の画像処理装置。
  5. 前記第2閾値は、前記第1閾値より低い値に設定される、請求項4に記載の画像処理装置。
  6. 前記第1エッジ画素から矩形を検出する矩形検出部をさらに有し、
    前記原稿領域検出部が前記原稿領域を検出するために、前記矩形検出部により矩形が検出された場合、前記第1エッジ画素を用いることを選択し、前記矩形検出部により矩形が検出されなかった場合、前記第2エッジ画素を用いることを選択する選択部をさらに有する、請求項2〜5の何れか一項に記載の画像処理装置。
  7. 前記原稿領域検出部が前記原稿領域を検出するために、前記第1閾値が所定値以上である場合、前記第2エッジ画素を選択し、前記第1閾値が前記所定値未満である場合、前記第1エッジ画素を選択する選択部をさらに有する、請求項2〜5の何れか一項に記載の画像処理装置。
  8. 前記入力画像には、前記入力画像を撮像した装置の一部が含まれ、
    前記推定背景領域抽出部は、前記入力画像に含まれる装置の一部から所定範囲内の領域を前記推定背景領域として抽出する、請求項1〜7の何れか一項に記載の画像処理装置。
  9. 前記推定背景領域抽出部は、前記入力画像の四隅に位置する四つの領域の内の二以上の所定数の領域が相互に類似するか否かを各領域内の画素値の正規化相互相関に基づいて判定し、相互に類似する場合、前記相互に類似する領域を前記推定背景領域として抽出する、請求項1〜7の何れか一項に記載の画像処理装置。
  10. 入力画像内の特定の位置にある領域を、背景が写っていると推定される推定背景領域として抽出し、
    前記推定背景領域内の全画素数に対する、前記推定背景領域内の画素の隣接差分値に基づいて抽出される膨張用エッジ画素数の比率が小さいほど大きくなり、前記比率が大きいほど小さくなるように膨張係数を決定し、前記決定した膨張係数に基づいて膨張画像を生成し、
    前記膨張画像から第2エッジ画素を抽出し、
    前記抽出された第2エッジ画素のうち連結する第2エッジ画素によって囲まれる矩形領域を原稿領域として検出する、
    ことを含むことを特徴とする領域検出方法。
  11. 入力画像内の特定の位置にある領域を、背景が写っていると推定される推定背景領域として抽出し、
    前記推定背景領域内の全画素数に対する、前記推定背景領域内の画素の隣接差分値に基づいて抽出される膨張用エッジ画素数の比率が小さいほど大きくなり、前記比率が大きいほど小さくなるように膨張係数を決定し、前記決定した膨張係数に基づいて膨張画像を生成し、
    前記膨張画像から第2エッジ画素を抽出し、
    前記抽出された第2エッジ画素のうち連結する第2エッジ画素によって囲まれる矩形領域を原稿領域として検出する、
    ことをコンピュータに実行させることを特徴とするコンピュータプログラム。
JP2015058637A 2015-03-20 2015-03-20 画像処理装置、領域検出方法及びコンピュータプログラム Active JP6099686B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015058637A JP6099686B2 (ja) 2015-03-20 2015-03-20 画像処理装置、領域検出方法及びコンピュータプログラム
US14/831,596 US9712717B2 (en) 2015-03-20 2015-08-20 Image processing apparatus, region detection method and computer-readable, non-transitory medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015058637A JP6099686B2 (ja) 2015-03-20 2015-03-20 画像処理装置、領域検出方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2016178552A JP2016178552A (ja) 2016-10-06
JP6099686B2 true JP6099686B2 (ja) 2017-03-22

Family

ID=56976473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015058637A Active JP6099686B2 (ja) 2015-03-20 2015-03-20 画像処理装置、領域検出方法及びコンピュータプログラム

Country Status (2)

Country Link
US (1) US9712717B2 (ja)
JP (1) JP6099686B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6164926B2 (ja) * 2013-05-16 2017-07-19 オリンパス株式会社 ノイズ低減処理装置
EP3433816A1 (en) * 2016-03-22 2019-01-30 URU, Inc. Apparatus, systems, and methods for integrating digital media content into other digital media content
CN108885802B (zh) * 2016-03-29 2023-07-04 索尼公司 信息处理装置、信息处理方法和存储介质
JP2018006818A (ja) * 2016-06-27 2018-01-11 キヤノン株式会社 画像読取方法及び画像読取装置
JP6317413B1 (ja) 2016-10-28 2018-04-25 株式会社Pfu 画像処理装置、画像処理方法及び画像処理プログラム
WO2018117057A1 (ja) * 2016-12-21 2018-06-28 京セラドキュメントソリューションズ株式会社 画像読取装置
CN107085850B (zh) * 2017-03-24 2019-10-01 大连成者科技有限公司 遮蔽采集图像中异物的标记体、识别图像中异物标记体的方法以及书籍扫描方法
JP2018198386A (ja) * 2017-05-24 2018-12-13 セイコーエプソン株式会社 読取装置および画像生成方法
US10033901B1 (en) * 2017-06-27 2018-07-24 Xerox Corporation System and method for using a mobile camera as a copier
JP6751859B2 (ja) * 2017-09-29 2020-09-09 パナソニックIpマネジメント株式会社 載置検出システム
JP7185477B2 (ja) * 2018-10-12 2022-12-07 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
US11244150B2 (en) * 2019-09-10 2022-02-08 Bharti Airtel Limited Facial liveness detection

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6781720B1 (en) * 1999-11-30 2004-08-24 Xerox Corporation Gradient-based trapping using patterned trap zones
JP2006092204A (ja) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 画像処理方法及び画像処理装置
KR100782812B1 (ko) 2005-06-15 2007-12-06 삼성전자주식회사 에지 적응적 컬러 보간 방법 및 장치
JP4574503B2 (ja) * 2005-09-09 2010-11-04 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP4611160B2 (ja) 2005-09-21 2011-01-12 株式会社Pfu 画像読取装置
JP4792926B2 (ja) * 2005-11-08 2011-10-12 ブラザー工業株式会社 画像読取装置
JP2008147712A (ja) * 2006-12-05 2008-06-26 Canon Inc 画像処理装置および画像処理方法
JP4653194B2 (ja) 2008-04-30 2011-03-16 キヤノン株式会社 画像処理装置、画像処理装置の制御方法、プログラム及びコンピュータ読取可能な記憶媒体
JP5538909B2 (ja) 2010-01-05 2014-07-02 キヤノン株式会社 検出装置およびその方法
JP5871571B2 (ja) 2011-11-11 2016-03-01 株式会社Pfu 画像処理装置、矩形検出方法及びコンピュータプログラム
JP5791475B2 (ja) * 2011-11-24 2015-10-07 キヤノン株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP6099457B2 (ja) 2013-03-28 2017-03-22 株式会社Pfu 画像処理装置、領域決定方法及びコンピュータプログラム

Also Published As

Publication number Publication date
US9712717B2 (en) 2017-07-18
JP2016178552A (ja) 2016-10-06
US20160286080A1 (en) 2016-09-29

Similar Documents

Publication Publication Date Title
JP6099686B2 (ja) 画像処理装置、領域検出方法及びコンピュータプログラム
JP6099457B2 (ja) 画像処理装置、領域決定方法及びコンピュータプログラム
JP6045625B2 (ja) 画像処理装置、領域検出方法及びコンピュータプログラム
JP5826081B2 (ja) 画像処理装置、文字認識方法及びコンピュータプログラム
RU2631765C1 (ru) Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот
US20090257658A1 (en) Image extracting apparatus, image extracting method and computer readable medium
JP5298831B2 (ja) 画像処理装置及びプログラム
JP7185477B2 (ja) 画像処理装置、制御方法及び制御プログラム
US10303969B2 (en) Pose detection using depth camera
JP6021665B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP4990876B2 (ja) 画像処理装置
WO2018061997A1 (ja) 媒体認識装置および媒体認識方法
JP6006675B2 (ja) マーカ検出装置、マーカ検出方法、及びプログラム
US10572751B2 (en) Conversion of mechanical markings on a hardcopy document into machine-encoded annotations
JP6317413B1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP5708305B2 (ja) 画像認識装置、画像認識方法及び画像認識用コンピュータプログラム
US9031324B2 (en) Image-processing device specifying encircling line for identifying sub-region of image
WO2016151706A1 (ja) 画像処理装置、領域決定方法及びコンピュータプログラム
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7440821B2 (ja) 画像処理装置、方法、および、コンピュータプログラム
JP2022066697A (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP6693184B2 (ja) 画像処理装置、および画像処理方法
US10832415B2 (en) Window image detection method and device
JP6157068B2 (ja) 情報処理装置及びその制御方法
JP7478628B2 (ja) 画像処理装置、制御方法及び制御プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170221

R150 Certificate of patent or registration of utility model

Ref document number: 6099686

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150