JP6345224B1 - 画像処理装置、矩形検出方法及びコンピュータプログラム - Google Patents

画像処理装置、矩形検出方法及びコンピュータプログラム Download PDF

Info

Publication number
JP6345224B1
JP6345224B1 JP2016245778A JP2016245778A JP6345224B1 JP 6345224 B1 JP6345224 B1 JP 6345224B1 JP 2016245778 A JP2016245778 A JP 2016245778A JP 2016245778 A JP2016245778 A JP 2016245778A JP 6345224 B1 JP6345224 B1 JP 6345224B1
Authority
JP
Japan
Prior art keywords
pixel
edge
image
edge pixel
input image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016245778A
Other languages
English (en)
Other versions
JP2018101852A (ja
Inventor
智晃 和田
智晃 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP2016245778A priority Critical patent/JP6345224B1/ja
Priority to US15/496,911 priority patent/US10230867B2/en
Application granted granted Critical
Publication of JP6345224B1 publication Critical patent/JP6345224B1/ja
Publication of JP2018101852A publication Critical patent/JP2018101852A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32203Spatial or amplitude domain methods
    • H04N1/32229Spatial or amplitude domain methods with selective or adaptive application of the additional information, e.g. in selected regions of the image
    • H04N1/3224Spatial or amplitude domain methods with selective or adaptive application of the additional information, e.g. in selected regions of the image in edge regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/403Edge-driven scaling; Edge-based scaling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • H04N1/10Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using flat picture-bearing surfaces
    • H04N1/107Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using flat picture-bearing surfaces with manual scanning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32609Fault detection or counter-measures, e.g. original mis-positioned, shortage of paper
    • H04N1/32646Counter-measures
    • H04N1/32683Preventive counter-measures, e.g. using redundant hardware, or anticipating a fault
    • H04N1/32689Involving the use of error correction codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Image Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】入力画像から矩形領域を精度良く検出することが可能な画像処理装置、矩形検出方法、コンピュータプログラムを提供する。【解決手段】画像処理装置200は、入力画像からエッジ画素を抽出するエッジ画素抽出部252と、入力画像の端部画素を抽出する端部画素抽出部253と、端部画素抽出部が抽出した端部画素から第1範囲内に位置する画素の画素値に基づいて、端部画素をエッジ画素として追加するエッジ画素追加部256と、エッジ画素抽出部が抽出したエッジ画素、及び、エッジ画素追加部がエッジ画素として追加した端部画素から、複数の直線を抽出する直線抽出部257と、抽出した複数の直線から矩形を検出する矩形検出部258と、を有する。【選択図】図2

Description

本発明は、画像処理装置、矩形検出方法及びコンピュータプログラムに関し、特に、入力画像から矩形を検出する画像処理装置、領域決定方法及びコンピュータプログラムに関する。
スキャナ装置等の画像処理装置で原稿を読み取って画像データとして保存するためには、読み取った画像から原稿領域を正確に検出する必要がある。一般に、フラットベッドタイプのスキャナ装置では、白色又は黒色等の単調色の裏当てを用いることにより原稿領域とそれ以外の領域を識別する。しかしながら、例えば冊子状に綴じられた原稿、ステープルで綴じられた原稿又はADF(Auto Document Feeder)では流せない大量の原稿の読取操作が行われる場合、利用者は、作業時間を短縮させるために、スキャナ装置のカバーを開けたまま原稿の読取操作を行う可能性がある。カバーを開けた状態で原稿の読取操作が行われると、裏当てが用いられず、その結果、読み取った画像データ内の原稿が写っていない領域に照明等が写り込み、原稿領域を正しく検出できない可能性がある。そのため、近年、原稿領域が誤って検出されることを防止する技術が開発されている。
入力画像から矩形を検出する情報処理装置が開示されている。この情報処理装置は、入力画像からエッジ画素を抽出し、抽出したエッジ画素から複数の直線を抽出し、各直線から構成される複数の矩形候補を抽出する。情報処理装置は、各矩形候補の各辺から所定距離内にあるエッジ画素の数、及び、各矩形候補の各角の角らしさの度合いに基づいて各矩形候補から矩形を選択する(特許文献1を参照)。
また、読取画像内の原稿領域を決定するスキャナ装置が開示されている。このスキャナ装置は、読取画像上において、読取画像の端辺の位置と押え部材の端辺の位置との間の端部領域内に、複数のエッジ画素が連続して並ぶエッジ線が有るかどうかを判断する。スキャナ装置は、端部領域内にエッジ線が有ると判断された場合、そのエッジ線を、原稿画像自体の領域である原稿領域の一辺として決定する。一方、スキャナ装置は、端部領域内にエッジ線が無いと判断された場合、押え部材の端辺の位置、または、その端辺の位置よりも読取画像の中央側の位置にあるエッジ線を、原稿領域の一辺として決定する(特許文献2を参照)。
また、フレアが発生している、原稿を読み取った画像データから、原稿領域のエッジを検出する画像処理装置が開示されている。この画像処理装置は、原稿領域を含む画像データから、原稿領域の境界線を構成するエッジ点の候補を二つの方式により検出し、原稿領域の内側に位置する候補をエッジ点と決定する(特許文献3を参照)。
また、読取画像内の原稿領域を決定するスキャナ装置が開示されている。このスキャナ装置は、読取画像から複数のエッジ画素が、プラテンガラスと台枠との境界線との角度差が所定値以上の方向に並ぶエッジ線を検出する。スキャナ装置は、境界線上に、エッジ線の端点が有る場合、そのエッジ線の端点を原稿領域の一辺上の点として決定し、境界線上にエッジ線の端点が無い場合、境界線に最も近いエッジ線の端点を原稿領域の一辺上の点として決定する(特許文献4を参照)。
特開2013−106160号公報 特開2013−179410号公報 特開2013−58937号公報 特開2013−179409号公報
フラットベッドタイプのスキャナ装置等の画像処理装置では、読み取った入力画像から原稿の画像を切出すべき矩形領域をより精度良く検出することを求められている。
本発明の目的は、入力画像から矩形領域を精度良く検出することが可能な画像処理装置、矩形検出方法及びそのような矩形検出方法をコンピュータに実行させるコンピュータプログラムを提供することにある。
本実施形態の一側面に係る画像処理装置は、入力画像からエッジ画素を抽出するエッジ画素抽出部と、入力画像の端部画素を抽出する端部画素抽出部と、端部画素抽出部が抽出した端部画素から第1範囲内に位置する画素の画素値に基づいて、端部画素をエッジ画素として追加するエッジ画素追加部と、エッジ画素抽出部が抽出したエッジ画素、及び、エッジ画素追加部がエッジ画素として追加した端部画素から、複数の直線を抽出する直線抽出部と、抽出した複数の直線から矩形を検出する矩形検出部と、を有する。
また、本実施形態の一側面に係る矩形検出方法は、画像処理装置による矩形検出方法であって、画像処理装置が、入力画像からエッジ画素を抽出し、入力画像の端部画素を抽出し、抽出した端部画素から第1範囲内に位置する画素の画素値に基づいて、端部画素をエッジ画素として追加し、抽出したエッジ画素、及び、エッジ画素として追加した端部画素から、複数の直線を抽出し、抽出した複数の直線から矩形を検出することを含む。
また、本実施形態の一側面に係るコンピュータプログラムは、入力画像からエッジ画素を抽出し、入力画像の端部画素を抽出し、抽出した端部画素から第1範囲内に位置する画素の画素値に基づいて、端部画素をエッジ画素として追加し、抽出したエッジ画素、及び、エッジ画素として追加した端部画素から、複数の直線を抽出し、抽出した複数の直線から矩形を検出する、ことをコンピュータに実行させる。
本発明によれば、入力画像から矩形領域を精度良く検出することが可能な画像処理装置、矩形検出方法及びそのような矩形検出方法をコンピュータに実行させるコンピュータプログラムを提供することができる。
実施形態に従った画像処理システム1を示す図である。 カバー120が開いた状態の画像読取装置100の斜視図である。 カバー120を閉じた状態の画像読取装置100の断面図である。 画像処理システム1の概略構成を示す図である。 第2記憶装置233及び処理装置250の概略構成を示す図である。 画像読取処理の動作を示すフローチャートである。 矩形検出処理の動作を示すフローチャートである。 近似直線について説明するための模式図である。 近似直線について説明するための模式図である。 矩形候補の各角の評価点について説明するための模式図である エッジ画素削除処理の動作の例を示すフローチャートである。 エッジ画素削除処理について説明するための模式図である。 エッジ画素追加処理の動作の例を示すフローチャートである。 第3範囲について説明するための模式図である。 エッジ画素追加処理について説明するための模式図である。 ガラス板111を上側から見た模式図である 入力画像1500を示す模式図である。 ガラス板111を上側から見た模式図である 入力画像1600を示す模式図である。 ガラス板111を上側から見た模式図である 入力画像1700を示す模式図である。 ガラス板111を上側から見た模式図である 入力画像1800を示す模式図である。 入力画像1900を示す模式図である。 縁部検出処理の動作の例を示すフローチャートである。 第2エッジ画素削除処理の動作の例を示すフローチャートである。 処理装置260の概略構成を示すブロック図である。 他の画像処理システム2の概略構成を示す図である。
以下、本発明に係る画像処理装置、領域決定方法及びコンピュータプログラムについて図を参照しつつ説明する。但し、本発明の技術的範囲はそれらの実施の形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶ点に留意されたい。
図1は、実施形態に従った画像処理システムを示す図である。図1に示すように、画像処理システム1は、画像読取装置100と、情報処理装置200とを有する。図1において画像読取装置100は、斜視図で描かれている。
画像読取装置100は、例えばフラットベッドタイプのスキャナ装置等である。画像読取装置100は、筐体110及びカバー120等を有し、情報処理装置200に接続されている。情報処理装置200は、画像処理装置の一例であり、例えばパーソナルコンピュータ等である。
図2は、カバー120が開いた状態の画像読取装置100の斜視図である。
筐体110は、ガラス板111、突き当て部材112、第1入力装置116及び第1表示装置117等を有する。
ガラス板111は、読取対象である原稿を載置する部材であり、筐体110の上面に設けられる。
突き当て部材112は、原稿が矩形である場合に原稿の四辺の内の二辺(短辺及び長辺)を突き当てて、原稿の位置決めをするための部材であり、筐体110の上面に、ガラス板111と接するように設けられる。突き当て部材112は、原稿の短辺を突き当てるための第1縁部113と、原稿の長辺を突き当てるための第2縁部114とを有する。第1縁部113は画像読取装置100の主走査方向に延伸し、第2縁部114は画像読取装置100の副走査方向に延伸し、第1縁部113と第2縁部114は、角部115で直交するように接する。
第1入力装置116は、筐体110の表面に配置された操作ボタンであり、押下されると、ユーザの操作に応じた操作検出信号を生成して出力する。
第1表示装置117は、筐体110の表面に配置されたLED(Light Emitting Diode)であり、画像読取装置100の状態に応じた色で点灯又は消灯する。
カバー120は、裏当て部材121を有する。カバー120は、筐体110に対して開閉可能に設けられ、開いた状態では筐体110の上面に原稿を載置可能となり、閉じた状態では裏当て部材121がガラス板111の下部(筐体110内)に設けられた撮像ユニットと対向する。
裏当て部材121は、カバー120の下面に、カバー120に対して着脱可能に設けられる。画像読取装置100が原稿を読み取った画像において原稿領域とそれ以外の領域を識別できるように、原稿の背景色と識別可能な色(白色、黒色等)を有する裏当て部材121がユーザにより設置される。
図3は、カバー120を閉じた状態の画像読取装置100の、図1におけるA−A’線断面図である。
図3に示すように、筐体110は、撮像ユニット118を有する。撮像ユニット118は、ガラス板111をはさんで、閉じた状態のカバー120及びカバー120に装着された裏当て部材121と対向する位置に設けられる。撮像ユニット118は、ガラス板111と平行であり且つ図3の矢印A1の方向と直交する方向(主走査方向)において、ガラス板111の一端から他端まで撮像できるように延伸している。また、撮像ユニット118は、図3の矢印A1の方向(副走査方向)に沿って、ガラス板111の一端から他端まで撮像できるように移動可能に設けられる。
撮像ユニット118は、撮像装置118a、照明装置118b及びミラー118c等を有する。
撮像装置118aは画像読取部の一例である。撮像装置118aは、主走査方向に直線状に配列されたCCD(Charge Coupled Device)による撮像素子を備える縮小光学系タイプの撮像センサを有する。この撮像センサは、ガラス板111に載置された原稿Dを撮像し、RGB各色に対応するアナログの画像信号を生成して出力する。なお、CCDの代わりにCMOS(Complementary Metal Oxide Semiconductor)による撮像素子を備える等倍光学系タイプのCIS(Contact Image Sensor)を利用することもできる。
照明装置118bは、原稿を照らす光源を有し、ガラス板111と対向する位置に設けられる。照明装置118bから放射された光は、ガラス板111に載置された原稿Dで反射し、ミラー118cを介して、撮像装置118aの撮像素子に結像する。
図4は、画像処理システム1の概略構成を示す図である。
画像読取装置100は、前述した構成に加えて、AFE(Analog Front End)130と、第1画像メモリ131と、第1インタフェース装置132と、第1記憶装置133と、第1CPU(Control Processing Unit)134とを有する。
AFE130は、撮像装置118aから出力された各アナログ値をデジタル値に変換して画素データを生成し、生成した各画素データから構成される画像データ(以下、RGB画像と称する)を生成する。このRGB画像は、各画素データが、例えばRGB各色毎に8bitで表される計24bitのRGB値からなるカラー画像データとなる。AFE130は、RGB画像又はRGB画像の各画素のRGB値を輝度値及び色差値(YUV値)に変換した輝度画像を生成し、入力画像として第1画像メモリ131に保存する。YUV値は、例えば以下の式により算出することができる。
Y値= 0.30×R値+0.59×G値+0.11×B値 (1)
U値=−0.17×R値−0.33×G値+0.50×B値 (2)
V値= 0.50×R値−0.42×G値−0.08×B値 (3)
第1画像メモリ131は、不揮発性半導体メモリ、揮発性半導体メモリ、磁気ディスク等の記憶装置を有する。第1画像メモリ131は、AFE130により生成された入力画像を保存する。
第1インタフェース装置132は、USB(Universal Serial Bus)等のシリアルバスに準じるインタフェース回路を有し、情報処理装置200と電気的に接続して画像データ及び各種の情報を送受信する。また、第1インタフェース装置132の代わりに、無線信号を送受信するアンテナと、所定の通信プロトコルに従って、無線通信回線を通じて信号の送受信を行うための無線通信インタフェース回路とを有する通信装置が用いられてもよい。所定の通信プロトコルは、例えば無線LAN(Local Area Network)である。
第1記憶装置133は、RAM(Random Access Memory)、ROM(Read Only Memory)等のメモリ装置、ハードディスク等の固定ディスク装置、又はフレキシブルディスク、光ディスク等の可搬用の記憶装置等を有する。また、第1記憶装置133には、画像読取装置100の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、コンピュータ読み取り可能な可搬型記録媒体から公知のセットアッププログラム等を用いて第1記憶装置133にインストールされてもよい。可搬型記録媒体は、例えばCD−ROM(compact disk read only memory)、DVD−ROM(digital versatile disk read only memory)等である。
第1CPU134は、予め第1記憶装置133に記憶されているプログラムに基づいて動作する。なお、第1CPU134に代えて、DSP(digital signal processor)、LSI(large scale integration)等が用いられてよい。また、第1CPU134に代えて、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programming Gate Array)等が用いられてもよい。
第1CPU134は、第1入力装置116、第1表示装置117、撮像装置118a、AFE130、第1画像メモリ131、インタフェース装置132及び第1記憶装置133等と接続され、これらの各部を制御する。第1CPU134は、撮像装置118aの原稿読取制御、第1インタフェース装置132を介した情報処理装置200とのデータ送受信制御等を行う。
情報処理装置200は、第2入力装置216と、第2表示装置217と、第2画像メモリ231と、第2インタフェース装置232と、第2記憶装置233と、第2CPU234と、処理装置250とを有する。以下、情報処理装置200の各部について詳細に説明する。
第2入力装置216は、キーボード、マウス等の入力装置及び入力装置から信号を取得するインタフェース回路を有し、利用者の操作に応じた信号を第2CPU234に出力する。
第2表示装置217は、液晶、有機EL等から構成されるディスプレイ及びディスプレイに画像データを出力するインタフェース回路を有し、第2画像メモリ231と接続されて第2画像メモリ231に保存されている画像データをディスプレイに表示する。
第2画像メモリ231は、画像読取装置100の第1画像メモリ131と同様の記憶装置を有する。第2画像メモリ231には、第2インタフェース装置232を介して画像読取装置100から受信した入力画像を保存するとともに、処理装置250と接続され、処理装置250により入力画像に対して画像処理がなされた各種の処理画像を保存する。
第2インタフェース装置232は、画像読取装置100の第1インタフェース装置132と同様のインタフェース回路を有し、情報処理装置200と画像読取装置100とを接続する。また、第2インタフェース装置132の代わりに、無線信号を送受信するアンテナと、無線LAN等の所定の通信プロトコルに従って、無線通信回線を通じて信号の送受信を行うための無線通信インタフェース回路とを有する通信装置が用いられてもよい。
第2記憶装置233は、画像読取装置100の第1記憶装置133と同様のメモリ装置、固定ディスク装置、可搬用の記憶装置等を有する。第2記憶装置233には、情報処理装置200の各種処理に用いられるコンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、例えばCD−ROM、DVD−ROM等のコンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラム等を用いて第2記憶装置233にインストールされてもよい。
また、第2記憶装置233は、入力画像を撮像する画像読取装置100の原稿読取位置の誤差の許容範囲を記憶する。第2記憶装置233は、画像読取装置100の原稿読取位置の誤差の許容範囲として、個々の装置毎に発生する誤差の許容範囲と、原稿読取処理毎に発生する誤差の許容範囲とを記憶する。
第2記憶装置233は、個々の装置毎に発生する誤差の許容範囲として、画像読取装置100において規定された画像読取に係るオフセット誤差の値(例えば2〜3mm)を記憶する。オフセット誤差とは、画像読取装置100の各部品における製造公差の総和であり、画像読取に係るオフセット誤差とは、撮像装置118a、照明装置118b、ミラー118c、突き当て部材112等の画像読取に係る各部品の製造公差の総和である。製造公差とは、各部品の配置位置、方向等に係る理想的な設計値に対する、ばらつき又は誤差等による、製造後の実際の値の精度を表し、仮に画像読取装置100において製造後の実際の値が理論値からずれていても正常であるとみなされる範囲に定められる。
画像読取装置100では、入力画像の端部に、突き当て部材112の第1縁部113及び第2縁部114と接しているガラス板111上の位置が写り、入力画像には第1縁部113及び第2縁部114が写り込まないように設計されている。しかしながら、入力画像内の端部からオフセット誤差に相当する距離までには、第1縁部113又は第2縁部114が写り込む可能性がある。逆に、原稿の端部が第1縁部113及び第2縁部114と接していても、原稿の端部からオフセット誤差に相当する距離までは入力画像に写らない可能性がある。
また、第2記憶装置233は、原稿読取処理毎に発生する誤差の許容範囲として、画像読取装置100において規定された副走査倍率を記憶する。副走査倍率とは、主に副走査方向に撮像ユニット118が移動する速度のばらつきに起因して伸縮する画像の許容倍率(例えば±1%)である。また、第2記憶装置233は、原稿読取処理毎に発生する誤差の許容範囲として、画像読取装置100に発生し得る振動の大きさ等の使用環境条件を記憶する。
第2CPU234は、予め第2記憶装置233に記憶されているプログラムに基づいて動作する。なお、第2CPU234に代えて、DSP、LSI、ASIC、FPGA等が用いられてもよい。
第2CPU234は、第2入力装置216、第2表示装置217、第2画像メモリ231、第2インタフェース装置232、第2記憶装置233及び処理装置250等と接続され、これらの各部を制御する。第2CPU234は、第2インタフェース装置232を介した画像読取装置100とのデータ送受信制御、第2入力装置216の入力制御、第2表示装置217の表示制御、処理装置250による画像処理の制御等を行う。
第2CPU234は、予め第2記憶装置233に記憶されているプログラムに基づいて動作する。なお、第2CPU234に代えて、DSP、LSI、ASIC、FPGA等が用いられてもよい。
処理装置250は、第2画像メモリ231に接続され、矩形検出処理を行う。処理装置250は、第2CPU234に接続され、第2CPU234からの制御により予め第2記憶装置233に記憶されているプログラムに基づいて動作する。処理装置250は、CPU、DSP、LSI、ASIC又はFPGA等で構成される。なお、処理装置250は、独立した集積回路、マイクロプロセッサ、ファームウェア等で構成されてもよい。
図5は、第2記憶装置233及び処理装置250の概略構成を示す図である。
図5に示すように第2記憶装置233には、画像入力プログラム241、エッジ画素抽出プログラム242、端部画素抽出プログラム243、第1削除プログラム244、第2削除プログラム245、エッジ画素追加プログラム246、直線抽出プログラム247、矩形検出プログラム248及び切出しプログラム249等の各プログラムが記憶される。これらの各プログラムは、プロセッサ上で動作するソフトウェアにより実装される機能モジュールである。処理装置250は、第2記憶装置233に記憶された各プログラムを読み取り、読み取った各プログラムに従って動作する。これにより、処理装置250は、画像入力部251、エッジ画素抽出部252、端部画素抽出部253、第1削除部254、第2削除部255、エッジ画素追加部256、直線抽出部257、矩形検出部258及び切出し部259として機能する。
図6は、画像読取装置100による画像読取処理の動作を示すフローチャートである。以下、図6に示したフローチャートを参照しつつ、画像読取処理の動作を説明する。なお、以下に説明する動作のフローは、予め第1記憶装置133に記憶されているプログラムに基づき主に第1CPU134により画像読取装置100の各要素と協働して実行される。
最初に、撮像装置118aは、撮像対象物である原稿を撮像し、AFE130は、撮像装置118aから出力された各アナログ値をデジタル値に変換して入力画像を生成し、第1画像メモリ131に保存する(ステップS101)。
次に、第1CPU134は、第1画像メモリ131に保存された入力画像を第1インタフェース装置132を介して情報処理装置200に送信し(ステップS102)、一連のステップを終了する。
図7は、情報処理装置200による矩形検出処理の動作を示すフローチャートである。以下、図7に示したフローチャートを参照しつつ、矩形検出処理の動作を説明する。なお、以下に説明する動作のフローは、予め第2記憶装置233に記憶されているプログラムに基づき主に処理装置250により情報処理装置200の各要素と協同して実行される。
最初に、画像入力部251は、入力画像を第2インタフェース装置232を介して画像読取装置100から取得し、第2画像メモリ231に保存する(ステップS201)。
なお、画像入力部251は、取得した入力画像に対して、水平方向及び垂直方向に画素を間引く間引き処理を実行してから、第2画像メモリ231に保存する。一般に、情報処理装置200は処理する画像の画素数により処理速度が大きく異なるため、画素を間引く割合は、処理装置250等の処理能力と情報処理装置200に要求される処理速度に応じて定められる。なお、画素を間引かなくても要求される処理速度を満たす場合は間引き処理を省略してもよい。また、画素の間引き率は、入力画像に含まれるランダムノイズが除去されるが、原稿内の網掛け部分、文字等は除去されないように定められてもよい。
次に、エッジ画素抽出部252は、入力画像から水平方向、垂直方向のそれぞれについてエッジ画素を抽出する。エッジ画素抽出部252は、入力画像の水平方向、垂直方向のそれぞれについてエッジ画素からなるエッジ画像を生成し、第2画像メモリ231に保存する(ステップS202)。
エッジ画素抽出部252は、入力画像内の画素の水平方向の両隣の画素の輝度値の差の絶対値(以下、隣接差分値と称する)を算出し、隣接差分値が閾値Th1を越える場合、その画像上の画素を垂直エッジ画素として抽出する。この閾値Th1は、例えば、人が画像上の輝度の違いを目視により判別可能な輝度値の差(例えば20)に設定することができる。エッジ画素抽出部252は、入力画像について垂直方向にも同様の処理を行い、水平エッジ画素を抽出する。そして、エッジ画素抽出部252は、水平方向、垂直方向のそれぞれについてエッジ画像を生成する。
なお、エッジ画素抽出部252は、入力画像内の画素の水平又は垂直方向の所定距離だけ離れた画素の輝度値の差の絶対値を隣接差分値として算出してもよい。また、エッジ画素抽出部252は、各画素の輝度値に代えて、各画素の色値(R値、G値又はB値)を用いて隣接差分値を算出してもよい。また、エッジ画素抽出部252は、入力画像の輝度値又は色値を閾値と比較することによりエッジ画素を抽出してもよい。例えば、エッジ画素抽出部252は、特定の画素の輝度値又は色値が閾値未満であり、その特定の画素に隣接する画素又はその特定の画素から所定距離だけ離れた画素の輝度値又は色値が閾値以上である場合、その特定の画素をエッジ画素とする。
次に、端部画素抽出部253は、入力画像の端部画素を抽出し、第2画像メモリ231に保存する(ステップS203)。端部画素抽出部253は、入力画像内の垂直方向において第1縁部113側の端部に位置する画素、及び、水平方向において第2縁部114側の端部に位置する画素を端部画素として抽出する。なお、ステップS203の処理は、ステップS202の処理より前に実行されてもよい。
次に、第1削除部254は、エッジ画素削除処理を実行する(ステップS204)。第1削除部254は、エッジ画素削除処理において、エッジ画素抽出部252が抽出したエッジ画素の内、端部画素から第2範囲内に位置し、且つ、端部画素に最も近い位置にあるエッジ画素を削除する。エッジ画素削除処理の詳細については後述する。
次に、エッジ画素追加部256は、エッジ画素追加処理を実行する(ステップS205)。エッジ画素追加部256は、エッジ画素追加処理において、端部画素抽出部253が抽出した端部画素から第1範囲内に位置する画素の画素値に基づいて、端部画素をエッジ画素として追加する。エッジ画素追加処理の詳細については後述する。
なお、ステップS204の処理又はステップS205の処理の内の何れか一方は省略されてもよい。また、ステップS205の処理は、ステップS204の処理より前に実行されてもよい。
次に、直線抽出部257は、エッジ画素抽出部252が抽出したエッジ画素の内、第1削除部254が削除していないエッジ画素、及び、エッジ画素追加部256がエッジ画素として追加した端部画素から、複数の直線を抽出する(ステップS206)。直線抽出部257は、水平エッジ画像及び垂直エッジ画像のそれぞれから直線を抽出する。直線抽出部257は、ハフ変換を用いて直線を検出する。なお、直線抽出部257は、最小二乗法を用いて直線を検出してもよい。または、直線抽出部257は、ハフ変換を用いて検出した直線から所定距離内にあるエッジ画素に対して最小二乗法を用いて直線を検出してもよい。この所定距離は、画像処理システム1が使用される環境等に応じて適宜定められ、例えば2mmに相当する距離に設定される。
また、直線抽出部257は、近似直線を直線として抽出してもよい。
図8A及び図8Bは、近似直線について説明するための模式図である。図8Aに示すような書籍原稿を撮影した入力画像800において、書籍原稿の綴じ目部801に対して平行な端部802は直線として抽出される。しかしながら、綴じ目部801に対して直交する端部803は綴じ目部801の近傍で歪みが生じ、直線として抽出されない場合がある。
そこで、直線抽出部257は、図8Bのエッジ画像810に示すように、相互に隣接するエッジ画素811をラベリングにより一つのグループ812としてまとめる。直線抽出部257は、そのグループ812に含まれるエッジ画素のうち、水平方向又は垂直方向における両端に位置するエッジ画素813及びエッジ画素814を結んだ直線815を近似直線として検出する。
次に、矩形検出部258は、直線抽出部257が抽出した複数の直線から矩形を検出する(ステップS207)、一連のステップを終了する。
矩形検出部258は、直線抽出部257が検出した複数の直線のうち二本ずつが略直交する四本の直線から構成される複数の矩形候補を抽出する。矩形検出部258は、まず水平方向の直線(以下、第1の水平線と称する)を一つ選択し、選択した直線と略平行(例えば±3°以内)かつ閾値Th2以上離れた水平方向の直線(以下、第2の水平線と称する)を抽出する。次に、矩形検出部258は、第1の水平線と略直交する(例えば90°に対して±3°以内)垂直方向の直線(以下、第1の垂直線と称する)を抽出する。次に、矩形検出部258は、第1の水平線と略直交し、かつ第1の垂直線と閾値Th3以上離れた垂直方向の直線(以下、第2の垂直線と称する)を抽出する。なお、閾値Th2及び閾値Th3は、画像読取装置100の読取りの対象となる原稿のサイズに応じて予め定められ、同じ値としてもよい。
矩形検出部258は、直線抽出部257が抽出した全ての直線について、上記の条件を満たす第1の水平線、第2の水平線、第1の垂直線及び第2の垂直線の全ての組合せを抽出し、抽出した各組合せから構成される矩形を矩形候補として抽出する。矩形検出部258は、抽出した矩形候補について面積を算出し、面積が所定値未満である矩形候補を除去する。矩形検出部258は、残った矩形候補の中で最も面積が大きい矩形候補を矩形として検出する。一方、矩形検出部258は、矩形候補が一つも残らなかった場合、矩形を検出しない。
なお、矩形検出部258は、各矩形候補について、矩形候補の各辺から所定距離(例えば2mmに相当する距離)内にある全ての画素の数に対する所定距離内にあるエッジ画素の数の割合を算出し、矩形候補の面積にその割合を乗じて重み付けしてもよい。これにより、原稿の境界を明確に表している直線から構成される矩形を検出することができる。または、矩形検出部258は、各矩形候補について、矩形候補の各角の角らしさの度合いを表す評価点を算出し、評価点を用いて矩形候補の面積を重み付けしてもよい。
図9は、矩形候補の各角の評価点について説明するための模式図である。図9に示す画像900において、点901は矩形候補の角を表し、直線902、903は矩形候補の各辺を表す。この直線902、903の端部が相互に接している場合は、点901は矩形の角らしいと考えられるが、直線902、903の端部が接していない場合又は直線902、903が交差している場合は、点901は矩形の角らしくないと考えられる。
評価点は0点を基準とする。矩形検出部258は、角901の近傍における辺902から所定距離内の領域904において、水平方向のライン毎にエッジ画素が存在するか否かを判定し、水平方向のラインにエッジ画素が存在する場合、評価点に1点を加算する。なお、各角の近傍の範囲及び各辺からの所定距離は、画像処理システム1が使用される環境等に応じて適宜定められ、例えば各角から5mmに相当する距離内の範囲及び各辺から2mmに相当する距離に設定することができる。同様に、矩形検出部258は、角901の近傍における辺903から所定距離内の領域905において、垂直方向のライン毎にエッジ画素が存在するか否かを判定し、垂直方向のラインにエッジ画素が存在する場合、評価点に1点を加算する。
また、矩形検出部258は、角901の近傍における辺902の延長線から所定距離内の領域906において、水平方向のライン毎にエッジ画素が存在するか否かを判定し、水平方向のラインにエッジ画素が存在する場合、評価点から1点を減算する。同様に、矩形検出部258は、角901の近傍における辺903の延長線から所定距離内の領域907において、垂直方向のライン毎にエッジ画素が存在するか否かを判定し、垂直方向のラインにエッジ画素が存在する場合、評価点から1点を減算する。矩形検出部258は、評価点の取り得る最低値が0、取り得る最高値が1となるように評価点を正規化した値を算出し、矩形候補の面積にその値を乗じて重み付けすることにより、四つの角を明確に表している矩形を検出することができる。
次に、切出し部259は、矩形検出部258が検出した矩形を原稿領域として入力画像から切出す(ステップS208)。
次に、切出し部259は、切出した画像を第2画像メモリ231又は第2記憶装置233に記憶し(ステップS209)、一連のステップを終了する。第2画像メモリ231又は第2記憶装置233に記憶された画像は、第2入力装置216を用いた利用者からの要求に従って、第2表示装置217に表示される。
図10は、エッジ画素削除処理の動作の例を示すフローチャートである。図10に示す動作のフローは、図7に示すフローチャートのステップS204において実行される。図10のステップS301〜S303の処理は、端部画素毎に実行される。
最初に、第1削除部254は、端部画素から第2範囲内にエッジ画素が存在するか否かを判定する(ステップS301)。第1削除部254は、入力画像内の水平方向の端部に対応する端部画素については、端部画素から入力画像の内側に向かって水平方向に第2範囲内にエッジ画素が存在するか否かを判定する。一方、第1削除部254は、入力画像内の垂直方向の端部に対応する端部画素については、端部画素から入力画像の内側に向かって垂直方向に第2範囲内にエッジ画素が存在するか否かを判定する。
第2範囲は、入力画像において、第1縁部113又は第2縁部114が写り込む可能性がある範囲に設定される。第2範囲は、画像読取装置100の原稿読取位置の誤差の許容範囲に基づいて定められる。例えば、第2範囲は、個々の装置毎に発生する誤差の許容範囲、特にオフセット誤差の値に基づいて定められる。その場合、第2範囲の下限値は0に設定され、上限値はオフセット誤差の値に相当する入力画像上の距離に設定される。また、第2範囲は、原稿読取処理毎に発生する誤差の許容範囲、特に副走査倍率又は使用環境条件に基づいて定められてもよい。その場合、第2範囲の下限値は0に設定され、上限値は副走査倍率、又は、画像読取装置100に発生し得る振動の大きさに相当する入力画像上の距離(例えば±1画素)に設定される。また、第2範囲は、個々の装置毎に発生する誤差の許容範囲、及び、原稿読取処理毎に発生する誤差の許容範囲の両方に基づいて設定されてもよい。
端部画素から第2範囲内にエッジ画素が存在する場合、第1削除部254は、その端部画素に最も近い位置にあるエッジ画素を、第1縁部113又は第2縁部114に対応するエッジ画素とみなして削除する(ステップS302)。第1削除部254は、エッジ画素抽出部252が生成したエッジ画像からそのエッジ画素を削除する。一方、端部画素から第2範囲内にエッジ画素が存在しない場合、第1削除部254は、特に処理を実行しない。
次に、第1削除部254は、全ての端部画素、即ち入力画像内の水平方向、垂直方向の各端部に位置する画素について、処理が完了したか否かを判定する(ステップS303)。第1削除部254は、まだ処理が完了していない端部画素がある場合、処理をステップS301に戻し、ステップS301〜S303の処理を繰り返す。一方、第1削除部254は、全ての端部画素について処理が完了した場合、一連のステップを終了する。
図11は、エッジ画素削除処理について説明するための模式図である。
図11は、入力画像1100の左端領域を表す。第1削除部254は、入力画像1100の左端において抽出された各端部画素1101、1102毎に、エッジ画素削除処理を実行する。図11において、第2範囲R2は、画像読取装置100の原稿読取位置の誤差の許容範囲に設定されている。端部画素1101について、水平方向において端部画素1101に最も近いエッジ画素1111は、端部画素1101から第2範囲R2内に含まれていないため、削除されない。一方、端部画素1102について、水平方向において端部画素1102から第2範囲R2内に三つのエッジ画素1112、1113、1114が抽出されているため、端部画素1102に最も近いエッジ画素1112が削除される。
図12は、エッジ画素追加処理の動作の例を示すフローチャートである。図12に示す動作のフローは、図7に示すフローチャートのステップS205において実行される。
最初に、エッジ画素追加部256は、入力画像において第3範囲内に位置する画素の画素値の平均値を算出する(ステップS401)。なお、入力画像として輝度画像が用いられる場合、各画素の輝度値が画素値として使用され、入力画像としてRGB画像が用いられる場合、各画素の色値が画素値として使用される。
第3範囲は、入力画像内で原稿が写っておらず、裏当て部材121が写っている領域に定められる。第3範囲は、画像読取装置100がサポートする最大サイズの原稿の二辺が突き当て部材112の第1縁部113及び第2縁部114に接し、その二辺による角が角部115に突き当てられている状態で、原稿が写らない領域の内の一部又は全部に定められる。入力画像において第3範囲内に位置する画素は、所定の画素の一例である。
図13は、第3範囲について説明するための模式図である。
図13は、入力画像1300を表す。入力画像1300は、画像読取装置100がサポートする最大サイズの原稿Mの二辺M1及びM2が、それぞれ第1縁部113及び第2縁部114に接し、二辺M1及びM2による角M3が角部115に突き当てられている状態で撮像されている。第3範囲R3は、入力画像1300において原稿Mが写らない領域の内の一部に定められる。
即ち、第3範囲R3は、入力画像1300において第1縁部113の反対側に位置する端部E1から距離L1内の領域又は第2縁部114の反対側に位置する端部E2から距離L2内の領域に定められる。距離L1は、撮像装置118aの副走査方向の読取範囲の長さから画像読取装置100がサポートする最大サイズの原稿Mの一辺(長辺)の長さを減算した値に定められる。距離L2は、撮像装置118aの主走査方向の読取範囲の長さから画像読取装置100がサポートする最大サイズの原稿Mの一辺(短辺)の長さを減算した値に定められる。
次に、エッジ画素追加部256は、入力画像において原稿の背景が写っている(裏当て部材121が写っていない)画素の画素値の範囲を決定する(ステップS402)。原稿の背景が写っている画素の画素値の範囲は、入力画像の所定の画素の画素値に基づいて決定された範囲の一例である。
例えば、エッジ画素追加部256は、第3範囲内に位置する画素の画素値の平均値が、入力画像内の画素が取り得る画素値の範囲の中央値以上である場合、その範囲の最小値以上且つ中央値未満の範囲を、原稿の背景が写っている画素の画素値の範囲とする。一方、エッジ画素追加部256は、第3範囲内に位置する画素の画素値の平均値が、入力画像内の画素が取り得る画素値の範囲の中央値未満である場合、その範囲の中央値以上且つ最大値以下の範囲を、原稿の背景が写っている画素の画素値の範囲とする。
例えば、入力画像として輝度画像が用いられ、輝度値の範囲が0〜255である場合、最小値が0となり、中央値が128となり、最大値が255となる。上記したように、画像読取装置100では、原稿の背景色と識別可能な色(白色、黒色等)を有する裏当て部材121がユーザにより設置される。裏当て部材121が白色である場合、第3範囲内の画素の画素値の平均値は128以上となり、原稿の背景が写っている画素の画素値の範囲は、0以上且つ128未満の範囲に決定される。一方、裏当て部材121が黒色である場合、第3範囲内の画素の画素値の平均値は128未満となり、原稿の背景が写っている画素の画素値の範囲は、128以上且つ255以下の範囲に決定される。
ステップS403〜S406の処理は、端部画素毎に実行される。
次に、エッジ画素追加部256は、入力画像において端部画素から第1範囲内に位置する画素の画素値の平均値を算出する(ステップS403)。入力画像として輝度画像が用いられる場合、各画素の輝度値が画素値として使用され、入力画像としてRGB画像が用いられる場合、各画素の色値が画素値として使用される。エッジ画素追加部256は、入力画像内の水平方向の端部に対応する端部画素については、端部画素から入力画像の内側に向かって水平方向に第1範囲内に位置する画素の画素値の平均値を算出する。一方、エッジ画素追加部256は、入力画像内の垂直方向の端部に対応する端部画素については、端部画素から入力画像の内側に向かって垂直方向に第1範囲内に位置する画素の画素値の平均値を算出する。
第1範囲は、入力画像において、第1縁部113又は第2縁部114が写り込む可能性がなく、原稿の背景が写る範囲に設定される。第1範囲は、第2範囲と同様に、画像読取装置100の原稿読取位置の誤差の許容範囲に基づいて定められる。例えば、第2範囲は、個々の装置毎に発生する誤差の許容範囲、特にオフセット誤差の値に基づいて定められる。その場合、第1範囲の下限値は、オフセット誤差の値に相当する入力画像上の距離に設定される。また、第1範囲は、原稿読取処理毎に発生する誤差の許容範囲、特に副走査倍率又は使用環境条件に基づいて定められてもよい。その場合、第1範囲の下限値は副走査倍率、又は、画像読取装置100に発生し得る振動の大きさに相当する入力画像上の距離に設定される。また、第1範囲は、個々の装置毎に発生する誤差の許容範囲、及び、原稿読取処理毎に発生する誤差の許容範囲の両方に基づいて設定されてもよい。
また、原稿の端部には、1DTPポイント分の縁取りがされている場合がある。そのため、第1範囲の下限値は、上記した各値に1DTPポイント(1/72インチ)に相当する入力画像上の距離を加算した値に設定されてもよい。
一方、第1範囲の上限値は、一般的な原稿において余白が設定される範囲に基づいて設定される。例えば、第1範囲の上限値は、日本工業規格で定められた、端部から二穴のとじ穴までの距離({(12±1)+(6±0.5)×1/2}mm)に相当する入力画像上の距離に設定される。または、第1範囲の上限値は、日本工業規格で定められた、端部から多穴のとじ穴までの距離({(6.5±0.5)+(6±0.5)×1/2}mm)に相当する入力画像上の距離に設定されてもよい。一般的な原稿では、とじ穴の位置には文字、罫線、図等が印刷されないように余白が設定されている可能性が高い。したがって、とじ穴の位置に基づいて第1範囲の上限値を設定することにより、原稿の背景が写っている可能性が高い領域を第1範囲として設定することが可能となる。
または、第1範囲の上限値は、一般的なレーザプリンタの非印字領域の幅(例えば端部から3mm)に相当する入力画像上の距離に設定されてもよい。これにより、より確実に、原稿内で印字されていない領域を第1範囲として設定することが可能となる。
第1範囲は、上記した下限値と上限値の間に設定されればよい。また、第1範囲としてそれぞれ分離された複数の範囲が設定されてもよい。第1範囲として複数の範囲を設定することにより、一部の範囲に罫線等が含まれてしまっている場合でも、第1範囲に裏当て部材121が写っていると誤って判定することを抑制することが可能となる。
次に、エッジ画素追加部256は、端部画素から第1範囲内に位置する画素の画素値の平均値が、原稿の背景が写っている画素の画素値の範囲内に含まれるか否かを判定する(ステップS404)。なお、一つの端部画素に対して、第1範囲として複数の範囲が設定されている場合、エッジ画素追加部256は、各範囲内における平均値が、全て原稿の背景が写っている画素の画素値の範囲内に含まれるか否かを判定する。
端部画素から第1範囲内に位置する画素の画素値の平均値が、原稿の背景が写っている画素の画素値の範囲内に含まれる場合、エッジ画素追加部256は、入力画像の端部まで原稿が写っているものとみなす。その場合、エッジ画素追加部256は、入力画像の端部に原稿の端部が写っていないことを想定して、その端部画素をエッジ画素として追加する(ステップS405)。エッジ画素追加部256は、エッジ画素抽出部252が生成したエッジ画像において、その端部画素をエッジ画素として追加する。一方、端部画素から第1範囲内に位置する画素の画素値の平均値が、原稿の背景が写っている画素の画素値の範囲内に含まれない場合、エッジ画素追加部256は、特に処理を実行しない。
次に、エッジ画素追加部256は、全ての端部画素、即ち入力画像内の水平方向、垂直方向の各端部に位置する画素について、処理が完了したか否かを判定する(ステップS406)。エッジ画素追加部256は、まだ処理が完了していない端部画素がある場合、処理をステップS403に戻し、ステップS403〜S406の処理を繰り返す。一方、エッジ画素追加部256は、全ての端部画素について処理が完了した場合、一連のステップを終了する。
図14は、エッジ画素追加処理について説明するための模式図である。
図14は、入力画像1400の左端領域を表す。エッジ画素追加部256は、入力画像1400の左端において抽出された各端部画素1401、1402毎に、エッジ画素追加処理を実行する。図14において、第1範囲R1の左端は、画像読取装置100の原稿読取位置の誤差の許容範囲の上限に設定され、第1範囲R1の右端は、一般的な原稿において余白が設定される範囲の上限に設定されている。端部画素1401について、第1範囲R1内に位置する画素1411の画素値の平均値が、原稿の背景が写っている画素の画素値の範囲内に含まれる場合、端部画素1401がエッジ画素として追加される。同様に、端部画素1402について、第1範囲R1内に位置する画素1412の画素値の平均値が、原稿の背景が写っている画素の画素値の範囲内に含まれる場合、端部画素1402がエッジ画素として追加される。
以下、エッジ画素削除処理及びエッジ画素追加処理を実行することの意味について説明する。上記したように、画像読取装置100では、入力画像の端部に、突き当て部材112の第1縁部113及び第2縁部114と接しているガラス板111上の位置が写り、入力画像には第1縁部113及び第2縁部114が写り込まないように設計されている。しかしながら、画像読取装置100の原稿読取位置には誤差が発生し得るため、入力画像に、第1縁部113又は第2縁部114が写り込む可能性、及び、原稿の端部が写らない可能性がある。
図15Aは、撮像装置118aの読取領域Rが第1縁部113及び第2縁部114側にずれており、且つ、原稿Dが第1縁部113及び第2縁部114に接しないように載置されている場合の、ガラス板111を上側から見た模式図である。図15Bは、図15Aに示した状態で撮像された入力画像1500を示す模式図である。
図15A、15Bに示す例では、入力画像1500に第1縁部113及び第2縁部114が写り込んでいる。したがって、エッジ画素削除処理を実行しない場合、第1縁部113及び第2縁部114によるエッジ画素が抽出される。その結果、第1縁部113による直線1501と、第2縁部114による直線1502と、原稿Dの下端による直線1503と、原稿Dの右端による直線1504で構成される矩形1505が原稿領域として切り出される。この場合、原稿領域に裏当て部材121の画像が含まれてしまう。
一方、入力画像1500に対して、エッジ画素削除処理を実行することにより、入力画像1500の第2範囲に位置する、第1縁部113及び第2縁部114によるエッジ画素が削除される。また、入力画像1500の第1範囲には裏当て部材121が写っているため、エッジ画素追加処理を実行してもエッジ画素は追加されない。したがって、第1縁部113による直線1501と、第2縁部114による直線1502は抽出されない。その結果、原稿Dの上端による直線1506と、原稿Dの左端による直線1507と、原稿Dの下端による直線1503と、原稿Dの右端による直線1504で構成される矩形1508が原稿領域として良好に切り出される。
このように、情報処理装置200は、エッジ画素削除処理を実行することにより、入力画像内に裏当て部材121の第1縁部113及び第2縁部114が写り込んだ場合でも、入力画像内において原稿が写っている領域を適切に切り出すことが可能となる。
図16Aは、撮像装置118aの読取領域Rが第1縁部113及び第2縁部114の反対側にずれており、且つ、原稿Dが第1縁部113及び第2縁部114に接するように載置されている場合の、ガラス板111を上側から見た模式図である。図16Bは、図16Aに示した状態で撮像された入力画像1600を示す模式図である。
図16A、16Bに示す例では、入力画像1600において原稿Dの上端及び左端が写っていない。したがって、エッジ画素追加処理を実行しない場合、原稿Dの上端及び左端によるエッジ画素は抽出されない。その結果、原稿D内の罫線による直線1601、1602、1603及び1604で構成される矩形1605が原稿領域として切り出されてしまう。
一方、入力画像1600の第2範囲にはエッジ画素が存在しないため、入力画像1600に対して、エッジ画素削除処理を実行してもエッジ画素は削除されない。また、入力画像1600の第1範囲には原稿Dの背景が写っているため、エッジ画素追加処理を実行することにより、入力画像1600の上端及び左端による端部画素がエッジ画素として追加される。したがって、入力画像1600の上端による直線1606と、入力画像1600の左端による直線1607が抽出される。その結果、入力画像1600の上端による直線1606と、入力画像1600の左端による直線1607と、原稿Dの下端による直線1608と、原稿Dの右端による直線1609で構成される矩形1610が原稿領域として良好に切り出される。
このように、情報処理装置200は、エッジ画素追加処理を実行することにより、入力画像内に原稿の端部が写らなかった場合でも、入力画像内に写っている原稿全体を原稿領域として切り出すことが可能となる。
図17Aは、撮像装置118aの読取領域Rが第1縁部113及び第2縁部114側にずれており、且つ、原稿Dが第1縁部113及び第2縁部114に接するように載置されている場合の、ガラス板111を上側から見た模式図である。図17Bは、図17Aに示した状態で撮像された入力画像1700を示す模式図である。
図17A、17Bに示す例では、入力画像1700に第1縁部113及び第2縁部114が写り込んでいる。しかしながら、この例では、第1縁部113による直線1701と、第2縁部114による直線1702と、原稿Dの下端による直線1703と、原稿Dの右端による直線1704で構成される矩形1705が原稿領域として切り出される。したがって、エッジ画素削除処理及びエッジ画素追加処理を実行しなくても、原稿領域が良好に切出される。
一方、入力画像1700に対して、エッジ画素削除処理を実行することにより、入力画像1700の第2範囲内に位置する、第1縁部113及び第2縁部114によるエッジ画素が削除される。しかしながら、入力画像1700の第1範囲には原稿Dの背景が写っているため、エッジ画素追加処理を実行することにより、入力画像1700の上端及び左端による端部画素がエッジ画素として追加される。その結果、入力画像1700の上端による直線1706と、入力画像1700の左端による直線1707と、原稿Dの下端による直線1703と、原稿Dの右端による直線1704で構成される矩形1708が原稿領域として良好に切り出される。
図18Aは、撮像装置118aの読取領域Rが第1縁部113及び第2縁部114の反対側にずれており、且つ、原稿Dが第1縁部113及び第2縁部114に接しないように載置されている場合の、ガラス板111を上側から見た模式図である。図18Bは、図18Aに示した状態で撮像された入力画像1800を示す模式図である。
図18A、18Bに示す例では、原稿Dの上端による直線1801と、原稿Dの左端による直線1802と、原稿Dの下端による直線1803と、原稿Dの右端による直線1804で構成される矩形1805が原稿領域として切り出される。したがって、エッジ画素削除処理及びエッジ画素追加処理を実行しなくても、原稿領域が良好に切出される。
一方、入力画像1800の第2範囲にはエッジ画素が存在しないため、入力画像1800に対して、エッジ画素削除処理を実行してもエッジ画素は削除されない。また、入力画像1600の第1範囲には裏当て部材121が写っているため、エッジ画素追加処理を実行してもエッジ画素は追加されない。したがって、原稿Dの上端による直線1801と、原稿Dの左端による直線1802と、原稿Dの下端による直線1803と、原稿Dの右端による直線1804で構成される矩形1805が原稿領域として良好に切り出される。
このように、エッジ画素削除処理及びエッジ画素追加処理を実行することにより、図15A、16A、17A及び18Aに示した全ての場合において、原稿領域を良好に切出すことが可能となる。
なお、第1削除部254は、端部画素から第1範囲内に位置する画素の画素値に基づいて、エッジ画素を削除するか否かを決定してもよい。その場合、第1削除部254は、エッジ画素追加部256と同様にして、入力画像において原稿の背景が写っている(裏当て部材121が写っていない)画素の画素値の範囲を決定する。第1削除部254は、端部画素から第1範囲内に位置する画素の画素値の平均値が、原稿の背景が写っている画素の画素値の範囲内に含まれるか否かを判定する。
第1削除部254は、その平均値がその範囲内に含まれない場合、入力画像の端部に裏当て部材121が写っているとみなし、端部画素に最も近い位置にあるエッジ画素を、第1縁部113又は第2縁部114に対応するエッジ画素とみなして削除する。一方、第1削除部254は、その平均値がその範囲内に含まれる場合、入力画像の端部に原稿が写っているとみなし、端部画素に最も近い位置にあるエッジ画素を、原稿の端部に対応するエッジ画素とみなして削除しない。これにより、第1削除部254は、第1縁部113又は第2縁部114に対応するエッジ画素をより精度良く削除することができる。
また、情報処理装置200は、第2入力装置216を用いた利用者からの原稿切出し機能のON/OFF(有効/無効)の設定を受け付けてもよい。その場合、情報処理装置200は、原稿切出し機能が有効である場合に限り、図7に示した矩形検出処理を実行し、原稿切出し機能がOFFである場合、取得した入力画像から原稿領域を切出さず、そのまま第2画像メモリ231又は第2記憶装置233に記憶する。
同様に、情報処理装置200は、第2入力装置216を用いた利用者からのエッジ画素削除機能又はエッジ画素追加機能のON/OFF(有効/無効)の設定を受け付けてもよい。その場合、第1削除部254は、エッジ画素削除機能が有効である場合に限り、図7のステップS204に示したエッジ画素削除処理を実行し、エッジ画素削除機能が無効である場合、エッジ画素削除処理を省略する。また、エッジ画素追加部256は、エッジ画素追加機能がONである場合に限り、図7のステップS205に示したエッジ画素追加処理を実行し、エッジ画素追加機能が無効である場合、エッジ画素追加処理を省略する。
これにより、情報処理装置200は、画像読取装置100が、入力画像に原稿の端部が写らないような原稿読取位置の誤差を有する場合に限りエッジ画素追加処理を実行しつつ、そのような誤差を有さない場合には処理時間を短縮させることが可能となる。また、情報処理装置200は、画像読取装置100が、入力画像に第1縁部113又は第2縁部114が写り込むような原稿読取位置の誤差を有する場合に限りエッジ画素削除処理を実行しつつ、そのような誤差を有さない場合には処理時間を短縮させることが可能となる。
以上詳述したように、図6、図7、図10、図12に示したフローチャートに従って動作することによって、情報処理装置200は、入力画像から矩形領域を精度良く検出することが可能となった。情報処理装置200は、入力画像に含まれる情報のみに基づいて、矩形領域を検出するので、特別なハードウェア等を必要とせずに、矩形領域を検出することが可能となる。
また、情報処理装置200は、矩形候補の各辺から所定距離内にあるエッジ画素の数、又は、矩形候補の各角の角らしさの度合いに基づいて矩形候補から矩形を選択する。これにより、情報処理装置200は、カバー120が開いた状態で原稿を読み取った場合でも、照明等の影響により、原稿領域を誤って検出することを抑制することが可能となる。
図19は、カバー120が開いた状態で撮像された入力画像1900を示す模式図である。
カバー120が閉じた状態で入力画像が撮像される場合、入力画像において原稿外の領域には裏当て部材121が写り、原稿外の領域でエッジ画素は抽出されない。そのため、情報処理装置200は、入力画像から抽出したエッジ画素を包含する矩形領域を原稿領域として特定することにより、直線の抽出、矩形候補の評価等を実行することなく、原稿領域を適切に検出することができる。
しかしながら、例えば冊子状に綴じられた原稿、ステープルで綴じられた原稿又はADFでは流せない大量の原稿の読取操作が行われる場合、利用者は、作業時間を短縮させるために、カバー120を開けたまま原稿の読取操作を行う可能性がある。図19に示すように、カバー120が開いた状態で入力画像1900が撮像されると、原稿D外の領域には裏当て部材121が写らず、照明L1、L2等が撮像される可能性がある。この場合、入力画像1900からは原稿の端部によるエッジ画素1901〜1904に加えて、照明L1によるエッジ画素1905〜1906及び照明L2によるエッジ画素1907〜1908が抽出される。したがって、入力画像1900から抽出したエッジ画素1901〜1908を包含する矩形領域1911を原稿領域とすると、その原稿領域には原稿以外の画像が含まれてしまう。
一方、エッジ画素から直線を抽出し、抽出した直線から矩形を検出することにより、原稿の端部のエッジ画素による直線1901〜1903及び照明L1のエッジ画素による直線1905で囲まれた矩形領域1912を原稿領域として検出することができる。さらに、直線から複数の矩形候補を抽出し、各矩形候補の評価点に基づいて矩形を選択することにより、原稿の端部のエッジ画素による直線1901〜1904で囲まれた矩形領域1913を原稿領域として検出することができる。
しかしながら、画像読取装置100が有する原稿読取位置の誤差により、入力画像に、原稿の端部が写らなかったり、突き当て部材112の第1縁部113又は第2縁部114が写り込んでしまう可能性がある。その場合、エッジ画素から直線が適切に抽出されず、抽出した直線から矩形が適切に検出されなくなる。一方、情報処理装置200は、エッジ画素追加処理又はエッジ画素削除処理を実行してエッジ画素を適切に追加又は削除することにより、直線を適切に抽出し、矩形を適切に検出することが可能となる。
図20は、他の実施形態における縁部検出処理の動作の例を示すフローチャートである。このフローチャートは、情報処理装置200において、例えば画像読取装置100の起動時に実行される。画像読取装置100は、起動時に、原稿が載置されていない状態で図6に示したフローチャートに係る処理を実行し、原稿が撮像されていない入力画像を情報処理装置200に送信しているものとする。
最初に、画像入力部251は、図7のステップS201と同様にして、原稿が撮像されていない入力画像を画像読取装置100から取得し、第2画像メモリ231に保存する(ステップS501)。
次に、第2削除部255は、図7のステップS202と同様にして、原稿が撮像されていない入力画像から第2エッジ画素を抽出する。第2削除部255は、第2エッジ画素からなる第2エッジ画像を生成し、第2画像メモリ231に保存し(ステップS502)、一連のステップを終了する。この入力画像には、原稿が写っていないため、仮に第2エッジ画素が抽出された場合、その第2エッジ画素は、突き当て部材112の第1縁部113及び第2縁部114によるものであるとみなすことができる。
図21は、エッジ画素削除処理の変形例である第2エッジ画素削除処理の動作の例を示すフローチャートである。このフローチャートは、情報処理装置200において、図10に示すフローチャートの代りに実行することが可能である。図21のステップS601〜S603の処理は、エッジ画素抽出部252が抽出したエッジ画素毎に実行される。
最初に、第2削除部255は、エッジ画素が、第2エッジ画素に対応する位置に存在するか否かを判定する(ステップS601)。第2削除部255は、エッジ画像内のエッジ画素の位置が、第2エッジ画像内の第2エッジ画素の位置と同じである場合、そのエッジ画素が、第2エッジ画素に対応する位置に存在すると判定する。なお、第2削除部255は、エッジ画像内のエッジ画素の位置が、第2エッジ画像内の第2エッジ画素の位置から第4範囲内にある場合、そのエッジ画素が、第2エッジ画素に対応する位置に存在すると判定してもよい。
第4範囲は、例えば、画像読取装置100において原稿読取処理毎に発生する誤差の許容範囲、特に副走査倍率に基づいて定められる。事前に撮像した入力画像において第1縁部113及び第2縁部114が写っている位置と、新たに撮像した入力画像において第1縁部113及び第2縁部114が写っている位置とは、副走査倍率に相当する入力画像上の距離だけ離れている可能性がある。そのため、第4範囲の下限値は0に設定され、上限値は副走査倍率に相当する入力画像上の距離に設定される。また、第4範囲は、画像読取装置100の使用環境条件に基づいて定められてもよい。その場合、第4範囲の下限値は0に設定され、上限値は画像読取装置100に発生し得る振動の大きさに相当する入力画像上の距離に設定される。
エッジ画素が、第2エッジ画素に対応する位置に存在する場合、第2削除部255は、そのエッジ画素を、第1縁部113又は第2縁部114に対応するエッジ画素とみなして削除する(ステップS602)。第2削除部255は、エッジ画素抽出部252が生成したエッジ画像からそのエッジ画素を削除する。一方、エッジ画素が存在する位置が、第2エッジ画素に対応する位置でない場合、第2削除部255は、特に処理を実行しない。
次に、第2削除部255は、全てのエッジ画素について、処理が完了したか否かを判定する(ステップS603)。第2削除部255は、まだ処理が完了していないエッジ画素がある場合、処理をステップS601に戻し、ステップS601〜S603の処理を繰り返す。一方、第2削除部255は、全てのエッジ画素について処理が完了した場合、一連のステップを終了する。
このように、第2削除部255は、エッジ画素抽出部252が抽出したエッジ画素の内、第2エッジ画素に対応する位置に存在するエッジ画素を削除する。この場合、図7のステップS206において、直線抽出部257は、エッジ画素抽出部252が抽出したエッジ画素の内、第2削除部255が削除していないエッジ画素及びエッジ画素追加部256がエッジ画素として追加した端部画素から、複数の直線を抽出する。
以上詳述したように、図6、図7、図12、図20、図21に示したフローチャートに従って動作することによっても、情報処理装置200は、入力画像から矩形領域を精度良く検出することが可能となった。情報処理装置200は、突き当て部材112の第1縁部113及び第2縁部114の位置を確実に特定できるので、矩形領域をより精度良く検出することが可能となった。
図22は、他の実施形態に係る情報処理装置における処理装置260の概略構成を示すブロック図である。
処理装置260は、情報処理装置200の処理装置250の代わりに用いられ、矩形検出処理、エッジ画素削除処理及びエッジ画素追加処理を実行する。処理装置260は、画像入力回路261、エッジ画素抽出回路262、端部画素抽出回路263、第1削除回路264、第2削除回路265、エッジ画素追加回路266、直線抽出回路267、矩形検出回路268及び切出し回路269等を有する。
画像入力回路261は、画像入力部の一例であり、画像入力部251と同様の機能を有する。画像入力回路261は、入力画像を第2インタフェース装置232を介して画像読取装置100から取得し、第2画像メモリ231に保存する。
エッジ画素抽出回路262は、エッジ画素抽出部の一例であり、エッジ画素抽出部252と同様の機能を有する。エッジ画素抽出回路262は、入力画像からエッジ画素を抽出し、エッジ画素からなるエッジ画像を生成して第2画像メモリ231に保存する。
端部画素抽出回路263は、端部画素抽出部の一例であり、端部画素抽出部253と同様の機能を有する。端部画素抽出回路263は、入力画像の端部画素を抽出し、第2画像メモリ231に保存する。
第1削除回路264は、第1削除部の一例であり、第1削除部254と同様の機能を有する。第1削除回路264は、エッジ画素削除処理を実行する。
第2削除回路265は、第2削除部の一例であり、第2削除部255と同様の機能を有する。第2削除回路265は、第2エッジ画素削除処理を実行する。
エッジ画素追加回路266は、エッジ画素追加部の一例であり、エッジ画素追加部256と同様の機能を有する。エッジ画素追加回路266は、エッジ画素追加処理を実行する。
直線抽出回路267は、直線抽出部の一例であり、直線抽出部257と同様の機能を有する。直線抽出回路267は、エッジ画素抽出回路262が抽出したエッジ画素の内、第1削除回路264又は第2削除回路265が削除していないエッジ画素及びエッジ画素追加回路266がエッジ画素として追加した端部画素から、複数の直線を抽出する。
矩形検出回路268は、矩形検出部の一例であり、矩形検出部258と同様の機能を有する。矩形検出回路268は、直線抽出回路267が抽出した複数の直線から矩形を検出する。
切出し回路269は、切出し部の一例であり、切出し部259と同様の機能を有する。切出し回路269は、矩形検出回路268が検出した矩形を原稿領域として入力画像から切出し、切出した画像を第2画像メモリ231又は第2記憶装置233に記憶する。
以上詳述したように、情報処理装置は、処理装置260を用いる場合も、入力画像から矩形領域を精度良く検出することが可能となった。
図23は、他の画像処理システム2の概略構成を示す図である。図23に示す画像処理システム2と、図4に示す画像処理システム1との差異は、処理装置を備える装置が異なる点である。すなわち、画像処理システム2では、情報処理装置400ではなく、画像読取装置300が処理装置350を有する。この処理装置350は、情報処理装置200の処理装置250又は処理装置260と同様の機能を有する。また、第1記憶装置133は、第2記憶装置に記憶された各情報を記憶する。
図23に示す画像処理システム2では、前述した図6、図7、図10、図12、図20、図21に示す処理とほぼ同様の処理が実行される。以下、図6のフローチャートに示される画像読取処理及び図7のフローチャートに示される矩形検出処理がどのように適応されるかについて説明する。画像処理システム2では、ステップS101の処理及びステップS202〜S212の処理は、予め第1記憶装置133に記憶されているプログラムに基づき主に処理装置350により画像読取装置300の各要素と協働して実行される。
ステップS101において、画像読取装置300の撮像装置118aは、原稿を撮像し、AFE130は、入力画像を生成して第1画像メモリ131に保存する。矩形検出処理は、画像読取装置300で実行されるため、ステップS102、S201の入力画像の送受信処理は省略される。
ステップS202〜S209、ステップS301〜S303、ステップS401〜S406、ステップS501〜S503、ステップS601〜S603の各処理は、画像読取装置300の処理装置350によって実行される。これらの処理の動作は、画像処理システム1について説明した情報処理装置200の処理装置250又は処理装置260によって実行される場合と同様である。画像読取装置300の処理装置350は、切出した画像を第1インタフェース装置132を介して情報処理装置400に送信する。
このように、画像読取装置300が処理装置350を備えて矩形検出処理を実行する場合も、情報処理装置が処理装置を備えて矩形検出処理を実行する場合と同様の効果を得ることができる。
以上、本発明の好適な実施形態について説明してきたが、本発明はこれらの実施形態に限定されるものではない。例えば、画像読取装置と情報処理装置の機能分担は、図4及び図23に示す画像処理システムの例に限られず、処理装置内の各部を含めて画像読取装置及び情報処理装置の各部を画像読取装置と情報処理装置の何れに配置するかは適宜変更可能である。または、画像読取装置と情報処理装置を一つの装置で構成してもよい。
また、画像処理システム1、2において、第1インタフェース装置132と第2インタフェース装置232は、インターネット、電話回線網(携帯端末回線網、一般電話回線網を含む)、イントラネット等のネットワークを介して接続してもよい。その場合、第1インタフェース装置132及び第2インタフェース装置232に、接続するネットワークの通信インタフェース回路を備える。また、その場合、クラウドコンピューティングの形態で画像処理のサービスを提供できるように、ネットワーク上に複数の情報処理装置200、400を分散して配置し、各情報処理装置200、400が協働して、矩形検出処理等を分担するようにしてもよい。これにより、画像処理システム1、2は、複数の画像読取装置100、300が読み取った入力画像について、効率よく矩形検出処理を実施できる。
1、2 画像処理システム
100、300 画像読取装置
200、400 情報処理装置
252 エッジ画素抽出部
253 端部画素抽出部
254 第1削除部
255 第2削除部
256 エッジ画素追加部
257 直線抽出部
258 矩形検出部
259 切出し部

Claims (8)

  1. 入力画像からエッジ画素を抽出するエッジ画素抽出部と、
    前記入力画像の端部画素を抽出する端部画素抽出部と、
    前記端部画素抽出部が抽出した端部画素から第1範囲内に位置する画素の画素値に基づいて、前記端部画素をエッジ画素として追加するエッジ画素追加部と、
    前記エッジ画素抽出部が抽出したエッジ画素、及び、前記エッジ画素追加部がエッジ画素として追加した端部画素から、複数の直線を抽出する直線抽出部と、
    前記抽出した複数の直線から矩形を検出する矩形検出部と、
    を有することを特徴とする画像処理装置。
  2. 前記エッジ画素追加部は、前記端部画素から前記第1範囲内に位置する画素の画素値の平均値が、前記入力画像の所定の画素の画素値に基づいて決定された範囲内に含まれる場合に、前記端部画素をエッジ画素として追加する、請求項1に記載の画像処理装置。
  3. 前記入力画像を撮像した画像読取装置の読取位置の誤差の許容範囲を記憶する記憶部をさらに有し、
    前記第1範囲は、前記画像読取装置の読取位置の誤差の許容範囲に基づいて定められる、請求項1または2に記載の画像処理装置。
  4. 前記エッジ画素抽出部が抽出したエッジ画素の内、前記端部画素から第2範囲内に位置し、且つ、前記端部画素に最も近い位置にあるエッジ画素を削除する第1削除部をさらに有し、
    前記直線抽出部は、前記エッジ画素抽出部が抽出したエッジ画素の内、前記第1削除部が削除していないエッジ画素から前記複数の直線を抽出する、請求項1〜3の何れか一項に記載の画像処理装置。
  5. 前記入力画像を撮像した画像読取装置の読取位置の誤差の許容範囲を記憶する記憶部をさらに有し、
    前記第2範囲は、前記画像読取装置の読取位置の誤差の許容範囲に基づいて定められる、請求項4に記載の画像処理装置。
  6. 原稿が撮像されていない画像から第2エッジ画素を抽出し、前記エッジ画素抽出部が抽出したエッジ画素の内、前記第2エッジ画素に対応する位置に存在するエッジ画素を削除する第2削除部をさらに有し、
    前記直線抽出部は、前記エッジ画素抽出部が抽出したエッジ画素の内、前記第2削除部が削除していないエッジ画素から前記複数の直線を抽出する、請求項1〜の何れか一項に記載の画像処理装置。
  7. 画像処理装置による矩形検出方法であって、前記画像処理装置が、
    入力画像からエッジ画素を抽出し、
    前記入力画像の端部画素を抽出し、
    前記抽出した端部画素から第1範囲内に位置する画素の画素値に基づいて、前記端部画素をエッジ画素として追加し、
    前記抽出したエッジ画素、及び、前記エッジ画素として追加した端部画素から、複数の直線を抽出し、
    前記抽出した複数の直線から矩形を検出する、
    ことを含むことを特徴とする矩形検出方法。
  8. 入力画像からエッジ画素を抽出し、
    前記入力画像の端部画素を抽出し、
    前記抽出した端部画素から第1範囲内に位置する画素の画素値に基づいて、前記端部画素をエッジ画素として追加し、
    前記抽出したエッジ画素、及び、前記エッジ画素として追加した端部画素から、複数の直線を抽出し、
    前記抽出した複数の直線から矩形を検出する、
    ことをコンピュータに実行させることを特徴とするコンピュータプログラム。
JP2016245778A 2016-12-19 2016-12-19 画像処理装置、矩形検出方法及びコンピュータプログラム Active JP6345224B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016245778A JP6345224B1 (ja) 2016-12-19 2016-12-19 画像処理装置、矩形検出方法及びコンピュータプログラム
US15/496,911 US10230867B2 (en) 2016-12-19 2017-04-25 Image processing apparatus, rectangle region detection method, and computer-readable, non-transitory medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016245778A JP6345224B1 (ja) 2016-12-19 2016-12-19 画像処理装置、矩形検出方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP6345224B1 true JP6345224B1 (ja) 2018-06-20
JP2018101852A JP2018101852A (ja) 2018-06-28

Family

ID=62562856

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016245778A Active JP6345224B1 (ja) 2016-12-19 2016-12-19 画像処理装置、矩形検出方法及びコンピュータプログラム

Country Status (2)

Country Link
US (1) US10230867B2 (ja)
JP (1) JP6345224B1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6918482B2 (ja) * 2016-12-16 2021-08-11 キヤノン株式会社 画像読取装置
JP7230343B2 (ja) 2018-05-28 2023-03-01 株式会社リコー 画像検索装置、画像検索方法、画像検索プログラム及び販売システム
JP7311832B2 (ja) * 2018-12-27 2023-07-20 ブラザー工業株式会社 画像処理装置、読取装置、および、コンピュータプログラム
JP7104650B2 (ja) * 2019-03-20 2022-07-21 株式会社Pfu 画像読取装置、画像処理システム、制御方法及び制御プログラム
CN111046727B (zh) * 2019-10-31 2023-10-20 咪咕文化科技有限公司 视频特征提取方法及装置、电子设备及存储介质
CN111145305A (zh) * 2019-12-04 2020-05-12 宁波华高信息科技有限公司 一种文档图像处理方法
JP7472495B2 (ja) * 2020-01-07 2024-04-23 京セラドキュメントソリューションズ株式会社 画像形成装置
KR20220008766A (ko) 2020-07-14 2022-01-21 캐논 가부시끼가이샤 화상 처리 장치, 제어 방법, 및 저장 매체
JP7328467B1 (ja) * 2023-05-29 2023-08-16 錦鋒 李 情報処理装置、情報処理方法及び情報処理プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2757545B2 (ja) * 1990-07-27 1998-05-25 大日本スクリーン製造 株式会社 複数の画像読取りシステム相互の位置誤差補償方法
US5764788A (en) * 1995-08-31 1998-06-09 Macmillan Bloedel Limited Strand orientation sensing
CN101356547A (zh) * 2006-05-25 2009-01-28 日本电气株式会社 识别系统、识别方法以及识别程序
JP4941317B2 (ja) * 2008-01-16 2012-05-30 ブラザー工業株式会社 画像読取装置
US8125544B2 (en) * 2008-09-02 2012-02-28 Casio Computer Co., Ltd. Image processing apparatus for extracting quadrangle area in image
JP4807406B2 (ja) * 2008-12-16 2011-11-02 ブラザー工業株式会社 画像読取装置
JP4772894B2 (ja) * 2009-08-03 2011-09-14 シャープ株式会社 画像出力装置、携帯端末装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP4856263B2 (ja) * 2009-08-07 2012-01-18 シャープ株式会社 撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
AU2011205085B2 (en) * 2011-07-29 2014-05-15 Canon Kabushiki Kaisha 2D region rendering
JP5755089B2 (ja) 2011-09-08 2015-07-29 株式会社Pfu 画像処理装置、画像処理方法、画像処理プログラム及び画像処理システム
JP5871571B2 (ja) * 2011-11-11 2016-03-01 株式会社Pfu 画像処理装置、矩形検出方法及びコンピュータプログラム
JP5915257B2 (ja) 2012-02-28 2016-05-11 ブラザー工業株式会社 画像読取装置および原稿領域決定プログラム
JP5915256B2 (ja) * 2012-02-28 2016-05-11 ブラザー工業株式会社 画像読取装置および原稿領域決定プログラム
JP2014092899A (ja) * 2012-11-02 2014-05-19 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
RU2013104895A (ru) * 2013-02-05 2014-08-10 ЭлЭсАй Корпорейшн Процессор изображений с функциональностью выбора контуров
JP6099457B2 (ja) * 2013-03-28 2017-03-22 株式会社Pfu 画像処理装置、領域決定方法及びコンピュータプログラム
US9064309B2 (en) * 2013-10-29 2015-06-23 Google Inc. Automatic rectification of distortions in images
JP5698396B1 (ja) * 2014-03-05 2015-04-08 株式会社Pfu 画像読取装置、画像読取方法、および、プログラム
JP6200040B1 (ja) * 2016-06-17 2017-09-20 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム

Also Published As

Publication number Publication date
US20180176408A1 (en) 2018-06-21
JP2018101852A (ja) 2018-06-28
US10230867B2 (en) 2019-03-12

Similar Documents

Publication Publication Date Title
JP6345224B1 (ja) 画像処理装置、矩形検出方法及びコンピュータプログラム
US8174737B2 (en) Image reading apparatus
US9092869B2 (en) Image processing apparatus, region determining method, and computer-readable, non-transitory medium
US8102575B2 (en) Image processing apparatus and method
US10827099B2 (en) Image processing apparatus for determining a threshold for extracting an edge pixel based on a region corresponding to a surface facing an imaging device
US10582085B2 (en) Method and device for image processing, and apparatus for image formation
US9110435B2 (en) Device capable of extracting output control information, control method thereof, and storage medium
JP2008112215A (ja) 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム
JP2007081458A (ja) 画像処理装置および画像処理装置の制御方法
US10075614B2 (en) Image processing apparatus and non-transitory computer readable medium
US20150215493A1 (en) Image processing apparatus, image processing method, and computer-readable, non-transitory medium
JP5407627B2 (ja) 画像処理装置、画像処理方法、プログラム
WO2017056799A1 (ja) 画像読取装置及び画像形成装置
JP6249240B2 (ja) 画像処理装置
US10757281B1 (en) Image reading apparatus for executing image processing based on a reliability level according to a number of conveyance mechanisms clamping a medium
US20190058805A1 (en) Image processing apparatus, and method of controlling the same
JP6970834B2 (ja) 画像処理装置、制御方法及び制御プログラム
US20100165417A1 (en) Image processing method, image processing apparatus, and computer-readable storage medium
US8422785B2 (en) Image processing apparatus, image processing method, and program
US8289584B2 (en) Image processing method, apparatus and program
JP2019220069A (ja) カード番号認識装置およびカード番号認識方法
US9628666B2 (en) Image processing device generating combined imaged data by using first image data and second image data
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2007081882A (ja) 原稿読取装置および原稿読取方法
US20140168721A1 (en) Image processing apparatus, method, and program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180424

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180522

R150 Certificate of patent or registration of utility model

Ref document number: 6345224

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150