JP2013214300A - 画像処理装置、画像処理方法及び画像処理デバイス - Google Patents
画像処理装置、画像処理方法及び画像処理デバイス Download PDFInfo
- Publication number
- JP2013214300A JP2013214300A JP2013070507A JP2013070507A JP2013214300A JP 2013214300 A JP2013214300 A JP 2013214300A JP 2013070507 A JP2013070507 A JP 2013070507A JP 2013070507 A JP2013070507 A JP 2013070507A JP 2013214300 A JP2013214300 A JP 2013214300A
- Authority
- JP
- Japan
- Prior art keywords
- document
- corner point
- candidate page
- page
- rough
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00681—Detecting the presence, position or size of a sheet or correcting its position before scanning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20164—Salient point detection; Corner detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
【解決手段】画像処理装置は、書類に対して捕捉された書類画像から、書類画像の水平方向又は垂直方向である書類の第1の方向に沿う境界線及び書類の大雑把な書類角点を抽出する抽出手段と、大雑把な書類角点近傍の書類の第1の方向に沿う境界線から書類の候補ページ角点を決定する決定手段と、候補ページ角点から、ページ内領域の画素特徴が書類のページの角の画素特徴に最も近い候補ページ角点を書類の書類角点として選択する選択手段と、を含む。
【選択図】図2
Description
書類に対して捕捉された書類画像から、前記書類の第1の方向に沿う境界線及び前記書類の大雑把な書類角点を抽出する抽出手段と、
前記大雑把な書類角点近傍の前記書類の第1の方向に沿う境界線から前記書類の候補ページ角点を決定する決定手段と、
前記候補ページ角点から、ページ内領域の画素特徴が前記書類のページの角の画素特徴に最も近い候補ページ角点を前記書類の書類角点として選択する選択手段と、を含み、
前記第1の方向は前記書類画像の水平方向又は垂直方向である、画像処理装置。
前記抽出手段は、
全局二値化方法により前記書類画像の前景領域を取得することで前記前景領域のエッジラインを取得し、前記前景領域の隣接するエッジラインの間の交点を前記書類の大雑把な書類角点と決定する第1の処理サブ手段と、
前記書類の大雑把な書類角点の間において前記第1の方向に沿って動的計画法により境界検出を行い、検出された境界を前記書類の第1の方向に沿う境界線とする第2の処理サブ手段と、を含む、付記1に記載の画像処理装置。
前記決定手段は、
各大雑把な書類角点に対して、前記書類の第1の方向に沿う境界線から前記大雑把な書類角点を含む境界線セグメントを切り取り、前記書類画像から前記境界線セグメントを含む画像ブロックを切り取る切り取りサブ手段と、
前記画像ブロックの第1の方向に沿う勾配を計算し、閾値化方法を用いることで、前記画像ブロックの勾配の二値化画像を取得し、エントロビー最小化ルールにより前記書類の第2の方向に沿う境界線の傾斜度を取得する第1の計算サブ手段であって、前記第1の方向が前記書類画像の水平方向である場合、前記第2の方向は前記書類の垂直方向であり、前記第1の方向が前記書類画像の垂直方向である場合、前記第2の方向は前記書類の水平方向である、第1の計算サブ手段と、
前記境界線セグメントにおける各点近傍から前記点に関係のある第1の矩形領域をそれぞれ決定する第1の決定サブ手段であって、前記第1の矩形領域は、第1の所定サイズを有し、且つ前記画像ブロックに含まれ、前記第1の矩形領域の長さは、前記書類の第2の方向に沿う境界線の傾斜度に一致する方向に沿って延伸する、第1の決定サブ手段と、
前記画像ブロックの勾配の二値化画像に基づいて各第1の矩形領域に含まれる前景画素点の数を計算し、前記境界線セグメントから、対応する第1の矩形領域に含まれる前景画素点の数が第1の所定閾値よりも大きいという条件を満たしている点を、前記大雑把な書類角点の候補ページ角点として選択する計算選択サブ手段と、を含む、付記1又は2に記載の画像処理装置。
前記抽出手段が前記第1の処理サブ手段を含み、且つ前記第1の処理サブ手段が前記書類画像の前景領域を取得した場合、前記境界線セグメントにおける各点に対応する第1の矩形領域は前記書類画像の前景領域の内部に位置する、付記3に記載の画像処理装置。
前記選択手段は、
各大雑把な書類角点に対して、前記大雑把な書類角点の各候補ページ角点近傍から前記候補ページ角点に関係のあるページ内領域をそれぞれ決定する第2の決定サブ手段であって、前記ページ内領域は第2の所定サイズを有し、且つ前記画像ブロックに含まれ、各候補ページ角点に対応するページ内領域は前記候補ページ角点に対応する第1の矩形領域よりも前記書類画像の中心に近い、第2の決定サブ手段と、
各大雑把な書類角点の各候補ページ角点に対応するページ内領域における前景画素の百分比を計算する第2の計算サブ手段と、
各大雑把な書類角点の候補ページ角点から、対応するページ内領域における前景画素の百分比が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点を前記書類の書類角点として選択する選択サブ手段と、を含む、付記3又は4に記載の画像処理装置。
前記選択手段は、
各大雑把な書類角点に対して、前記大雑把な書類角点の各候補ページ角点近傍から前記候補ページ角点に関係のあるページ内領域をそれぞれ決定する第2の決定サブ手段であって、前記ページ内領域は第2の所定サイズを有し、且つ前記画像ブロックに含まれ、各候補ページ角点に対応するページ内領域は前記候補ページ角点に対応する第1の矩形領域よりも前記書類画像の中心に近い、第2の決定サブ手段と、
各大雑把な書類角点の各候補ページ角点に対応するページ内領域における前景画素の百分比を計算する第2の計算サブ手段と、
前記第2の計算サブ手段の計算結果に基づいて候補ページ角点を選別する選別サブ手段であって、
前記第1の方向が前記書類画像の水平方向である場合、前記大雑把な書類角点における左上部の大雑把な書類角点の候補ページ角点及び左下部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第1の候補ページ角点対を取得し、且つ前記大雑把な書類角点における右上部の大雑把な書類角点の候補ページ角点及び右下部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第2の候補ページ角点対を取得し、前記第1の方向が前記書類画像の垂直方向である場合、前記大雑把な書類角点における左上部の大雑把な書類角点の候補ページ角点及び右上部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第3の候補ページ角点対を取得し、且つ前記大雑把な書類角点における左下部の大雑把な書類角点の候補ページ角点及び右下部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第4の候補ページ角点対を取得する、マッチングモジュールと、
前記複数の第1及び第2の候補ページ角点対、又は前記複数の第3及び第4の候補ページ角点対における各候補ページ角点対に含まれる2つの候補ページ角点の間の連結線の傾斜度をそれぞれ計算する計算モジュールと、
前記マッチングモジュールにより取得された複数の第1及び第2の候補ページ角点対又は複数の第3及び第4の候補ページ角点対から、対応する傾斜度と前記書類の第2の方向に沿う境界線の傾斜度との差が第2の所定閾値よりも大きい候補ページ角点対を除去し、処理を行わせるように残りの候補ページ角点対を選択サブ手段に供給する、選別モジュールと、を含む選別サブ手段と、
前記残りの候補ページ角点対に対して、各候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和を計算し、
前記第1の方向が前記書類画像の水平方向である場合、前記複数の第1の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記複数の第2の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記第1の候補ページ角点対及び前記第2の候補ページ角点からそれぞれ選択された候補ページ角点対における候補ページ角点を前記書類の書類角点と決定し、
前記第1の方向が前記書類画像の垂直方向である場合、前記複数の第3の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記複数の第4の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記第3の候補ページ角点対及び前記第4の候補ページ角点からそれぞれ選択された候補ページ角点対における候補ページ角点を前記書類の書類角点と決定する、前記選択サブ手段と、を含む、付記3又は4に記載の画像処理装置。
前記ページ内領域は前記ページ内領域に対応する候補ページ角点を頂点とする矩形又は方形の領域であり、前記ページ内領域の1つの辺は前記第2の方向に沿う境界線の傾斜度に一致する方向に沿って延伸する、付記5又は6に記載の画像処理装置。
書類に対して捕捉された書類画像から、前記書類の第1の方向に沿う境界線を抽出するステップと、
前記書類の第1の方向に沿う境界線から前記書類の候補ページ角点を決定するステップと、
前記候補ページ角点から、ページ内領域の画素特徴が前記書類のページの角の画素特徴に最も近い候補ページ角点を前記書類の書類角点として選択するステップと、を含み、
前記第1の方向は前記書類画像の水平方向又は垂直方向である、画像処理方法。
書類に対して捕捉された書類画像から、前記書類の第1の方向に沿う境界線を抽出するステップは、
全局二値化方法により前記書類画像の前景領域を取得することで前記前景領域のエッジラインを取得し、前記前景領域の隣接するエッジラインの間の交点を前記書類の大雑把な書類角点と決定するステップと、
前記書類の大雑把な書類角点の間において前記第1の方向に沿って動的計画法により境界検出を行い、検出された境界を前記書類の第1の方向に沿う境界線とするステップと、を含む、付記8に記載の画像処理方法。
前記書類の第1の方向に沿う境界線から前記書類の候補ページ角点を決定するステップは、
各大雑把な書類角点に対して、前記書類の第1の方向に沿う境界線から前記大雑把な書類角点を含む境界線セグメントを切り取り、前記書類画像から前記境界線セグメントを含む画像ブロックを選択するステップと、
前記画像ブロックの第1の方向に沿う勾配を計算し、閾値化方法を用いることで、前記画像ブロックの勾配の二値化画像を取得し、エントロビー最小化ルールにより前記書類の第2の方向に沿う境界線の傾斜度を取得するステップであって、前記第1の方向が前記書類画像の水平方向である場合、前記第2の方向は前記書類の垂直方向であり、前記第1の方向が前記書類画像の垂直方向である場合、前記第2の方向は前記書類の水平方向である、ステップと、
前記境界線セグメントにおける各点近傍から前記点に関係のある第1の矩形領域をそれぞれ決定するステップであって、前記第1の矩形領域は、第1の所定サイズを有し、且つ前記画像ブロックに含まれ、前記第1の矩形領域の長さは、前記書類の第2の方向に沿う境界線の傾斜度に一致する方向に沿って延伸する、ステップと、
前記画像ブロックの勾配の二値化画像に基づいて各第1の矩形領域に含まれる前景画素点の数を計算し、前記境界線セグメントから、対応する第1の矩形領域に含まれる前景画素点の数が第1の所定閾値よりも大きいという条件を満たしている点を、前記大雑把な書類角点の候補ページ角点として選択するステップと、を含む、付記9に記載の画像処理方法。
前記書類画像の前景領域を取得した場合、前記境界線セグメントにおける各点に対応する第1の矩形領域は前記書類画像の前景領域の内部に位置する、付記10に記載の画像処理方法。
前記候補ページ角点から、ページ内領域の画素特徴が前記書類のページの角の画素特徴に最も近い候補ページ角点を前記書類の書類角点として選択するステップは、
各大雑把な書類角点に対して、前記大雑把な書類角点の各候補ページ角点近傍から前記候補ページ角点に関係のあるページ内領域をそれぞれ決定するステップであって、前記ページ内領域は第2の所定サイズを有し、且つ前記画像ブロックに含まれ、各候補ページ角点に対応するページ内領域は前記候補ページ角点に対応する第1の矩形領域よりも前記書類画像の中心に近い、ステップと、
各大雑把な書類角点の各候補ページ角点に対応するページ内領域における前景画素の百分比を計算するステップと、
各大雑把な書類角点の候補ページ角点から、対応するページ内領域における前景画素の百分比が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点を前記書類の書類角点として選択するステップと、を含む、付記10又は11に記載の画像処理方法。
前記候補ページ角点から、ページ内領域の画素特徴が前記書類のページの角の画素特徴に最も近い候補ページ角点を前記書類の書類角点として選択するステップは、
各大雑把な書類角点に対して、前記大雑把な書類角点の各候補ページ角点近傍から前記候補ページ角点に関係のあるページ内領域をそれぞれ決定するステップであって、前記ページ内領域は第2の所定サイズを有し、且つ前記画像ブロックに含まれ、各候補ページ角点に対応するページ内領域は前記候補ページ角点に対応する第1の矩形領域よりも前記書類画像の中心に近い、ステップと、
各大雑把な書類角点の各候補ページ角点に対応するページ内領域における前景画素の百分比を計算するステップと、
前記第1の方向が前記書類画像の水平方向である場合、前記大雑把な書類角点における左上部の大雑把な書類角点の候補ページ角点及び左下部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第1の候補ページ角点対を取得し、且つ前記大雑把な書類角点における右上部の大雑把な書類角点の候補ページ角点及び右下部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第2の候補ページ角点対を取得し、
前記第1の方向が前記書類画像の垂直方向である場合、前記大雑把な書類角点における左上部の大雑把な書類角点の候補ページ角点及び右上部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第3の候補ページ角点対を取得し、且つ前記大雑把な書類角点における左下部の大雑把な書類角点の候補ページ角点及び右下部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第4の候補ページ角点対を取得する、ステップと、
前記複数の第1及び第2の候補ページ角点対、又は前記複数の第3及び第4の候補ページ角点対における各候補ページ角点対に含まれる2つの候補ページ角点の間の連結線の傾斜度をそれぞれ計算するステップと、
前記取得された複数の第1及び第2の候補ページ角点対又は複数の第3及び第4の候補ページ角点対から、対応する傾斜度と前記書類の第2の方向に沿う境界線の傾斜度との差が第2の所定閾値よりも大きい候補ページ角点対を除去し、
前記除去して残った第1及び第2の候補ページ角点対、又は第3及び第4の候補ページ角点対における各候補ページ角点に含まれる2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和を計算し、
前記第1の方向が前記書類画像の水平方向である場合、前記複数の第1の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記複数の第2の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記第1の候補ページ角点対及び前記第2の候補ページ角点からそれぞれ選択された候補ページ角点対における候補ページ角点を前記書類の書類角点と決定し、
前記第1の方向が前記書類画像の垂直方向である場合、前記複数の第3の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記複数の第4の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記第3の候補ページ角点対及び前記第4の候補ページ角点からそれぞれ選択された候補ページ角点対における候補ページ角点を前記書類の書類角点と決定する、ステップと、を含む、付記10又は11に記載の画像処理方法。
前記ページ内領域は前記ページ内領域に対応する候補ページ角点を頂点とする矩形又は方形の領域であり、前記ページ内領域の1つの辺は前記第2の方向に沿う境界線の傾斜度に一致する方向に沿って延伸する、付記11又は12に記載の画像処理方法。
画像処理機能を有するデバイスであって、付記1乃至7のいずれか一項に記載の画像処理装置を含む、画像処理デバイス。
前記画像処理デバイスは、書類校正デバイス、スキャナー、カメラ、携帯電話、コンピュータ、及びPDA(Personal Digital Assistant:パーソナルディジタルアシスタント)のうちいずれか1つである、付記15に記載の画像処理デバイス。
計算デバイスが実行可能なコンピュータのプログラムを記憶するコンピュータ読み取り可能な記憶媒体であって、前記プログラムを実行する際に、前記計算デバイスが付記11乃至20のいずれか一項に記載の画像処理方法を実行することができる記憶媒体。
Claims (10)
- 書類に対して捕捉された書類画像から、前記書類の第1の方向に沿う境界線及び前記書類の大雑把な書類角点を抽出する抽出手段と、
前記大雑把な書類角点近傍の前記書類の第1の方向に沿う境界線から前記書類の候補ページ角点を決定する決定手段と、
前記候補ページ角点から、ページ内領域の画素特徴が前記書類のページの角の画素特徴に最も近い候補ページ角点を前記書類の書類角点として選択する選択手段と、を含み、
前記第1の方向は前記書類画像の水平方向又は垂直方向である、画像処理装置。 - 前記抽出手段は、
全局二値化方法により前記書類画像の前景領域を取得することで前記前景領域のエッジラインを取得し、前記前景領域の隣接するエッジラインの間の交点を前記書類の大雑把な書類角点と決定する第1の処理サブ手段と、
前記書類の大雑把な書類角点の間において前記第1の方向に沿って動的計画法により境界検出を行い、検出された境界を前記書類の第1の方向に沿う境界線とする第2の処理サブ手段と、を含む、請求項1に記載の画像処理装置。 - 前記決定手段は、
各大雑把な書類角点に対して、前記書類の第1の方向に沿う境界線から前記大雑把な書類角点を含む境界線セグメントを切り取り、前記書類画像から前記境界線セグメントを含む画像ブロックを切り取る切り取りサブ手段と、
前記画像ブロックの第1の方向に沿う勾配を計算し、閾値化方法を用いることで、前記画像ブロックの勾配の二値化画像を取得し、エントロビー最小化ルールにより前記書類の第2の方向に沿う境界線の傾斜度を取得する第1の計算サブ手段であって、前記第1の方向が前記書類画像の水平方向である場合、前記第2の方向は前記書類の垂直方向であり、前記第1の方向が前記書類画像の垂直方向である場合、前記第2の方向は前記書類の水平方向である、第1の計算サブ手段と、
前記境界線セグメントにおける各点近傍から前記点に関係のある第1の矩形領域をそれぞれ決定する第1の決定サブ手段であって、前記第1の矩形領域は、第1の所定サイズを有し、且つ前記画像ブロックに含まれ、前記第1の矩形領域の長さは、前記書類の第2の方向に沿う境界線の傾斜度に一致する方向に沿って延伸する、第1の決定サブ手段と、
前記画像ブロックの勾配の二値化画像に基づいて各第1の矩形領域に含まれる前景画素点の数を計算し、前記境界線セグメントから、対応する第1の矩形領域に含まれる前景画素点の数が第1の所定閾値よりも大きいという条件を満たしている点を、前記大雑把な書類角点の候補ページ角点として選択する計算選択サブ手段と、を含む、請求項1又は2に記載の画像処理装置。 - 前記抽出手段が前記第1の処理サブ手段を含み、且つ前記第1の処理サブ手段が前記書類画像の前景領域を取得した場合、前記境界線セグメントにおける各点に対応する第1の矩形領域は前記書類画像の前景領域の内部に位置する、請求項3に記載の画像処理装置。
- 前記選択手段は、
各大雑把な書類角点に対して、前記大雑把な書類角点の各候補ページ角点近傍から前記候補ページ角点に関係のあるページ内領域をそれぞれ決定する第2の決定サブ手段であって、前記ページ内領域は第2の所定サイズを有し、且つ前記画像ブロックに含まれ、各候補ページ角点に対応するページ内領域は前記候補ページ角点に対応する第1の矩形領域よりも前記書類画像の中心に近い、第2の決定サブ手段と、
各大雑把な書類角点の各候補ページ角点に対応するページ内領域における前景画素の百分比を計算する第2の計算サブ手段と、
各大雑把な書類角点の候補ページ角点から、対応するページ内領域における前景画素の百分比が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点を前記書類の書類角点として選択する選択サブ手段と、を含む、請求項3又は4に記載の画像処理装置。 - 前記選択手段は、
各大雑把な書類角点に対して、前記大雑把な書類角点の各候補ページ角点近傍から前記候補ページ角点に関係のあるページ内領域をそれぞれ決定する第2の決定サブ手段であって、前記ページ内領域は第2の所定サイズを有し、且つ前記画像ブロックに含まれ、各候補ページ角点に対応するページ内領域は前記候補ページ角点に対応する第1の矩形領域よりも前記書類画像の中心に近い、第2の決定サブ手段と、
各大雑把な書類角点の各候補ページ角点に対応するページ内領域における前景画素の百分比を計算する第2の計算サブ手段と、
前記第2の計算サブ手段の計算結果に基づいて候補ページ角点を選別する選別サブ手段であって、
前記第1の方向が前記書類画像の水平方向である場合、前記大雑把な書類角点における左上部の大雑把な書類角点の候補ページ角点及び左下部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第1の候補ページ角点対を取得し、且つ前記大雑把な書類角点における右上部の大雑把な書類角点の候補ページ角点及び右下部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第2の候補ページ角点対を取得し、前記第1の方向が前記書類画像の垂直方向である場合、前記大雑把な書類角点における左上部の大雑把な書類角点の候補ページ角点及び右上部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第3の候補ページ角点対を取得し、且つ前記大雑把な書類角点における左下部の大雑把な書類角点の候補ページ角点及び右下部の大雑把な書類角点の候補ページ角点に対してそれぞれ2つを対にすることで複数の第4の候補ページ角点対を取得する、マッチングモジュールと、
前記複数の第1及び第2の候補ページ角点対、又は前記複数の第3及び第4の候補ページ角点対における各候補ページ角点対に含まれる2つの候補ページ角点の間の連結線の傾斜度をそれぞれ計算する計算モジュールと、
前記マッチングモジュールにより取得された複数の第1及び第2の候補ページ角点対又は複数の第3及び第4の候補ページ角点対から、対応する傾斜度と前記書類の第2の方向に沿う境界線の傾斜度との差が第2の所定閾値よりも大きい候補ページ角点対を除去し、処理を行わせるように残りの候補ページ角点対を選択サブ手段に供給する、選別モジュールと、を含む選別サブ手段と、
前記残りの候補ページ角点対に対して、各候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和を計算し、
前記第1の方向が前記書類画像の水平方向である場合、前記複数の第1の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記複数の第2の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記第1の候補ページ角点対及び前記第2の候補ページ角点からそれぞれ選択された候補ページ角点対における候補ページ角点を前記書類の書類角点と決定し、
前記第1の方向が前記書類画像の垂直方向である場合、前記複数の第3の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記複数の第4の候補ページ角点対における2つの候補ページ角点それぞれに対応するページ内領域における前景画素の百分比の和が前記書類のページ角領域における前景画素の百分比に最も近い候補ページ角点対を選択し、前記第3の候補ページ角点対及び前記第4の候補ページ角点からそれぞれ選択された候補ページ角点対における候補ページ角点を前記書類の書類角点と決定する、前記選択サブ手段と、を含む、請求項3又は4に記載の画像処理装置。 - 前記ページ内領域は前記ページ内領域に対応する候補ページ角点を頂点とする矩形又は方形の領域であり、前記ページ内領域の1つの辺は前記第2の方向に沿う境界線の傾斜度に一致する方向に沿って延伸する、請求項5又は6に記載の画像処理装置。
- 書類に対して捕捉された書類画像から、前記書類の第1の方向に沿う境界線を抽出するステップと、
前記書類の第1の方向に沿う境界線から前記書類の候補ページ角点を決定するステップと、
前記候補ページ角点から、ページ内領域の画素特徴が前記書類のページの角の画素特徴に最も近い候補ページ角点を前記書類の書類角点として選択するステップと、を含み、
前記第1の方向は前記書類画像の水平方向又は垂直方向である、画像処理方法。 - 画像処理機能を有するデバイスであって、請求項1乃至7のいずれか一項に記載の画像処理装置を含む、画像処理デバイス。
- 前記画像処理デバイスは、書類校正デバイス、スキャナー、カメラ、携帯電話、コンピュータ、及びPDA(Personal Digital Assistant)のうちいずれか1つである、請求項9に記載の画像処理デバイス。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210091193.7 | 2012-03-30 | ||
CN201210091193.7A CN103366165B (zh) | 2012-03-30 | 2012-03-30 | 图像处理装置、图像处理方法以及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013214300A true JP2013214300A (ja) | 2013-10-17 |
JP6102417B2 JP6102417B2 (ja) | 2017-03-29 |
Family
ID=48087371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013070507A Active JP6102417B2 (ja) | 2012-03-30 | 2013-03-28 | 画像処理装置、画像処理方法及び画像処理デバイス |
Country Status (4)
Country | Link |
---|---|
US (1) | US9129385B2 (ja) |
EP (1) | EP2645692B1 (ja) |
JP (1) | JP6102417B2 (ja) |
CN (1) | CN103366165B (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105809136A (zh) * | 2016-03-14 | 2016-07-27 | 中磊电子(苏州)有限公司 | 影像数据处理方法及影像数据处理系统 |
WO2018141109A1 (zh) * | 2017-02-06 | 2018-08-09 | 华为技术有限公司 | 图像处理的方法和设备 |
JP6810892B2 (ja) * | 2017-06-05 | 2021-01-13 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
CN107680108B (zh) | 2017-07-28 | 2019-06-21 | 平安科技(深圳)有限公司 | 倾斜图像的倾斜值获取方法、装置、终端及存储介质 |
CN112528847A (zh) * | 2020-12-08 | 2021-03-19 | 北京嘀嘀无限科技发展有限公司 | 一种目标检测方法、装置、电子设备及存储介质 |
US20230410278A1 (en) * | 2022-06-15 | 2023-12-21 | Xerox Corporation | Techniques for binarizing images to determine jetting quality in additive manufacturing |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000020682A (ja) * | 1998-06-30 | 2000-01-21 | Sharp Corp | 画像補正装置 |
JP2008124604A (ja) * | 2006-11-09 | 2008-05-29 | Matsushita Electric Ind Co Ltd | 画像読取装置及びこれを備えた画像形成装置 |
JP2009194762A (ja) * | 2008-02-15 | 2009-08-27 | Murata Mach Ltd | 画像処理装置 |
JP2011181071A (ja) * | 2010-03-01 | 2011-09-15 | Canon Inc | ページ境界を検出する方法及び装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4037512B2 (ja) * | 1997-04-15 | 2008-01-23 | コニカミノルタビジネステクノロジーズ株式会社 | 画像読取装置 |
JP4784500B2 (ja) * | 2006-12-08 | 2011-10-05 | 日本電気株式会社 | 画像傾き補正装置及び画像傾き補正方法 |
US8218890B2 (en) * | 2008-01-22 | 2012-07-10 | The Neat Company | Method and apparatus for cropping images |
CN101477687B (zh) * | 2009-01-22 | 2011-05-04 | 上海交通大学 | 复杂背景下的棋盘格角点检测方法 |
CN102375985A (zh) * | 2010-08-10 | 2012-03-14 | 富士通株式会社 | 目标检测方法和设备 |
CN102184383B (zh) * | 2011-04-18 | 2013-04-10 | 哈尔滨工业大学 | 一种印刷体字符图像样本的自动生成方法 |
US9736332B2 (en) * | 2011-11-30 | 2017-08-15 | Hewlett-Packard Indigo B.V. | Automatic detection of corners of an imaged document |
-
2012
- 2012-03-30 CN CN201210091193.7A patent/CN103366165B/zh not_active Expired - Fee Related
-
2013
- 2013-03-25 EP EP13160924.0A patent/EP2645692B1/en active Active
- 2013-03-28 JP JP2013070507A patent/JP6102417B2/ja active Active
- 2013-03-29 US US13/853,544 patent/US9129385B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000020682A (ja) * | 1998-06-30 | 2000-01-21 | Sharp Corp | 画像補正装置 |
JP2008124604A (ja) * | 2006-11-09 | 2008-05-29 | Matsushita Electric Ind Co Ltd | 画像読取装置及びこれを備えた画像形成装置 |
JP2009194762A (ja) * | 2008-02-15 | 2009-08-27 | Murata Mach Ltd | 画像処理装置 |
JP2011181071A (ja) * | 2010-03-01 | 2011-09-15 | Canon Inc | ページ境界を検出する方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
US9129385B2 (en) | 2015-09-08 |
EP2645692A3 (en) | 2016-04-13 |
CN103366165B (zh) | 2016-06-29 |
EP2645692A2 (en) | 2013-10-02 |
EP2645692B1 (en) | 2019-09-18 |
JP6102417B2 (ja) | 2017-03-29 |
CN103366165A (zh) | 2013-10-23 |
US20130259385A1 (en) | 2013-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11468225B2 (en) | Determining functional and descriptive elements of application images for intelligent screen automation | |
JP6102417B2 (ja) | 画像処理装置、画像処理方法及び画像処理デバイス | |
US10095925B1 (en) | Recognizing text in image data | |
US8880540B1 (en) | Method and system for using location transformations to identify objects | |
US9396540B1 (en) | Method and system for identifying anchors for fields using optical character recognition data | |
US10748023B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
US20070041642A1 (en) | Post-ocr image segmentation into spatially separated text zones | |
JP6569500B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2018081674A (ja) | 手書きテキスト画像に対する行及び単語切り出し方法 | |
US10706581B2 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
JP5539488B2 (ja) | 参照背景色に基づく透明化塗りつぶしの判定 | |
CN111062317A (zh) | 一种扫描文档的裁边方法与系统 | |
CN107305682B (zh) | 用于对图像进行拼接的方法和装置 | |
WO2024140094A1 (zh) | 数字文档的段落确定方法、装置、电子设备及存储介质 | |
US9483834B1 (en) | Object boundary detection in an image | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
WO2005096230A1 (en) | Image processing methods and systems | |
JP2011141664A (ja) | 文書比較装置、文書比較方法、及びプログラム | |
JP2021056796A (ja) | 構造認識システム、構造認識装置、構造認識方法、及びプログラム | |
JP6613625B2 (ja) | 画像処理プログラム、画像処理装置、及び画像処理方法 | |
JP2020144719A (ja) | 紙面領域分類装置及びそのプログラム | |
US20230090313A1 (en) | Autonomously removing scan marks from digital documents utilizing content-aware filters | |
WO2016069005A1 (en) | Text line detection | |
JP7508212B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
Panchal et al. | Design and implementation of android application to extract text from images by using tesseract for English and Hindi |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170131 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6102417 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |