JP2016517100A - 直線検出方法、装置、プログラム、及び記録媒体 - Google Patents

直線検出方法、装置、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP2016517100A
JP2016517100A JP2016503537A JP2016503537A JP2016517100A JP 2016517100 A JP2016517100 A JP 2016517100A JP 2016503537 A JP2016503537 A JP 2016503537A JP 2016503537 A JP2016503537 A JP 2016503537A JP 2016517100 A JP2016517100 A JP 2016517100A
Authority
JP
Japan
Prior art keywords
straight line
detection
pixel
candidate
gradient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016503537A
Other languages
English (en)
Other versions
JP6007354B2 (ja
Inventor
百超 王
百超 王
琳 王
琳 王
志▲軍▼ ▲陳▼
志▲軍▼ ▲陳▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Publication of JP2016517100A publication Critical patent/JP2016517100A/ja
Application granted granted Critical
Publication of JP6007354B2 publication Critical patent/JP6007354B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/48Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis

Abstract

本発明は、直線検出方法、装置、プログラム、及び記録媒体に係り、画像処理分野に属する。前記方法は、画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する前記勾配ヒストグラム特徴集合を取得するステップと、各前記ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定するステップと、前記候補方向に基づいて、前記検出待ち直線の精確な方向と位置を特定するステップとを含む。本発明は、関連技術に係る直線検出方法において、境界強度が比較的弱い場合または騒音による干渉が発生する場合、直線が途切れてしまい、検出結果が精確ではない問題を解決でき、本実施例による直線検出方法は、ハフ変換を使用せず、画像の二値化をする必要もないため、二値化による誤差の影響を充分に避け、直線検出の精確度を高めることができる。【選択図】図1

Description

相互参照
本願は、出願番号がCN201410063121.0であって、出願日が2014年2月22日である中国特許出願に基づき優先権を主張し、当該中国特許出願のすべての内容を本願に援用する。
本発明は、画像処理分野に属し、具体的には、直線検出方法、及び装置に関するものである。
直線、及び幾何形状の検出は、画像処理分野の重要な課題の1つである。実際の場面において、大量の直線と幾何形状があるため、快速かつ正確に直線と幾何形状を検出する方法の実現は、画像処理にとって重要な意義を持つ。
幾何形状の検出方法は、通常、直線検出方法に基づくものである。関連技術において、直線検出は、通常ハフ変換(Hough Transform)方法を用いる。ハフ変換では、画像とデュアル関係を持つパラメータ空間が定義され、画像における1本の直線がパラメータ空間における1つの点に対応し、画像における1つの点がパラメータ空間における1本の正弦曲線に対応する。上記の対応関係により、画像における1本の直線上の幾つかの共線点がパラメータ空間において同一点で交差する複数本の正弦曲線に対応することが分かる。それゆえ、画像における共線点が最多である直線を検出することは、パラメータ空間において同一点で交差する正弦曲線の数が最多であるピーク点の検出問題に変わり、当該ピーク点に対応する直線が、画像中の検出しようとする直線になる。
発明者は、本発明を実現する際に、上記方式に少なくとも下記のデメリットが存在することが分かった。すなわち、上記のハフ変換に基づく直線検出方法では、画像から幾つかの共線点をサンプリングする必要があるため、まず画像を二値化する必要があり、つまり黒、白ピクセルからなる二値画像を取得し、それから二値画像において幾つかの共線点をサンプリングする。しかし、画像の二値化は、パラメータに対して比較的敏感に反応するため、それは、境界強度が比較的強い直線、即ち直線の階調値と画像におけるほかの領域の階調値に明らかな差が存在する直線の検出のみに適用され、境界強度が比較的弱い場合またはノイズによる干渉が発生する場合、直線が途切れてしまい、検出結果の正確度を大きく影響する。
関連技術に係る直線検出方法において、境界強度が比較的弱い場合またはノイズによる干渉が発生する場合、直線が途切れてしまい、検出結果が正確ではない問題を解決するために、本発明の実施例は、直線検出方法、及び装置を提供する。
本発明の実施例の第1の態様によると、直線検出方法を提供する。当該方法は、画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する勾配ヒストグラム特徴集合を取得するステップと、各前記ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定するステップと、前記候補方向に基づいて、前記検出待ち直線の精確な方向と位置を特定するステップとを含む。
画像における各ピクセルの勾配ヒストグラム特徴集合を取得するステップは、各前記ピクセル(i,j)について、前記ピクセルのK(K≧2)個の方向における方向勾配値を含む方向勾配集合g(i,j)を計算するステップと、前記ピクセルの方向勾配集合g(i,j)に基づいて、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)を計算するステップとを含み、前記ピクセルの任意の方向における方向勾配値は、当該方向における前記ピクセルと隣接ピクセルとの間の階調値の差の絶対値であってもよい。
前記ピクセルの方向勾配集合g(i,j)に基づいて、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)を計算するステップは、前記ピクセルの前記K個の方向における局部領域勾配値
Figure 2016517100
をそれぞれ計算するステップと、前記ピクセルの平均勾配値hnorm(i,j)を計算するステップと、前記局部領域勾配値
Figure 2016517100
を前記平均勾配値hnorm(i,j)で除算して、前記ピクセルのk方向における勾配ヒストグラム特徴h(i,j)を取得するステップと、前記K個の方向における勾配ヒストグラム特徴の集合を前記ピクセルの勾配ヒストグラム特徴集合h(i,j)と特定するステップとを含み、ピクセルのk方向における局部領域勾配値
Figure 2016517100
は、前記ピクセルが位置する局部領域内の全てのピクセルの前記k方向における方向勾配値の和であり、kは、方向を表し、前記平均勾配値hnorm(i,j)は、前記ピクセルの各前記局部領域勾配値
Figure 2016517100
の平方和のルートであってもよい。
前記方法は、各前記ピクセル(i,j)について、前記平均勾配値hnorm(i,j)が所定の平均値Tnormより小さいか否かを検出するステップと、検出した結果、前記平均勾配値hnorm(i,j)が前記所定の平均値Tnormより小さい場合、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)のうちの各勾配ヒストグラム特徴を0にリセットするステップとをさらに含んでもよい。
各前記ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定するステップは、各前記ピクセルについて、前記勾配ヒストグラム特徴集合において数値が最大である勾配ヒストグラム特徴に対応する方向を前記ピクセルが位置する局部領域の主方向として選択するステップと、
各前記ピクセルが位置する局部領域の主方向の、前記K個の方向における投票数を統計するステップと、前記投票数が投票閾値を超える方向に直交する方向を前記検出待ち直線の候補方向として選択するステップとを含んでもよい。
前記候補方向に基づいて、前記検出待ち直線の精確な方向と位置を特定するステップは、各前記候補方向について、前記候補方向に平行な少なくとも1本の走査線を生成するステップと、各走査線について、前記走査線と前記検出待ち直線との類似度を反映する前記走査線のマッチング距離をそれぞれ計算するステップと、マッチング距離が最小である前記走査線を候補直線として選択するステップと、前記候補直線に基づいて、前記検出待ち直線の精確な方向と位置を特定するステップとを含んでもよい。
各走査線のマッチング距離をそれぞれ計算するステップは、各前記走査線について、前記走査線上でn(n≧1)個のサンプリング点をサンプリングして取得するステップと、各前記サンプリング点の勾配ヒストグラム特徴集合と、前記候補方向に直交する方向におけるテンプレート勾配ヒストグラム特徴集合との間のマッチング距離を計算するステップと、前記n個のサンプリング点のマッチング距離を加算して前記走査線のマッチング距離を得るステップとを含んでもよい。
前記候補直線に基づいて、前記検出待ち直線の精確な方向と位置を特定するステップは、前記候補直線を中心軸線として、所定の大きさの矩形領域を生成するステップと、前記矩形領域の前記候補直線に直交する直線の両側でそれぞれu(u≧1)個とv(v≧1)個の点を選択し、両側の点を2つずつ連結してu*v本の線分を取得するステップと、前記u*v本の線分のうちの各線分について、前記線分と前記検出待ち直線との類似度を反映するマッチング距離をそれぞれ計算するステップと、マッチング距離が最小である線分の属する直線を前記検出待ち直線として選択するステップとを含んでもよい。
前記方法は、任意の前記検出待ち直線について、第1の所定条件を満たす第2の検出待ち直線が前記画像に存在するか否かを検出するステップと、検出した結果、前記第1の所定条件を満たす第2の検出待ち直線が存在する場合、前記第2の検出待ち直線を候補直線集合に追加するステップと、前記候補直線集合における任意2本の前記第2の検出待ち直線について、第2の所定条件を満たす第3の検出待ち直線が存在するか否かを検出するステップと、検出した結果、前記第2の所定条件を満たす第3の検出待ち直線が存在する場合、前記検出待ち直線、2本の前記第2の検出待ち直線および前記第3の検出待ち直線からなる四角形を候補矩形集合に追加するステップと、前記候補矩形集合における各四角形について、前記四角形と検出待ち矩形との類似度を反映する前記四角形のマッチング距離を計算するステップと、マッチング距離が最小である四角形、または、マッチング距離がマッチング閾値より小さい四角形を前記検出待ち矩形と特定するステップとをさらに含み、前記第1の所定条件は、前記第2の検出待ち直線と前記検出待ち直線との交点が前記画像内にあり、かつ両者がなす角度が角度閾値より小さい、という条件を含み、前記第2の所定条件は、前記第3の検出待ち直線が前記検出待ち直線と異なり、前記第3の検出待ち直線が2本の前記第2の検出待ち直線のいずれとも交差し、かつ2つの交点のいずれもが前記画像内にある、という条件を含み、前記四角形のマッチング距離は、前記四角形の四辺に対応する線分のマッチング距離の和であってもよい。
本発明の実施例の第2の態様によると、直線検出装置を提供する。当該装置は、画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する勾配ヒストグラム特徴集合を取得するための特徴取得モジュールと、各前記ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定するための候補特定モジュールと、前記候補方向に基づいて、前記検出待ち直線の精確な方向と位置を特定するための精確特定モジュールとを含む。
前記特徴取得モジュールは、各前記ピクセル(i,j)について、前記ピクセルのK(K≧2)個の方向における方向勾配値を含む方向勾配集合g(i,j)を計算するための勾配計算ユニットと、前記ピクセルの方向勾配集合g(i,j)に基づいて、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)を計算するための特徴計算ユニットとを含み、前記ピクセルの任意の方向における方向勾配値は、当該方向における前記ピクセルと隣接ピクセルとの間の階調値の差の絶対値であってもよい。
前記特徴計算ユニットは、前記ピクセルの前記K個の方向における局部領域勾配値
Figure 2016517100
をそれぞれ計算するための局部領域勾配サブユニットと、前記ピクセルの平均勾配値hnorm(i,j)を計算するための平均勾配サブユニットと、前記局部領域勾配値
Figure 2016517100
を前記平均勾配値hnorm(i,j)で除算して、前記ピクセルのk方向における勾配ヒストグラム特徴h(i,j)を取得するための特徴計算サブユニットと、前記K個の方向における勾配ヒストグラム特徴の集合を前記ピクセルの勾配ヒストグラム特徴集合h(i,j)と特定するための特徴特定サブユニットとを含み、ピクセルのk方向における局部領域勾配値
Figure 2016517100
は、前記ピクセルが位置する局部領域内の全てのピクセルの前記k方向における方向勾配値の和であり、kは、方向を表し、前記平均勾配値hnorm(i,j)は、前記ピクセルの各前記局部領域勾配値
Figure 2016517100
の平方和のルートであってもよい。
前記装置は、各前記ピクセル(i,j)について、前記平均勾配値hnorm(i,j)が所定の平均値Tnormより小さいか否かを検出するための平均検出サブユニットと、検出した結果、前記平均勾配値hnorm(i,j)が前記所定の平均値Tnormより小さい場合、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)のうちの各勾配ヒストグラム特徴を0にリセットするための特徴リセットサブユニットとをさらに含んでもよい。
前記候補特定モジュールは、各前記ピクセルについて、前記勾配ヒストグラム特徴集合において数値が最大である勾配ヒストグラム特徴に対応する方向を前記ピクセルが位置する局部領域の主方向として選択するための方向選択ユニットと、
各前記ピクセルが位置する局部領域の主方向の、前記K個の方向における投票数を統計するための投票統計ユニットと、前記投票数が投票閾値を超える方向に直交する方向を前記検出待ち直線の候補方向として選択するための候補選択ユニットとを含んでもよい。
前記精確特定モジュールは、各前記候補方向について、前記候補方向に平行な少なくとも1本の走査線を生成するための走査生成ユニットと、各走査線について、前記走査線と前記検出待ち直線との類似度を反映する前記走査線のマッチング距離をそれぞれ計算するための走査マッチングユニットと、マッチング距離が最小である前記走査線を候補直線として選択するための走査選択ユニットと、前記候補直線に基づいて、前記検出待ち直線の精確な方向と位置を特定するための精確特定ユニットとを含んでもよい。
前記走査マッチングユニットは、各前記走査線について、前記走査線上でn(n≧1)個のサンプリング点をサンプリングして取得するためのサンプリング取得サブユニットと、各前記サンプリング点の勾配ヒストグラム特徴集合と、前記候補方向に直交する方向におけるテンプレート勾配ヒストグラム特徴集合との間のマッチング距離を計算するためのサンプリングマッチングサブユニットと、前記n個のサンプリング点のマッチング距離を加算して前記走査線のマッチング距離を得るためのサンプリング加算サブユニットとを含んでもよい。
前記精確特定ユニットは、前記候補直線を中心軸線として、所定の大きさの矩形領域を生成するための矩形生成サブユニットと、前記矩形領域の前記候補直線に直交する直線の両側でそれぞれu(u≧1)個とv(v≧1)個の点を選択し、両側の点を2つずつ連結してu*v本の線分を取得するための線分生成サブユニットと、前記u*v本の線分のうちの各線分について、前記線分と前記検出待ち直線との類似度を反映するマッチング距離をそれぞれ計算するための線分マッチングサブユニットと、マッチング距離が最小である線分の属する直線を前記検出待ち直線として選択するための線分選択サブユニットとを含んでもよい。
前記装置は、任意の前記検出待ち直線について、第1の所定条件を満たす第2の検出待ち直線が前記画像に存在するか否かを検出するための第1の検出モジュールと、検出した結果、前記第1の所定条件を満たす第2の検出待ち直線が存在する場合、前記第2の検出待ち直線を候補直線集合に追加するための直線候補モジュールと、前記候補直線集合における任意2本の前記第2の検出待ち直線について、第2の所定条件を満たす第3の検出待ち直線が存在するか否かを検出するための第2の検出モジュールと、検出した結果、前記第2の所定条件を満たす第3の検出待ち直線が存在する場合、前記検出待ち直線、2本の前記第2の検出待ち直線および前記第3の検出待ち直線からなる四角形を候補矩形集合に追加するための矩形候補モジュールと、前記候補矩形集合における各四角形について、前記四角形と検出待ち矩形との類似度を反映する前記四角形のマッチング距離を計算するためのマッチング計算モジュールと、マッチング距離が最小である四角形、または、マッチング距離がマッチング閾値より小さい四角形を前記検出待ち矩形と特定するための矩形特定モジュールとをさらに含み、前記第1の所定条件は、前記第2の検出待ち直線と前記検出待ち直線との交点が前記画像内にあり、かつ両者がなす角度が角度閾値より小さい、という条件を含み、前記第2の所定条件は、前記第3の検出待ち直線が前記検出待ち直線と異なり、前記第3の検出待ち直線が2本の前記第2の検出待ち直線のいずれとも交差し、かつ2つの交点のいずれもが前記画像内にある、という条件を含み、前記四角形のマッチング距離は、前記四角形の四辺に対応する線分のマッチング距離の和であってもよい。
本発明の実施例による技術案は、以下の有益な効果がある。
画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部の直線特性を反映する勾配ヒストグラム特徴集合を取得し、各ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定し、候補方向に基づいて、検出待ち直線の精確な方向と位置を特定することによって、関連技術に係る直線検出方法において、境界強度が比較的弱い場合または騒音による干渉が発生する場合、直線が途切れてしまい、検出結果が精確ではない問題を解決でき、背景技術で言及した関連直線検出方法に比べて、本実施例による直線検出方法は、ハフ変換を使用せず、画像の二値化をする必要もないため、二値化による誤差の影響を充分に避け、直線検出の精確度を高めることができる。
理解すべきことは、以上の概要の記述と以下の詳細記述は、単に例示的なものであり、本発明を限定するものではない。
ここの図面は、明細書に組み入れて本明細書の一部分を構成し、本発明に該当する実施例を例示するとともに、明細書とともに本発明の原理を解釈するために用いられる。
本発明の実施例をより明らかに説明するために、以下、実施例の記述に用いられる図面について簡単に紹介する。以下の記述における図面は、単に本発明の一部の実施例であり、本分野の一般技術者にとって、創造性のある労働を付さなくてもこれらの図面から他の図面を取得できることは明らかである。
一例示的な実施例による直線検出方法のフロー図である。 別の例示的な実施例による直線検出方法のフロー図である。 別の例示的な実施例による直線検出方法の特徴計算工程を示す模式図である。 別の例示的な実施例による直線検出方法の直線選択工程を示す模式図である。 一例示的な実施例による直線検出装置の模式図である。 別の例示的な実施例による直線検出装置の模式図である。 一例示的な実施例による直線検出用装置のブロック図である。
以上の図面を通じて、本発明の実施例を例示しているが、そのさらに具体的な内容については後述する。これらの図面及び文字記載は、本発明の趣旨の範囲を限定するためのものではなく、特定の実施例を参照として、当業者に本発明のコンセプトを理解させるためのものである。
本発明の目的、技術案、及び利点をより明らかにするために、以下、図面とともに本発明についてさらに詳細に記載する。記載する実施例は、単に本発明の一部の実施例であり、全ての実施例ではないことは明らかである。本発明の実施例に基づいて、本分野の一般技術者が創造性のある労働を付さない前提で取得した全てのほかの実施例は、いずれも本発明の保護範囲に属するものである。
まず、説明すべきことは、本発明に係る電子装置は、携帯電話、タブレットPC、電子書籍リーダ、MP3(Moving Picture Experts Group Audio Layer III)プレイヤ、MP4(Moving Picture Experts Group Audio Layer IV)プレイヤ、ポータブルラップトップコンピュータ、およびデスクトップコンピュータなどである。同時に、電子装置は、例えばカメラなどの画像採集部品を含む。
図1は、一例示的な実施例による直線検出方法のフロー図である。本実施例は、当該直線検出方法が電子装置に応用されることを例として説明する。当該直線検出方法は、下記ステップを含む。
ステップ102において、画像における各ピクセルの勾配ヒストグラム特徴集合を取得する。勾配ヒストグラム特徴集合は、ピクセルが位置する局部領域の直線特性を反映する。
ステップ104において、各ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定する。
ステップ106において、候補方向に基づいて、検出待ち直線の精確な方向と位置を特定する。
上記記載をまとめると、本実施例による直線検出方法は、画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する勾配ヒストグラム特徴集合を取得し、各ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定し、その後、候補方向に基づいて、検出待ち直線の精確な方向と位置を特定することによって、関連技術に係る直線検出方法において、境界強度が比較的弱い場合またはノイズによる干渉が発生する場合、直線が途切れてしまい、検出結果が正確ではない問題を解決でき、背景技術で言及した関連する直線検出方法に比べて、本実施例による直線検出方法は、ハフ変換を使用せず、画像の二値化をする必要もないため、二値化による誤差の影響を充分に避け、直線検出の正確度を高めることができる。
図2Aは、別の例示的な実施例による直線検出方法のフロー図である。本実施例は、当該直線検出方法を電子装置に応用することを例として説明する。当該直線検出方法は、下記ステップを含む。
ステップ201において、画像のグレースケール画像(grayscale image)を生成する。
直線の検出を行う前に、電子装置は、まず、採集した画像に対して階調化を行って、画像のグレースケール画像を生成する。階調は、256階調に分けられ、任意のピクセル(i,j)の階調値は、I(i,j)∈[0,255]である。
ステップ202において、画像における各ピクセルの勾配ヒストグラム特徴集合を取得する。
電子装置は、画像における各ピクセルの勾配ヒストグラム特徴集合を取得する。勾配ヒストグラム特徴集合は、ピクセルが位置する局部領域の直線特性を反映する。
本ステップは、下記の2つのサブステップを含んでもよい。
(1)ピクセル(i,j)ごとに、ピクセルの方向勾配集合g(i,j)を計算する。
電子装置は、ピクセル(i,j)ごとに、ピクセルの方向勾配集合g(i,j)を計算する。1つのピクセルの方向勾配集合は、当該ピクセルのK(K≧2)個の方向における方向勾配値を含む。ピクセルの任意の方向における方向勾配値は、当該方向において当該ピクセルと隣接ピクセルとの間の階調値の差の絶対値である。Kの値は、実際の需要に応じて予め定められ、Kの値が大きくなるほど、直線検出の結果が精確になる。計算量軽減のために、通常、Kの値は、4、または8である。
図2Bに示されたように、大きさがM*N(MとNは、それぞれ、画像Iの水平方向と垂直方向におけるピクセル数を示し、M≧1、N≧1)である画像Iがあるとする。画像における任意のピクセル(i,j)(i∈[0,M],j∈[0,N])について、その対応する方向勾配集合をg(i,j)と記する。
同時にK=4とする。当該4個の方向は、それぞれ、水平方向と0°、45°、90°、135°の角度をなす方向であり、且つピクセル(i,j)の上記4個の方向における方向勾配値をそれぞれg(i,j)、g45(i,j)、g90(i,j)、g135(i,j)と記する。
すると、g(i,j)={g(i,j),g45(i,j),g90(i,j),g135(i,j)}である。
ここで、
(i,j)=|I(i+1,j)−I(i,j)|
45(i,j)=|I(i−1,j−1)−I(i,j)|
90(i,j)=|I(i,j−1)−I(i,j)|
135(i,j)=|I(i+1,j−1)−I(i,j)|
I(i,j)は、ピクセル(i,j)の階調値を示し、I(i,j)∈[0,255]である。
実際の応用時に、画像における境界ピクセルは考慮しなくてもよい。境界ピクセルとは、画像の周縁のピクセルであり、例えば、図2Bにおいて黒色ボックス21以外の領域に位置するピクセルである。
(2)ピクセルの方向勾配集合g(i,j)に基づいて、当該ピクセルの勾配ヒストグラム特徴集合h(i,j)を計算する。
電子装置は、ピクセルの方向勾配集合g(i,j)に基づいて、当該ピクセルの勾配ヒストグラム特徴集合h(i,j)を計算する。
まず理解すべきところは、画像に1本の直線が存在する場合、直線方向に沿って、各ピクセルの階調値の変化は、緩やかであるか一定である。一方、直線方向に直交する方向においては、各ピクセルの階調値は急に変化する。正にこの特性を利用して、ピクセルの方向勾配集合g(i,j)を求めた後に、ピクセルの勾配ヒストグラム特徴集合h(i,j)を導入する。
ピクセルの勾配ヒストグラム特徴集合h(i,j)は、ピクセルが位置する局部領域の直線特性を反映する。当該直線特性は、ピクセルが位置する局部領域に、検出待ち直線が存在するかのこと、及び検出待ち直線の大体の方向のうちの一つまたは二つすべてを含む。ここで、検出待ち直線の大体の方向とは、検出待ち直線に近接する方向である。例えば、検出待ち直線に近接する方向が45°の近隣範囲である場合、検出待ち直線の大体の方向は45°である。
上記サブステップ(2)は、さらに下記の複数のサブステップを含む。
(1)ピクセルのK個の方向における局部領域勾配値
Figure 2016517100
をそれぞれ計算する。
電子装置は、ピクセルのK個の方向における局部領域勾配値
Figure 2016517100
をそれぞれ計算する。ここで、kは、方向を示す。ピクセル(i,j)のk方向における局部領域勾配値
Figure 2016517100
は、ピクセルが位置する局部領域に位置する全てのピクセルのk方向における方向勾配値の和である。本実施例では、次の式が成立する。
Figure 2016517100
ここで、Rは、平均半径であり、その値は、実際の需要に応じて予め定められ、例えばR=4である。図2Bを参照すると、Rの値により、ピクセル(i,j)が位置する局部領域22の範囲も決められる。ピクセル(i,j)が位置する局部領域22に含まれるピクセルの数は、(2R+1)*(2R+1)である。例えば、R=4の場合、ピクセル(i,j)が位置する局部領域22の範囲は、ピクセル(i,j)を中心として9*9=81個のピクセルからなる領域である。
(2)ピクセルの平均勾配値hnorm(i,j)を計算する。
電子装置は、ピクセルの平均勾配値hnorm(i,j)を計算する。平均勾配値hnorm(i,j)は、ピクセルの各局部領域勾配値
Figure 2016517100
の平方和のルートである。本実施例では、次の式が成立する。
Figure 2016517100
(3)局部領域勾配値
Figure 2016517100
を平均勾配値hnorm(i,j)で除算して、ピクセルのk方向における勾配ヒストグラム特徴h(i,j)を得る。
電子装置は、局部領域勾配値
Figure 2016517100
を平均勾配値hnorm(i,j)で除算して、ピクセルのk方向における勾配ヒストグラム特徴h(i,j)を得る。本実施例では、次の式が成立する。
Figure 2016517100
(4)K個の方向における勾配ヒストグラム特徴の集合をピクセルの勾配ヒストグラム特徴集合h(i,j)とする。
電子装置は、K個の方向における勾配ヒストグラム特徴の集合をピクセルの勾配ヒストグラム特徴集合h(i,j)とする。ピクセル(i,j)の勾配ヒストグラム特徴集合をh(i,j)と記する。勾配ヒストグラム特徴集合h(i,j)は、ピクセル(i,j)のK個の方向における勾配ヒストグラム特徴を含む。本実施例では、次の式が成立する。
h(i,j)={h(i,j),h45(i,j),h90(i,j),h135(i,j)}
これから分かるように、h(i,j)の値が大きいほど、k方向に沿って各ピクセルの階調値の変化が明らかであり、急な変化がある可能性が大いにある。これにより、k方向に直交する方向が検出待ち直線の大体の方向であると推測できる。
なお、説明しておくべきことは、ノイズまたは光照射などの要素による干渉を低減するとともに計算量を削減するために、ピクセルの平均勾配値hnorm(i,j)を計算した後に、さらに、平均勾配値hnorm(i,j)が所定の平均値Tnormより小さいか否かを検出してもよい。検出した結果、平均勾配値hnorm(i,j)が所定の平均値Tnormより小さい場合、ピクセルの勾配ヒストグラム特徴集合h(i,j)の各勾配ヒストグラム特徴を0にリセットする。所定の平均値Tnormは、ピクセルが位置する局部領域の各方向における全体的な勾配状況を反映するものであり、また、hnorm(i,j)が比較的小さい場合、当該局部領域内の境界強度が弱いことを示しているが、これは、当該局部領域内の検出待ち直線の存在に起因する隣接ピクセル同士の階調の変化によるものではなく、ノイズまたは光照射などの要因要素に起因する隣接ピクセル同士の階調の変化によるものであり得るため、hnorm(i,j)が所定の平均値Tnormより小さい場合は、ピクセルの勾配ヒストグラム特徴集合h(i,j)の各勾配ヒストグラム特徴を0にリセットする。
ステップ203において、各ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定する。
電子装置は、各ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定する。
本ステップは、下記の複数のサブステップを含んでもよい。
(1)ピクセルごとに、勾配ヒストグラム特徴集合において数値が最大である勾配ヒストグラム特徴に対応する方向を選択して、ピクセルが位置する局部領域の主方向とする。
ステップ202で紹介したように、h(i,j)の値が大きいほど、k方向に沿って各ピクセルの階調値の変化が明らかであり、急に変化する可能性が大いにある。これにより、k方向に直交する方向が検出待ち直線の大体の方向であると推測できる。
したがって、電子装置は、勾配ヒストグラム特徴集合h(i,j)において数値が最大である勾配ヒストグラム特徴に対応する方向を選択して、ピクセルが位置する局部領域の主方向とする。当該主方向は、局部領域における直線の方向と略直交する。
(2)各ピクセルが位置する局部領域の主方向の、K個の方向における投票数を統計する。
電子装置は、画像における各ピクセルが位置する局部領域の主方向を特定した後に、画像全体に亘って、各ピクセルが位置する局部領域の主方向の、K個の方向における投票数を統計する。
たとえば、当該統計結果は、a個のピクセルが位置する局部領域の主方向が0°であり、b個のピクセルが位置する局部領域の主方向が45°であり、c個のピクセルが位置する局部領域の主方向が90°であり、d個のピクセルが位置する局部領域の主方向が135°である、という結果である。ここで、a、b、c、dは、画像全体に亘って統計して得られた4個の方向上の統計数であり、b>a>c>dであるとする。
(3)投票数が投票閾値を超える方向に直交する方向を選択して、検出待ち直線の候補方向とする。
電子装置は、各ピクセルが位置する局部領域の主方向の、K個の方向における投票数を統計した後に、各方向での投票数が投票閾値より大きいか否かを検出する。実際の応用中に、投票閾値の大きさは、画像の大きさ、電子装置のデータ処理能力、及び直線検出精度に対する要求などの要素を総合的に考慮した上で定められる。
その後、電子装置は、投票数が投票閾値を超える少なくとも1つの方向を選別し、選別した方向に直交する方向を検出待ち直線の候補方向とする。投票数が投票閾値を超える方向は、画像における各局部領域の主方向を反映し、各局部領域の主方向が画像における直線に略直交するため、投票数が投票閾値を超える方向に直交する方向を選択して、検出待ち直線の候補方向とする必要がある。
本ステップによって、通常、K個の方向から1〜2個の方向を選別して検出待ち直線の候補方向とする。後続ステップにおいて、電子装置は、コーススケール(coarse scale)及びファインスケール(fine scale)の計算及び分析によって、最終的に検出待ち直線の精確な方向と位置を特定する。
本実施例では、b>投票閾値>a>c>dとする。投票数bに対応する主方向が45°であるため、135°方向を検出待ち直線の候補方向とする。
ステップ204において、候補方向ごとに、当該候補方向に平行な少なくとも1本の走査線を生成する。
電子装置は、候補方向ごとに、当該候補方向に平行な少なくとも1本の走査線を生成する。図2Cを参照すると、大きさがM*Nである画像における直線Lが図示されている。上記ステップ201〜ステップ203を経て、検出待ち直線の候補方向が135°であると特定できる。方向が135°である走査線26は、画像全体にわたる。互いに隣り合う走査線26同士の距離は、画像の大きさ、電子装置のデータ処理能力、及び直線検出精度に対する要求などの要素を総合的に考慮した上で定められる。
ステップ205において、各走査線のマッチング距離をそれぞれ計算する。
電子装置は、各走査線のマッチング距離をそれぞれ計算する。走査線のマッチング距離は、走査線と検出待ち直線との類似度を反映する。例えば、本ステップは、下記の複数のサブステップを含む。
(1)走査線ごとに、走査線においてn(n≧1)個のサンプリング点をサンプリングして得る。
電子装置は、走査線ごとに、走査線においてn(n≧1)個のサンプリング点をサンプリングして得る。選択的に、電子装置は、走査線ごとに、均一にn個のサンプリング点をサンプリングして取得する。図2Cに示されたように、本実施例では、電子装置が走査線ごとに均一に10個のサンプリング点27をサンプリングして取得するとする。
(2)各サンプリング点の勾配ヒストグラム特徴集合と、候補方向に直交する方向におけるテンプレート勾配ヒストグラム特徴集合との間のマッチング距離を計算する。
電子装置は、各サンプリング点の勾配ヒストグラム特徴集合と、候補方向に直交する方向におけるテンプレート勾配ヒストグラム特徴集合との間のマッチング距離を計算する。上記ステップ202において、電子装置は、既に画像における各ピクセルの勾配ヒストグラム特徴集合を取得している。このとき、電子装置は、各サンプリング点の座標に基づいて、各ピクセルの勾配ヒストグラム特徴集合から、各サンプリング点の勾配ヒストグラム特徴集合を検索して取得する。
テンプレート勾配ヒストグラム特徴集合をTemplate(s∈{0,45,90,135})と記する。ある可能な実施形態において、下記のようになる。
Template={1,0,0,0}
Template45={0,1,0,0}
Template90={0,0,1,0}
Template135={0,0,0,1}
また、本実施例において、取得したn個のサンプリング点をそれぞれ(x,y)、(x,y)、…、(x,y)、…、(xn−1,yn−1)とする。すると、サンプリング点(x,y)の勾配ヒストグラム特徴集合と、候補方向に直交する方向におけるテンプレート勾配ヒストグラム特徴集合とのマッチング距離は、dist[h(x,y),Template]=dist[h(x,y),Template45]=|h(x,y)−0|+|h45(x,y)−1|+|h90(x,y)−0|+|h135(x,y)−0|となる。
(3)n個のサンプリング点のマッチング距離を加算して走査線のマッチング距離を得る。
電子装置は、n個のサンプリング点のマッチング距離を加算して走査線のマッチング距離を得る。走査線のマッチング距離は、
Figure 2016517100

となる。
ステップ206において、マッチング距離が最小である走査線を選択して候補直線とする。
電子装置は、各走査線のマッチング距離を算出した後に、マッチング距離が最小である走査線を選択して候補直線とする。図3Cに示されたように、本実施例において、OとPの2点を通る走査線を、マッチング距離が最小である走査線とする。すなわち、OとPの2点を通る走査線を、候補直線とする。
図面から分かるように、候補直線の特定後に、検出待ち直線Lの画像における大体の位置をほぼ特定できる。その後、後続ステップ207での細かいスケールの計算、分析により、検出待ち直線Lの画像における精確な方向と位置を最終的に特定する。
ステップ207において、候補直線に基づいて、検出待ち直線の具体的な方向と位置を特定する。
電子装置は、候補直線に基づいて、検出待ち直線の具体的な方向と位置を特定する。
本ステップは、下記の複数のサブステップを含んでもよい。
(1)候補直線を中心軸線として、所定の大きさの矩形領域を生成する。
電子装置は、候補直線を中心軸線として、所定の大きさの矩形領域を生成する。図3Cに示されたように、候補直線の上でO、Pの2点を選択し、線分OPの長さは矩形領域の長さとなる。実際の応用中に、線分OPの長さは、その値をなるべく大きめに取ることが望ましい。その後、それぞれO、Pの2点を通って、候補直線の垂直線ABとCDを描く。ここで、Oは、ABの中心点になり、Pは、CDの中心点になる。線分AB、CDの長さは、矩形領域の幅となる。実際の応用中に、線分AB、CDの長さは、互いに隣り合う走査線同士の距離の2倍を取ることができる。
(2)矩形領域において、候補直線に直交する直線の両側でそれぞれu(u≧1)個とv(v≧1)個の点を選択し、両側の点を2つずつ連結してu*v本の線分を得る(すなわち、候補直線に直交する直線の一側の各点をもう一側の各点各々と連結してu*v本の線分を得る)。
通常、uとvは、例えばu=v=8のように、同一の値を取ることができる。このとき、両側上の点を2つずつ連結して8*8=64本の線分を得ることができる。
(3)u*v本の線分のうちの各線分のマッチング距離をそれぞれ計算する。
電子装置は、u*v本の線分のうちの各線分のマッチング距離をそれぞれ計算する。線分のマッチング距離は、線分と検出待ち直線との類似度を反映する。線分のマッチング距離が小さいほど、線分と検出待ち直線とが類似する。逆に、線分のマッチング距離が大きいほど、線分と検出待ち直線とがより大きくずれていることになる。
走査線のマッチング距離の計算と同様に、u*v本の線分のうちの各線分について、幾つかのサンプリング点をサンプリングして取得し、各サンプリング点の勾配ヒストグラム特徴集合と、線分の実際方向上のテンプレート勾配ヒストグラム特徴集合との間のマッチング距離を計算し、n個のサンプリング点のマッチング距離を加算して線分のマッチング距離を得る。但し、線分の実際方向上のテンプレート勾配ヒストグラム特徴集合において、線分のK個の方向での投影距離に基づいて、テンプレート勾配ヒストグラム特徴集合における各勾配ヒストグラム特徴の大きさをその重みに従って割り当てる。
(4)マッチング距離が最小である線分の属する直線を選択して検出待ち直線とする。
電子装置は、各線分のマッチング距離を算出した後に、マッチング距離が最小である線分の属する直線を選択して検出待ち直線とする。
もちろん、電子装置の計算処理力の許容範囲内で、uとvの値を大きめに取ることができ、これにより、検出待ち直線の精確な方向と位置をより精確に特定できる。
上記ステップ201〜ステップ207では、画像における直線の検出を詳細に紹介した。背景技術で言及した関連する直線検出方法に比べて、本実施例による直線検出方法は、ハフ変換を使用せず、画像の二値化をする必要もないため、二値化による誤差の影響を充分に避け、直線検出の精確度を高めることができる。以下、本実施例による直線検出方法に基づいて如何に画像における矩形を検出するかについて具体的に紹介する。
ステップ208において、任意の検出待ち直線について、第1の所定条件を満たす第2の検出待ち直線が画像に存在するか否かを検出する。
電子装置は、任意の検出待ち直線について、第1の所定条件を満たす第2の検出待ち直線が画像に存在するか否かを検出する。電子装置が画像から第2の検出待ち直線を検出する方法は、上記ステップ201〜ステップ207の直線検出方法を参照すればよい。第2の検出待ち直線の検出後に、引き続き各第2の検出待ち直線が第1の所定条件を満たすか否かを検出する。第1の所定条件は、第2の検出待ち直線と検出待ち直線との交点が画像内にあり、かつ両者がなす角度が角度閾値より小さい、という条件を含む。
両直線がなす角度は、下記式によって計算できる。
角度θ=|arctan(aL1)−arctan(aL2)|
ここで、aL1とaL2は、それぞれ直線L1と直線L2の傾きである。角度の閾値は、例えば3ラジアンのように、大まかに定められればよい。
ステップ209において、検出した結果、第1の所定条件を満たす第2の検出待ち直線が存在する場合、第2の検出待ち直線を候補直線集合に追加する。
検出した結果、第1の所定条件を満たす第2の検出待ち直線が存在する場合、電子装置は、第2の検出待ち直線を検出待ち直線の候補直線集合に追加する。検出待ち直線の候補直線集合には、第1の所定条件を満たすすべての第2の検出待ち直線が含まれる。
ステップ210において、候補直線集合における任意2本の第2の検出待ち直線について、第2の所定条件を満たす第3の検出待ち直線が存在するか否かを検出する。
電子装置は、候補直線集合における任意2本の第2の検出待ち直線について、第2の所定条件を満たす第3の検出待ち直線が存在するか否かを検出する。第2の所定条件は、第3の検出待ち直線が検出待ち直線と異なり、第3の検出待ち直線が2本の第2の検出待ち直線の両方と交差し、かつ2つの交点のいずれもが画像内にある、という条件を含む。
ステップ211において、検出した結果、第2の所定条件を満たす第3の検出待ち直線が存在する場合、検出待ち直線、2本の第2の検出待ち直線および第3の検出待ち直線からなる四角形を候補矩形集合に追加する。
検出した結果、第2の所定条件を満たす第3の検出待ち直線が存在する場合、電子装置は、検出待ち直線、2本の第2の検出待ち直線および第3の検出待ち直線からなる四角形を候補矩形集合に追加する。候補矩形集合には、検出待ち矩形の可能性がある全ての四角形が含まれる。
ステップ212において、候補矩形集合における各四角形について、四角形のマッチング距離を計算する。
電子装置は、候補矩形集合における各四角形について、四角形のマッチング距離を計算する。四角形のマッチング距離は、四角形と検出待ち矩形との類似度を反映する。四角形のマッチング距離が小さいほど、四角形が検出待ち矩形と類似することを示し、逆に、四角形のマッチング距離が大きいほど、四角形と検出待ち矩形の形状がずれていることを示す。
四角形のマッチング距離は、四角形の四辺に対応する線分のマッチング距離の和である。ここで、四角形の任意の辺に対応する線分のマッチング距離は、上記のステップ207におけるサブステップ(3)での方法を参照すればよく、ここでは繰り返して説明しない。
ステップ213において、マッチング距離が最小である四角形、または、マッチング距離がマッチング閾値より小さい四角形を検出待ち矩形と特定する。
電子装置は、マッチング距離が最小である四角形、または、マッチング距離がマッチング閾値より小さい四角形を検出待ち矩形と特定する。
上記記載をまとめると、本実施例による直線検出方法は、画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する前記勾配ヒストグラム特徴集合を取得し、各ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定し、その後、候補方向に基づいて、検出待ち直線の精確な方向と位置を特定することによって、関連技術に係る直線検出方法において、境界強度が比較的弱い場合またはノイズによる干渉が発生する場合、直線が途切れてしまい、検出結果が正確ではない問題を解決でき、背景技術で言及した関連する直線検出方法に比べて、本実施例による直線検出方法は、ハフ変換を使用せず、画像の二値化をする必要もないため、二値化による誤差の影響を充分に避け、直線検出の正確度を高めることができる。
また、本実施例は、直線検出を基に、矩形検出方法も提供する。検出待ち矩形の可能性がある四角形を構成した後に、各四角形のマッチング距離をそれぞれ計算し、マッチング距離が最小である四角形、または、マッチング距離がマッチング閾値より小さい四角形を検出待ち矩形と特定することによって、画像におけるカード、請求書、書籍などの矩形形状の検出を実現し、本発明による直線検出方法及び矩形検出方法の実際応用範囲を広めた。
以下は、本発明の装置の実施例であり、本発明の方法の実施例を実行できる。本発明の装置の実施例で開示されない細部は、本発明の方法の実施例を参照すればよい。
図3は、一例示的な実施例による直線検出装置の模式図である。当該直線検出装置は、ソフトウェア、ハードウェアまたは両者の組み合わせによって、電子装置の一部または全部を実現できる。当該直線検出装置は、特徴取得モジュール310と、候補特定モジュール320と、精確特定モジュール330とを含む。
特徴取得モジュール310は、画像における各ピクセルの勾配ヒストグラム特徴集合を取得する。前記勾配ヒストグラム特徴集合は、ピクセルが位置する局部領域の直線特性を反映する。
候補特定モジュール320は、各前記ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定する。
精確特定モジュール330は、前記候補方向に基づいて、前記検出待ち直線の精確な方向と位置を特定する。
上記の記載をまとめると、本実施例による直線検出装置は、画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する上記勾配ヒストグラム特徴集合を取得し、各ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定し、その後、候補方向に基づいて、検出待ち直線の精確な方向と位置を特定することによって、関連技術に係る直線検出方法において、境界強度が比較的弱い場合またはノイズによる干渉が発生する場合、直線が途切れてしまい、検出結果が正確ではない問題を解決でき、背景技術で言及した関連する直線検出方法に比べて、本実施例による直線検出方法は、ハフ変換を使用せず、画像の二値化をする必要もないため、二値化による誤差の影響を充分に避け、直線検出の正確度を高めることができる。
図4は、別の例示的な実施例による直線検出装置の模式図である。当該直線検出装置は、ソフトウェア、ハードウェアまたは両者の組み合わせによって、電子装置の一部または全部を実現できる。当該直線検出装置は、特徴取得モジュール310と、候補特定モジュール320と、精確特定モジュール330と、第1の検出モジュール332と、直線候補モジュール334と、第2の検出モジュール336と、矩形候補モジュール338と、マッチング計算モジュール340と、矩形特定モジュール342とを含む。
特徴取得モジュール310は、画像における各ピクセルの勾配ヒストグラム特徴集合を取得する。前記勾配ヒストグラム特徴集合は、ピクセルが位置する局部領域の直線特性を反映する。
前記特徴取得モジュール310は、勾配計算ユニット310aと特徴計算ユニット310bとを含む。
前記勾配計算ユニット310aは、前記ピクセル(i,j)ごとに、前記ピクセルの方向勾配集合g(i,j)を計算する。前記方向勾配集合g(i,j)は、前記ピクセルのK(K≧2)個の方向における方向勾配値を含む。前記ピクセルの任意の方向における方向勾配値は、前記方向において前記ピクセルと隣接ピクセルとの間の階調値の差の絶対値である。
前記特徴計算ユニット310bは、前記ピクセルの方向勾配集合g(i,j)に基づいて、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)を計算する。
前記特徴計算ユニット310bは、局部領域勾配サブユニット310b1と、平均勾配サブユニット310b2と、平均検出サブユニット310b3と、特徴リセットサブユニット310b4と、特徴計算サブユニット310b5と、特徴特定サブユニット310b6とを含む。
前記局部領域勾配サブユニット310b1は、前記ピクセルの前記K個の方向における局部領域勾配値
Figure 2016517100
をそれぞれ計算する。k方向における局部領域勾配値
Figure 2016517100
は、前記ピクセルが位置する局部領域における全てのピクセルの前記k方向における方向勾配値の和であり、kは方向を表す。
前記平均勾配サブユニット310b2は、前記ピクセルの平均勾配値hnorm(i,j)を計算する。前記平均勾配値hnorm(i,j)は、前記ピクセルの各前記局部領域勾配値
Figure 2016517100
の平方和のルートである。
前記平均検出サブユニット310b3は、ピクセル(i,j)ごとに、前記平均勾配値hnorm(i,j)が所定の平均値Tnormより小さいか否かを検出する。
前記特徴リセットサブユニット310b4は、検出結果として前記平均勾配値hnorm(i,j)が前記所定の平均値Tnormより小さい場合、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)のうちの各勾配ヒストグラム特徴を0にリセットする。
前記特徴計算サブユニット310b5は、前記局部領域勾配値
Figure 2016517100
を前記平均勾配値hnorm(i,j)で除算して、前記ピクセルの前記k方向における勾配ヒストグラム特徴h(i,j)を取得する。
前記特徴特定サブユニット310b6は、前記K個の方向における勾配ヒストグラム特徴の集合を前記ピクセルの勾配ヒストグラム特徴集合h(i,j)と特定する。
候補特定モジュール320は、各前記ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定する。
前記候補特定モジュール320は、方向選択ユニット320aと、投票統計ユニット320bと、候補選択ユニット320cとを含む。
前記方向選択ユニット320aは、前記ピクセルごとに、前記勾配ヒストグラム特徴集合において数値が最大である勾配ヒストグラム特徴に対応する方向を選択して、前記ピクセルが位置する局部領域の主方向とする。
前記投票統計ユニット320bは、各前記ピクセルが位置する局部領域の主方向の、前記K個の方向における投票数を統計する。
前記候補選択ユニット320cは、前記投票数が投票閾値を超える方向に直交する方向を選択して、前記検出待ち直線の候補方向とする。
精確特定モジュール330は、前記候補方向に基づいて、前記検出待ち直線の精確な方向と位置を特定する。
前記精確特定モジュール330は、走査生成ユニット330aと、走査マッチングユニット330bと、走査選択ユニット330cと、精確特定ユニット330dとを含む。
前記走査生成ユニット330aは、前記候補方向ごとに、前記候補方向に平行な少なくとも1本の走査線を生成する。
前記走査マッチングユニット330bは、各走査線のマッチング距離をそれぞれ計算する。前記走査線のマッチング距離は、前記走査線と前記検出待ち直線との類似度を反映する。
前記走査マッチングユニット330bは、サンプリング取得サブユニット330b1と、サンプリングマッチングサブユニット330b2と、サンプリング加算サブユニット330b3とを含む。
前記サンプリング取得サブユニット330b1は、各前記走査線について、n(n≧1)個のサンプリング点をサンプリングして取得する。
前記サンプリングマッチングサブユニット330b2は、各前記サンプリング点の勾配ヒストグラム特徴集合と、前記候補方向に直交する方向におけるテンプレート勾配ヒストグラム特徴集合との間のマッチング距離を計算する。
前記サンプリング加算サブユニット330b3は、前記n個のサンプリング点のマッチング距離を加算して前記走査線のマッチング距離を得る。
前記走査選択ユニット330cは、マッチング距離が最小である前記走査線を候補直線として選択する。
前記精確特定ユニット330dは、前記候補直線に基づいて、前記検出待ち直線の精確な方向と位置を特定する。
前記精確特定ユニット330dは、矩形生成サブユニット330d1と、線分生成サブユニット330d2と、線分マッチングサブユニット330d3と、線分選択サブユニット330d4とを含む。
前記矩形生成サブユニット330d1は、前記候補直線を中心軸線として、所定の大きさの矩形領域を生成する。
前記線分生成サブユニット330d2は、前記矩形領域の前記候補直線に直交する直線の両側でそれぞれu(u≧1)個とv(v≧1)個の点を選択し、両側の点を2つずつ連結してu*v本の線分を取得する。
前記線分マッチングサブユニット330d3は、前記u*v本の線分のうちの各線分のマッチング距離をそれぞれ計算する。前記線分のマッチング距離は、前記線分と前記検出待ち直線との類似度を反映する。
前記線分選択サブユニット330d4は、マッチング距離が最小である線分の属する直線を前記検出待ち直線として選択する。
第1の検出モジュール332は、任意の前記検出待ち直線について、第1の所定条件を満たす第2の検出待ち直線が前記画像に存在するか否かを検出する。前記第1の所定条件は、前記第2の検出待ち直線と前記検出待ち直線との交点が前記画像内にあり、かつ両者がなす角度が角度閾値より小さい、という条件を含む。
直線候補モジュール334は、検出結果として第1の所定条件を満たす第2の検出待ち直線が存在する場合、前記第2の検出待ち直線を候補直線集合に追加する。
第2の検出モジュール336は、前記候補直線集合における任意2本の前記第2の検出待ち直線について、第2の所定条件を満たす第3の検出待ち直線が存在するか否かを検出する。前記第2の所定条件は、前記第3の検出待ち直線が前記検出待ち直線と異なり、前記第3の検出待ち直線が2本の前記第2の検出待ち直線の両方に交差し、かつ2つの交点の両方が前記画像内にある、という条件を含む。
矩形候補モジュール338は、検出結果として第2の所定条件を満たす第3の検出待ち直線が存在する場合、前記検出待ち直線、2本の前記第2の検出待ち直線および前記第3の検出待ち直線からなる四角形を候補矩形集合に追加する。
マッチング計算モジュール340は、前記候補矩形集合における各四角形について、前記四角形と検出待ち矩形との類似度を反映する前記四角形のマッチング距離を計算する。前記四角形のマッチング距離は、前記四角形の四辺に対応する線分のマッチング距離の和である。
矩形特定モジュール342は、マッチング距離が最小である四角形、または、マッチング距離がマッチング閾値より小さい四角形を前記検出待ち矩形と特定する。
上記の記載をまとめると、本実施例による直線検出装置は、画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する前記勾配ヒストグラム特徴集合を取得し、各ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定し、その後、候補方向に基づいて、検出待ち直線の精確な方向と位置を特定することによって、関連技術に係る直線検出方法において、境界強度が比較的弱い場合またはノイズによる干渉が発生する場合、直線が途切れてしまい、検出結果が正確ではない問題を解決でき、本実施例による直線検出方法は、ハフ変換を使用せず、画像の二値化をする必要もないため、二値化による誤差の影響を充分に避け、直線検出の正確度を高めることができる。
また、本実施例は、直線検出を基に、矩形検出装置も提供する。検出待ち矩形の可能性がある四角形を構成した後に、各四角形のマッチング距離をそれぞれ計算し、マッチング距離が最小である四角形、または、マッチング距離がマッチング閾値より小さい四角形を検出待ち矩形と特定することによって、画像におけるカード、請求書、書籍などの矩形形状の検出を実現し、本発明による直線検出装置及び矩形検出装置の実際応用範囲を広めた。
なお、上記実施例による直線検出装置は、画像における直線を検出する際に、上記各機能的モジュールの区分を例として説明したが、実際の応用時に、必要に応じて上記機能を異なる機能的モジュールに割り当てて完成してもよい。すなわち、装置の内部構成を異なる機能的モジュールに区分して、以上記載した全てまたは一部の機能を完成してもよい。また、上記実施例による直線検出装置は、直線検出方法の方法実施例と同一の構想に属し、その具体的な実現過程は方法の実施例を参照すればよく、ここでは繰り返して説明しない。
図5は、一例示的実施例による直線検出用装置500のブロック図である。例えば、装置500は、携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレット装置、医療設備、フィットネス機器、PDAなどである。
図5を参照すると、装置500は、プロセスアセンブリ502、メモリ504、電源アセンブリ506、マルチメディアアセンブリ508、オーディオアセンブリ510、入出力(I/O)インターフェイス512、センサアセンブリ514、及び通信アセンブリ516のような一つ以上のアセンブリを含んでよい。
プロセスアセンブリ502は、一般的には装置500の全体の操作を制御するものであり、例えば、表示、電話呼び出し、データ通信、カメラ操作、及び記録操作と関連する操作を制御する。プロセスアセンブリ502は、一つ以上のプロセッサ520を含み、これらによって命令を実行することにより、上記の方法の全部、或は一部のステップを実現するようにしてもよい。なお、プロセスアセンブリ502は、一つ以上のモジュールを含み、これらによってプロセスアセンブリ502と他のアセンブリの間のインタラクションを容易にするようにしてもよい。例えば、プロセスアセンブリ502は、マルチメディアモジュールを含み、これらによってマルチメディアアセンブリ508とプロセスアセンブリ502の間のインタラクションを容易にするようにしてもよい。
メモリ504は、各種類のデータを記憶することにより装置500の操作を支援するように構成される。これらのデータの例は、装置500において操作されるいずれのアプリケーションプログラム又は方法の命令、連絡対象データ、電話帳データ、メッセージ、画像、ビデオ等を含む。メモリ504は、いずれの種類の揮発性メモリ、不揮発性メモリ記憶デバイスまたはそれらの組み合わせによって実現されてもよく、例えば、SRAM(Static Random Access Memory)、EEPROM(Electrically Erasable Programmable Read−Only Memory)、EPROM(Erasable Programmable Read Only Memory)、PROM( Programmable ROM)、ROM(Read Only Member)、磁気メモリ、フラッシュメモリ、磁気ディスク、或いは光ディスクである。
電源アセンブリ506は、装置500の多様なアセンブリに電力を供給する。電源アセンブリ506は、電源管理システム、一つ以上の電源、及び装置500のための電力の生成、管理及び割り当てに関連する他のアセンブリを含んでもよい。
マルチメディアアセンブリ508は、上記装置500とユーザの間に一つの出力インターフェイスを提供するスクリーンを含む。上記の実施例において、スクリーンは液晶モニター(LCD)とタッチパネル(TP)を含んでもよい。スクリーンがタッチパネルを含むことにより、スクリーンはタッチスクリーンを実現することができ、ユーザからの入力信号を受信することができる。タッチパネルは一つ以上のタッチセンサを含み、タッチ、スライド、及びタッチパネル上のジェスチャを検出することができる。上記タッチセンサは、タッチ、或はスライド動作の境界だけでなく、上記タッチ、或はスライド操作に係る継続時間及び圧力も検出できる。部分実施例において、マルチメディアアセンブリ508は、一つのフロントカメラ、及び/又はリアカメラを含む。装置500が、例えば撮影モード、或はビデオモード等の操作モードにある場合、フロントカメラ、及び/又はリアカメラは外部からマルチメディアデータを受信できる。フロントカメラとリアカメラのそれぞれは、一つの固定型の光レンズ系、或は可変焦点距離と光学ズーム機能を有するものであってもよい。
オーディオアセンブリ510は、オーディオ信号を入出力するように構成される。例えば、オーディオアセンブリ510は、一つのマイク(MIC)を含み、装置500が、例えば呼出しモード、記録モード、及び音声認識モード等の操作モードにある場合、マイクは外部のオーディオ信号を受信することができる。受信されたオーディオ信号は、さらにメモリ504に記憶されたり、通信アセンブリ516を介して送信されたりする。部分実施例において、オーディオアセンブリ510は、オーディオ信号を出力するための一つのスピーカーをさらに含む。
I/Oインターフェイス512は、プロセスアセンブリ502と周辺インターフェイスモジュールの間にインターフェイスを提供するものであり、上記周辺インターフェイスモジュールは、キーボード、クリックホイール、ボタン等であってもよい。これらのボタンは、ホームボタン、ボリュームボタン、起動ボタン、ロッキングボタンを含んでもよいが、これらに限定されない。
センサアセンブリ514は、装置500に各方面の状態に対する評価を提供するための一つ以上のセンサを含む。例えば、センサアセンブリ514は、装置500のON/OFF状態、装置500のディスプレイとキーパッドのようなアセンブリの相対的な位置決めを検出できる。また、例えば、センサアセンブリ514は、装置500、或は装置500の一つのアセンブリの位置変更、ユーザと装置500とが接触しているか否か、装置500の方位、又は加速/減速、装置500の温度の変化を検出できる。センサアセンブリ514は、何れの物理的接触がない状態にて付近の物体の存在を検出するための近接センサを含んでもよい。センサアセンブリ514は、撮影アプリケーションに適用するため、CMOS、又はCCD図像センサのような光センサを含んでもよい。部分実施例において、当該センサアセンブリ514は、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサ、及び温度センサをさらに含んでもよい。
通信アセンブリ516は、装置500と他の機器の間に有線、又は无線形態の通信を提供する。装置500は、例えばWiFi、2G、3G、或はこれらの組み合わせのような、通信規格に基づいた无線ネットワークに接続されてもよい。一つの例示的な実施例において、通信アセンブリ516は、放送チャンネルを介して外部の放送管理システムからの放送信号、又は放送に関連する情報を受信する。一つの例示的な実施例において、前記通信アセンブリ516は、近距離無線通信(NFC)モジュールをさらに含むことにより、近距離通信をプッシュする。例えば、NFCモジュールは、RFID(Radio Frequency IDentification)技術、IrDA(Infrared Data Association)技術、UWB(Ultra Wide Band)技術、BT(Bluetooth)技術、および他の技術に基づいて実現できる。
例示的な実施例において、装置500は、一つ以上のASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、DSPD(Digital Signal Processing Device)、PLD(Programmable Logic Device)、FPGA(Field−Programmable Gate Array)、コントローラ、マイクロコントローラ、マイクロプロセッサ、または他の電子部品によって実現されるものであり、上記方法を実行する。
例示的な実施例において、さらに、命令を含むコンピュータ読取り可能な非一時的な記録媒体、例えば命令を含むメモリ504を提供しており、装置500のプロセッサ520により上記命令を実行して上記方法を実現する。例えば、前記コンピュータ読取り可能な非一時的な記録媒体は、ROM、RAM、CD-ROM、磁気テープ、フロッピーディスク、光データ記憶デバイス等である。
本実施例は、コンピュータ読み取り可能な不揮発性記録媒体を提供し、移動端末は、当該移動端末のプロセッサにより当該記録媒体に記憶されている指令を実行することにより、直線検出方法を実現し、当該方法は、
画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する前記勾配ヒストグラム特徴集合を取得するステップと、
各前記ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定するステップと、
前記候補方向に基づいて、前記検出待ち直線の精確な方向と位置を特定するステップとを含む。
上記記載をまとめると、本実施例による装置は、画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する前記勾配ヒストグラム特徴集合を取得し、各ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定し、その後、候補方向に基づいて、検出待ち直線の精確な方向と位置を特定することによって、関連技術に係る直線検出方法において、境界強度が比較的弱い場合またはノイズによる干渉が発生する場合、直線が途切れてしまい、検出結果が正確ではない問題を解決でき、本実施例による直線検出方法は、ハフ変換を使用せず、画像の二値化をする必要もないため、二値化による誤差の影響を充分に避け、直線検出の正確度を高めることができる。
なお、典型的には、本発明に記載の移動端末は、例えば携帯電話、パーソナルディジタルアシスタント(PDA)等の各種の手持ち端末装置であってもよいため、本発明の保護範囲をある特定タイプの移動端末に限定すべきではない。
なお、本発明に係る方法は、さらに、CPUにより実行されるコンピュータプログラムとしても実現され得る。該コンピュータプログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。該コンピュータプログラムがCPUにより実行されると、本発明の方法において限定される上述の機能が実現される。
なお、上記の方法の各ステップ及びシステム要素は、コントローラ、及びコントローラに上記のステップ又は要素の機能を実現させるコンピュータプログラムを記録するためのコンピュータ読み取り可能な記録媒体によりも実現され得る。
なお、本発明に記載のコンピュータ読取り可能な記録媒体(例えば、メモリ)は、揮発性メモリまたは不揮発性メモリのいずれかであってもよく、あるいは、揮発性メモリ及び不揮発性メモリの両方を備えてもよい、とのことを理解すべきである。例えば、不揮発性メモリには、ROM、PROM、EPROM、EEPROM、又はフラッシュメモリが含まれてもよく、揮発性メモリには、外部のキャッシュメモリとして機能するRAMが含まれてもよいが、両方ともこれに限定されるものではない。例えば、RAMは、SRAM、DRAM、SDRAM、DDR SDRAM(ダブル・データ・レートSDRAM)、ESDRAM(エンハンストSDRAM)、SLDRAM(シンクリンクDRAM)及びDRRAM(ダイレクトRambus RAM)などの多くの形式により実現可能であるが、これに限定されるものではない。ここで上記の記録媒体を開示するのは、本発明の保護範囲にこれらの記録媒体及び他の適したタイプの記録媒体を含ませるためであって、これらのみに限定されないことを意図する。
当業者は、更に、本発明に記載の種々の例示的な論理ブロック、モジュール、回路、及びアルゴリズムステップが、電子ハードウェア、コンピュータソフトウェア、又は両者の組み合わせにより実現され得る、ことを理解すべきである。ハードウェアとソフトウェアの間のこのような互換性を明確に説明するために、種々の例示的なコンポーネント、ブロック、モジュール、回路、及びステップの機能について、以上において通常的な説明を行っている。このような機能が、ソフトウェアにより実現されるか、又は、ハードウェアにより実現されるかは、具体的なアプリ、及びシステム全体に課される設計上の制約により選択される。当業者は、具体的なアプリそれぞれにおいて、様々な方式を選択して前記機能を実現してもよく、このような選択は、本発明の範囲を逸脱したものとして解釈されるべきではない。
以上の開示内容に結び付けられて説明される種々の例示的な論理ブロック、モジュール、及び回路は、上述の機能を行なうように設計された汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)または他のプログラム可能な論理デバイス、ディスクリートゲートまたはトランジスタロジック、ディスクリートハードウェアコンポーネント、或いは、これら部材の任意の組み合わせによって、実現又は実行され得る。汎用プロセッサは、マイクロプロセッサであってもよいが、マイクロプロセッサの代わりに、プロセッサは任意の従来のプロセッサ、コントローラ、マイクロコントローラ、又は状態機械であってもよい。プロセッサは、例えば、DSPとマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、DSPコアと1つ又は複数のマイクロプロセッサの組み合わせ、或いは任意のこのような他の構成といった、コンピューティングデバイスの組み合わせとして実現されてもよい。
以上の開示内容に結び付けられて説明される方法、又は、アルゴリズムのステップは、ハードウェア、プロセッサによって実行されるソフトウェアモジュール、又はこの両者の組合せに直接的に含まれてもよい。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、又は当該分野において公知の他の形態で存在する任意の記憶媒体に格納されてもよい。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み出すことができ、且つ、プロセッサが記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代案として、前記記憶媒体はプロセッサと一体的に集積されてもよい。プロセッサと記憶媒体はASICに格納されてもよい。ASICはユーザ端末に格納されてもよい。代案として、プロセッサと記憶媒体は別個のコンポーネントとしてユーザ端末に格納されてもよい。
1つ又は複数の例示的な設計として、前記機能はハードウェア、ソフトウェア、ファームウェア又はこれらの任意の組み合わせによって実現され得る。ソフトウェアにより実現される場合、前記機能を1つ又は複数の指令、又はコードとしてコンピュータ読取り可能な媒体に記憶するか、又は、コンピュータ読取り可能な媒体を用いて伝送する。コンピュータ読取り可能な媒体は、コンピュータ記憶媒体及び通信媒体を含み、該通信媒体には、コンピュータプログラムを1つの位置から他の位置へ伝送するための任意の媒体が含まれる。記憶媒体は、汎用又は専用コンピュータによりアクセス可能な任意の使用可能媒体であり得る。例として、該コンピュータ読取り可能な媒体は、RAM、ROM、EEPROM、CD−ROM又は他の光ディスク記憶デバイス、ディスク記憶デバイス又は他の磁性記憶デバイスを含んでもよく、或いは、携帯できるもの、又は記憶形態が指令又はデータ構造である必要なプログラムコードを記憶するためのもので、且つ、汎用又は専用コンピュータ或いは汎用又は専用プロセッサによりアクセス可能な任意の他の媒体であり得るが、これに限定されるものではない。なお、任意の接続であっても、コンピュータ読取り可能な媒体として称され得る。例えば、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL)、又は、赤外線、ワイヤレス及びマイクロ波のような無線技術を用いて、ウェブサイト、サーバ又は他のリモートソースからソフトウェアを送信する場合、上記の同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、又は、赤外線、ワイヤレス及びマイクロ波のような無線技術の何れもが媒体の定義に含まれる。以上の磁気ディスク及び光ディスクは、コンパクトディスク(CD)、レーザーディスク、光ディスク、デジタルバーサタイルディスク(DVD)、フロッピー・ディスク、ブルーレイディスクを含んでおり、磁気ディスクは、通常磁性を利用してデータの再生を行なうものであり、光ディスクは、レーザ光を用いて光学的にデータの再生を行なうものである。また、以上の構成の組合わせもコンピュータ読取り可能な媒体の範囲に含まれるべきである。
以上の開示内容により、本発明の実施例を例示的に示しているが、特許請求の範囲により限定される本発明の範囲を逸脱しない限り、多種の変更及び修正を行うことができる。以上に開示された実施例に基づく方法請求項の機能、ステップ及び/又はジェスチャーは、ある特定の手順で実行する必要はない。なお、本発明に係る要素は、個体として記載又は要求されているが、単数であると明確に限定されていない限りは複数であってもよい。
上記の本発明の実施例の番号は、単に記載のためのものであり、実施例の優劣を代表するものではない。
当業者は、上記実施例の全部または一部のステップをハードウェアによって実現してもよく、プログラムを通じて関連するハードウェアを指令することによって実現してもよいことを理解できる。上記のプログラムは、コンピュータ読み取り可能な記録媒体に記録でき、上記言及した記録媒体は、ROM、磁気ディスクまたは光ディスクである。
以上は、本発明の好ましい実施例に過ぎず、本発明を限定するものではない。本発明の趣旨及び原則範囲内で行われる任意の修正、均等の取替、改良などは、その何れも本発明の保護範囲に含まれるべきである。
本発明は、画像処理分野に属し、具体的には、直線検出方法、装、プログラム、及び記録媒体に関するものである。
関連技術に係る直線検出方法において、境界強度が比較的弱い場合またはノイズによる干渉が発生する場合、直線が途切れてしまい、検出結果が正確ではない問題を解決するために、本発明の実施例は、直線検出方法、装、プログラム、及び記録媒体を提供する。
前記装置は、任意の前記検出待ち直線について、第1の所定条件を満たす第2の検出待ち直線が前記画像に存在するか否かを検出するための第1の検出モジュールと、検出した結果、前記第1の所定条件を満たす第2の検出待ち直線が存在する場合、前記第2の検出待ち直線を候補直線集合に追加するための直線候補モジュールと、前記候補直線集合における任意2本の前記第2の検出待ち直線について、第2の所定条件を満たす第3の検出待ち直線が存在するか否かを検出するための第2の検出モジュールと、検出した結果、前記第2の所定条件を満たす第3の検出待ち直線が存在する場合、前記検出待ち直線、2本の前記第2の検出待ち直線および前記第3の検出待ち直線からなる四角形を候補矩形集合に追加するための矩形候補モジュールと、前記候補矩形集合における各四角形について、前記四角形と検出待ち矩形との類似度を反映する前記四角形のマッチング距離を計算するためのマッチング計算モジュールと、マッチング距離が最小である四角形、または、マッチング距離がマッチング閾値より小さい四角形を前記検出待ち矩形と特定するための矩形特定モジュールとをさらに含み、前記第1の所定条件は、前記第2の検出待ち直線と前記検出待ち直線との交点が前記画像内にあり、かつ両者がなす角度が角度閾値より小さい、という条件を含み、前記第2の所定条件は、前記第3の検出待ち直線が前記検出待ち直線と異なり、前記第3の検出待ち直線が2本の前記第2の検出待ち直線のいずれとも交差し、かつ2つの交点のいずれもが前記画像内にある、という条件を含み、前記四角形のマッチング距離は、前記四角形の四辺に対応する線分のマッチング距離の和であってもよい。
本発明の実施例の第3の態様によると、プログラムを提供し、当該プログラムは、プロセッサに実行されることにより、上記直線検出方法を実現する。
本発明の実施例の第4の態様によると、記録媒体を提供し、当該記録媒体には、上記プログラムが記録されている。
電子装置は、各走査線のマッチング距離を算出した後に、マッチング距離が最小である走査線を選択して候補直線とする。図Cに示されたように、本実施例において、OとPの2点を通る走査線を、マッチング距離が最小である走査線とする。すなわち、OとPの2点を通る走査線を、候補直線とする。
電子装置は、候補直線を中心軸線として、所定の大きさの矩形領域を生成する。図Cに示されたように、候補直線の上でO、Pの2点を選択し、線分OPの長さは矩形領域の長さとなる。実際の応用中に、線分OPの長さは、その値をなるべく大きめに取ることが望ましい。その後、それぞれO、Pの2点を通って、候補直線の垂直線ABとCDを描く。ここで、Oは、ABの中心点になり、Pは、CDの中心点になる。線分AB、CDの長さは、矩形領域の幅となる。実際の応用中に、線分AB、CDの長さは、互いに隣り合う走査線同士の距離の2倍を取ることができる。

Claims (18)

  1. 画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する勾配ヒストグラム特徴集合を取得するステップと、
    各前記ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定するステップと、
    前記候補方向に基づいて、前記検出待ち直線の精確な方向と位置を特定するステップと
    を含むことを特徴とする直線検出方法。
  2. 画像における各ピクセルの勾配ヒストグラム特徴集合を取得するステップは、
    各前記ピクセル(i,j)について、前記ピクセルのK(K≧2)個の方向における方向勾配値を含む方向勾配集合g(i,j)を計算するステップと、
    前記ピクセルの方向勾配集合g(i,j)に基づいて、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)を計算するステップと
    を含み、
    前記ピクセルの任意の方向における方向勾配値は、当該方向における前記ピクセルと隣接ピクセルとの間の階調値の差の絶対値であることを特徴とする請求項1に記載の直線検出方法。
  3. 前記ピクセルの方向勾配集合g(i,j)に基づいて、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)を計算するステップは、
    前記ピクセルの前記K個の方向における局部領域勾配値
    Figure 2016517100
    をそれぞれ計算するステップと、
    前記ピクセルの平均勾配値hnorm(i,j)を計算するステップと、
    前記局部領域勾配値
    Figure 2016517100
    を前記平均勾配値hnorm(i,j)で除算して、前記ピクセルのk方向における勾配ヒストグラム特徴h(i,j)を取得するステップと、
    前記K個の方向における勾配ヒストグラム特徴の集合を前記ピクセルの勾配ヒストグラム特徴集合h(i,j)と特定するステップと
    を含み、
    ピクセルのk方向における局部領域勾配値
    Figure 2016517100
    は、前記ピクセルが位置する局部領域内の全てのピクセルの前記k方向における方向勾配値の和であり、kは、方向を表し、
    前記平均勾配値hnorm(i,j)は、前記ピクセルの各前記局部領域勾配値
    Figure 2016517100
    の平方和のルートであることを特徴とする請求項2に記載の直線検出方法。
  4. 各前記ピクセル(i,j)について、前記平均勾配値hnorm(i,j)が所定の平均値Tnormより小さいか否かを検出するステップと、
    検出した結果、前記平均勾配値hnorm(i,j)が前記所定の平均値Tnormより小さい場合、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)のうちの各勾配ヒストグラム特徴を0にリセットするステップと
    をさらに含むことを特徴とする請求項3に記載の直線検出方法。
  5. 各前記ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定するステップは、
    各前記ピクセルについて、前記勾配ヒストグラム特徴集合において数値が最大である勾配ヒストグラム特徴に対応する方向を前記ピクセルが位置する局部領域の主方向として選択するステップと、
    各前記ピクセルが位置する局部領域の主方向の、前記K個の方向における投票数を統計するステップと、
    前記投票数が投票閾値を超える方向に直交する方向を前記検出待ち直線の候補方向として選択するステップと
    を含むことを特徴とする請求項2〜4のいずれか1項に記載の直線検出方法。
  6. 前記候補方向に基づいて、前記検出待ち直線の精確な方向と位置を特定するステップは、
    各前記候補方向について、前記候補方向に平行な少なくとも1本の走査線を生成するステップと、
    各走査線について、前記走査線と前記検出待ち直線との類似度を反映する前記走査線のマッチング距離をそれぞれ計算するステップと、
    マッチング距離が最小である前記走査線を候補直線として選択するステップと、
    前記候補直線に基づいて、前記検出待ち直線の精確な方向と位置を特定するステップと
    を含むことを特徴とする請求項1に記載の直線検出方法。
  7. 各走査線のマッチング距離をそれぞれ計算するステップは、
    各前記走査線について、前記走査線上でn(n≧1)個のサンプリング点をサンプリングして取得するステップと、
    各前記サンプリング点の勾配ヒストグラム特徴集合と、前記候補方向に直交する方向におけるテンプレート勾配ヒストグラム特徴集合との間のマッチング距離を計算するステップと、
    前記n個のサンプリング点のマッチング距離を加算して前記走査線のマッチング距離を得るステップと
    を含むことを特徴とする請求項6に記載の直線検出方法。
  8. 前記候補直線に基づいて、前記検出待ち直線の精確な方向と位置を特定するステップは、
    前記候補直線を中心軸線として、所定の大きさの矩形領域を生成するステップと、
    前記矩形領域の前記候補直線に直交する直線の両側でそれぞれu(u≧1)個とv(v≧1)個の点を選択し、両側の点を2つずつ連結してu*v本の線分を取得するステップと、
    前記u*v本の線分のうちの各線分について、前記線分と前記検出待ち直線との類似度を反映するマッチング距離をそれぞれ計算するステップと、
    マッチング距離が最小である線分の属する直線を前記検出待ち直線として選択するステップと
    を含むことを特徴とする請求項6に記載の直線検出方法。
  9. 任意の前記検出待ち直線について、第1の所定条件を満たす第2の検出待ち直線が前記画像に存在するか否かを検出するステップと、
    検出した結果、前記第1の所定条件を満たす第2の検出待ち直線が存在する場合、前記第2の検出待ち直線を候補直線集合に追加するステップと、
    前記候補直線集合における任意2本の前記第2の検出待ち直線について、第2の所定条件を満たす第3の検出待ち直線が存在するか否かを検出するステップと、
    検出した結果、前記第2の所定条件を満たす第3の検出待ち直線が存在する場合、前記検出待ち直線、2本の前記第2の検出待ち直線および前記第3の検出待ち直線からなる四角形を候補矩形集合に追加するステップと、
    前記候補矩形集合における各四角形について、前記四角形と検出待ち矩形との類似度を反映する前記四角形のマッチング距離を計算するステップと、
    マッチング距離が最小である四角形、または、マッチング距離がマッチング閾値より小さい四角形を前記検出待ち矩形と特定するステップと
    をさらに含み、
    前記第1の所定条件は、前記第2の検出待ち直線と前記検出待ち直線との交点が前記画像内にあり、かつ両者がなす角度が角度閾値より小さい、という条件を含み、
    前記第2の所定条件は、前記第3の検出待ち直線が前記検出待ち直線と異なり、前記第3の検出待ち直線が2本の前記第2の検出待ち直線のいずれとも交差し、かつ2つの交点のいずれもが前記画像内にある、という条件を含み、
    前記四角形のマッチング距離は、前記四角形の四辺に対応する線分のマッチング距離の和であることを特徴とする請求項1〜8のいずれか1項に記載の直線検出方法。
  10. 画像における各ピクセルの勾配ヒストグラム特徴集合であって、ピクセルが位置する局部領域の直線特性を反映する勾配ヒストグラム特徴集合を取得するための特徴取得モジュールと、
    各前記ピクセルの勾配ヒストグラム特徴集合に基づいて、検出待ち直線の少なくとも1つの候補方向を特定するための候補特定モジュールと、
    前記候補方向に基づいて、前記検出待ち直線の精確な方向と位置を特定するための精確特定モジュールと
    を含むことを特徴とする直線検出装置。
  11. 前記特徴取得モジュールは、
    各前記ピクセル(i,j)について、前記ピクセルのK(K≧2)個の方向における方向勾配値を含む方向勾配集合g(i,j)を計算するための勾配計算ユニットと、
    前記ピクセルの方向勾配集合g(i,j)に基づいて、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)を計算するための特徴計算ユニットと
    を含み、
    前記ピクセルの任意の方向における方向勾配値は、当該方向における前記ピクセルと隣接ピクセルとの間の階調値の差の絶対値であることを特徴とする請求項10に記載の直線検出装置。
  12. 前記特徴計算ユニットは、
    前記ピクセルの前記K個の方向における局部領域勾配値
    Figure 2016517100
    をそれぞれ計算するための局部領域勾配サブユニットと、
    前記ピクセルの平均勾配値hnorm(i,j)を計算するための平均勾配サブユニットと、
    前記局部領域勾配値
    Figure 2016517100
    を前記平均勾配値hnorm(i,j)で除算して、前記ピクセルのk方向における勾配ヒストグラム特徴h(i,j)を取得するための特徴計算サブユニットと、
    前記K個の方向における勾配ヒストグラム特徴の集合を前記ピクセルの勾配ヒストグラム特徴集合h(i,j)と特定するための特徴特定サブユニットと
    を含み、
    ピクセルのk方向における局部領域勾配値
    Figure 2016517100
    は、前記ピクセルが位置する局部領域内の全てのピクセルの前記k方向における方向勾配値の和であり、kは、方向を表し、
    前記平均勾配値hnorm(i,j)は、前記ピクセルの各前記局部領域勾配値
    Figure 2016517100
    の平方和のルートであることを特徴とする請求項11に記載の直線検出装置。
  13. 各前記ピクセル(i,j)について、前記平均勾配値hnorm(i,j)が所定の平均値Tnormより小さいか否かを検出するための平均検出サブユニットと、
    検出した結果、前記平均勾配値hnorm(i,j)が前記所定の平均値Tnormより小さい場合、前記ピクセルの勾配ヒストグラム特徴集合h(i,j)のうちの各勾配ヒストグラム特徴を0にリセットするための特徴リセットサブユニットと
    をさらに含むことを特徴とする請求項12に記載の直線検出装置。
  14. 前記候補特定モジュールは、
    各前記ピクセルについて、前記勾配ヒストグラム特徴集合において数値が最大である勾配ヒストグラム特徴に対応する方向を前記ピクセルが位置する局部領域の主方向として選択するための方向選択ユニットと、
    各前記ピクセルが位置する局部領域の主方向の、前記K個の方向における投票数を統計するための投票統計ユニットと、
    前記投票数が投票閾値を超える方向に直交する方向を前記検出待ち直線の候補方向として選択するための候補選択ユニットと
    を含むことを特徴とする請求項11〜13のいずれか1項に記載の直線検出装置。
  15. 前記精確特定モジュールは、
    各前記候補方向について、前記候補方向に平行な少なくとも1本の走査線を生成するための走査生成ユニットと、
    各走査線について、前記走査線と前記検出待ち直線との類似度を反映する前記走査線のマッチング距離をそれぞれ計算するための走査マッチングユニットと、
    マッチング距離が最小である前記走査線を候補直線として選択するための走査選択ユニットと、
    前記候補直線に基づいて、前記検出待ち直線の精確な方向と位置を特定するための精確特定ユニットと
    を含むことを特徴とする請求項10に記載の直線検出装置。
  16. 前記走査マッチングユニットは、
    各前記走査線について、前記走査線上でn(n≧1)個のサンプリング点をサンプリングして取得するためのサンプリング取得サブユニットと、
    各前記サンプリング点の勾配ヒストグラム特徴集合と、前記候補方向に直交する方向におけるテンプレート勾配ヒストグラム特徴集合との間のマッチング距離を計算するためのサンプリングマッチングサブユニットと、
    前記n個のサンプリング点のマッチング距離を加算して前記走査線のマッチング距離を得るためのサンプリング加算サブユニットと
    を含むことを特徴とする請求項15に記載の直線検出装置。
  17. 前記精確特定ユニットは、
    前記候補直線を中心軸線として、所定の大きさの矩形領域を生成するための矩形生成サブユニットと、
    前記矩形領域の前記候補直線に直交する直線の両側でそれぞれu(u≧1)個とv(v≧1)個の点を選択し、両側の点を2つずつ連結してu*v本の線分を取得するための線分生成サブユニットと、
    前記u*v本の線分のうちの各線分について、前記線分と前記検出待ち直線との類似度を反映するマッチング距離をそれぞれ計算するための線分マッチングサブユニットと、
    マッチング距離が最小である線分の属する直線を前記検出待ち直線として選択するための線分選択サブユニットと
    を含むことを特徴とする請求項15に記載の直線検出装置。
  18. 任意の前記検出待ち直線について、第1の所定条件を満たす第2の検出待ち直線が前記画像に存在するか否かを検出するための第1の検出モジュールと、
    検出した結果、前記第1の所定条件を満たす第2の検出待ち直線が存在する場合、前記第2の検出待ち直線を候補直線集合に追加するための直線候補モジュールと、
    前記候補直線集合における任意2本の前記第2の検出待ち直線について、第2の所定条件を満たす第3の検出待ち直線が存在するか否かを検出するための第2の検出モジュールと、
    検出した結果、前記第2の所定条件を満たす第3の検出待ち直線が存在する場合、前記検出待ち直線、2本の前記第2の検出待ち直線および前記第3の検出待ち直線からなる四角形を候補矩形集合に追加するための矩形候補モジュールと、
    前記候補矩形集合における各四角形について、前記四角形と検出待ち矩形との類似度を反映する前記四角形のマッチング距離を計算するためのマッチング計算モジュールと、
    マッチング距離が最小である四角形、または、マッチング距離がマッチング閾値より小さい四角形を前記検出待ち矩形と特定するための矩形特定モジュールと
    をさらに含み、
    前記第1の所定条件は、前記第2の検出待ち直線と前記検出待ち直線との交点が前記画像内にあり、かつ両者がなす角度が角度閾値より小さい、という条件を含み、
    前記第2の所定条件は、前記第3の検出待ち直線が前記検出待ち直線と異なり、前記第3の検出待ち直線が2本の前記第2の検出待ち直線のいずれとも交差し、かつ2つの交点のいずれもが前記画像内にある、という条件を含み、
    前記四角形のマッチング距離は、前記四角形の四辺に対応する線分のマッチング距離の和であることを特徴とする請求項10〜17のいずれか1項に記載の直線検出装置。
JP2016503537A 2014-02-22 2014-08-15 直線検出方法、装置、プログラム、及び記録媒体 Active JP6007354B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410063121.0 2014-02-22
CN201410063121.0A CN103914830B (zh) 2014-02-22 2014-02-22 直线检测方法和装置
PCT/CN2014/084460 WO2015123973A1 (zh) 2014-02-22 2014-08-15 直线检测方法和装置

Publications (2)

Publication Number Publication Date
JP2016517100A true JP2016517100A (ja) 2016-06-09
JP6007354B2 JP6007354B2 (ja) 2016-10-12

Family

ID=51040486

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016503537A Active JP6007354B2 (ja) 2014-02-22 2014-08-15 直線検出方法、装置、プログラム、及び記録媒体

Country Status (9)

Country Link
US (1) US9449245B2 (ja)
EP (1) EP2911093B1 (ja)
JP (1) JP6007354B2 (ja)
KR (1) KR101613637B1 (ja)
CN (1) CN103914830B (ja)
BR (1) BR112014026245A2 (ja)
MX (1) MX358505B (ja)
RU (1) RU2616539C2 (ja)
WO (1) WO2015123973A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914830B (zh) * 2014-02-22 2017-02-01 小米科技有限责任公司 直线检测方法和装置
CN104331876B (zh) * 2014-10-09 2020-12-08 北京配天技术有限公司 直线检测、图像处理的方法及相关装置
CN104504684B (zh) * 2014-12-03 2017-05-24 小米科技有限责任公司 边缘提取方法和装置
CN104574396B (zh) * 2014-12-31 2017-05-24 深圳大学 一种直线检测方法及系统
CN105163078B (zh) * 2015-09-01 2018-05-18 电子科技大学 一种屏幕移出智能视频监测系统
CN105389802B (zh) * 2015-10-20 2018-07-03 无锡日联科技股份有限公司 一种基于X-Ray图像的IC元器件缺陷检测方法
CN108288262B (zh) * 2017-09-12 2020-05-15 东莞普视智能科技有限公司 电源线圈线松检测方法、装置及计算机可读存储介质、终端设备
CN109801300B (zh) * 2017-11-16 2020-08-28 北京百度网讯科技有限公司 棋盘格角点的坐标提取方法、装置、设备及计算机可读存储介质
CN109117825B (zh) 2018-09-04 2020-01-17 百度在线网络技术(北京)有限公司 车道线处理方法和装置
CN109255181B (zh) 2018-09-07 2019-12-24 百度在线网络技术(北京)有限公司 一种基于多模型的障碍物分布仿真方法、装置以及终端
CN109143242B (zh) 2018-09-07 2020-04-14 百度在线网络技术(北京)有限公司 障碍物绝对速度估计方法、系统、计算机设备和存储介质
CN109215136B (zh) 2018-09-07 2020-03-20 百度在线网络技术(北京)有限公司 一种真实数据增强方法、装置以及终端
CN109059780B (zh) 2018-09-11 2019-10-15 百度在线网络技术(北京)有限公司 检测障碍物高度的方法、装置、设备及存储介质
CN109165629B (zh) 2018-09-13 2019-08-23 百度在线网络技术(北京)有限公司 多焦距视觉障碍物感知方法、装置、设备及存储介质
CN109918986B (zh) * 2018-12-29 2021-06-22 山东财经大学 基于启发式混合细菌觅食算法的直线型结构物体检测方法
CN111429396B (zh) * 2019-01-09 2023-08-22 银河水滴科技(北京)有限公司 一种图像检测方法及装置
CN111141208B (zh) * 2019-01-09 2021-08-27 银河水滴科技(北京)有限公司 一种平行线检测方法及装置
US10977080B2 (en) 2019-01-30 2021-04-13 Bank Of America Corporation Resource instrument for processing a real-time resource event
CN109703568B (zh) 2019-02-19 2020-08-18 百度在线网络技术(北京)有限公司 自动驾驶车辆行驶策略实时学习的方法、装置和服务器
CN109712421B (zh) 2019-02-22 2021-06-04 百度在线网络技术(北京)有限公司 自动驾驶车辆的速度规划方法、装置和存储介质
KR102205325B1 (ko) * 2019-06-14 2021-01-21 경북대학교 산학협력단 라인 검출 방법
KR102279177B1 (ko) * 2019-07-04 2021-07-20 경북대학교 산학협력단 서브픽셀 라인위치 결정 장치 및 방법
KR102214482B1 (ko) * 2019-07-05 2021-02-10 경북대학교 산학협력단 라인 연결 장치 및 방법
CN112232136B (zh) * 2020-09-22 2023-05-05 北京紫光展锐通信技术有限公司 车辆安全带检测方法和装置、电子设备及存储介质
CN113160259B (zh) * 2021-04-30 2024-01-30 重庆紫光华山智安科技有限公司 边缘检测方法、装置、计算机设备及存储介质
CN113262495B (zh) * 2021-05-27 2022-01-18 南京比夫网络科技有限公司 一种基于人工智能的ai电竞运营机器人
CN114723758B (zh) * 2022-06-10 2022-11-15 惠州威尔高电子有限公司 一种MiniLED薄板全自动连线的生产质量检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10275213A (ja) * 1997-03-31 1998-10-13 Fuji Photo Film Co Ltd 放射線画像の照射野認識方法および装置、並びに黒化処理方法および装置
US20130335575A1 (en) * 2012-06-14 2013-12-19 Qualcomm Incorporated Accelerated geometric shape detection and accurate pose tracking

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7085432B2 (en) 2002-06-10 2006-08-01 Lockheed Martin Corporation Edge detection using Hough transformation
JP5369175B2 (ja) * 2008-05-22 2013-12-18 オーチス エレベータ カンパニー 映像によるエレベータドアの検出装置および検出方法
RU2484531C2 (ru) * 2009-01-22 2013-06-10 Государственное научное учреждение центральный научно-исследовательский и опытно-конструкторский институт робототехники и технической кибернетики (ЦНИИ РТК) Устройство обработки видеоинформации системы охранной сигнализации
US20110026770A1 (en) * 2009-07-31 2011-02-03 Jonathan David Brookshire Person Following Using Histograms of Oriented Gradients
US20120169860A1 (en) * 2010-06-30 2012-07-05 Guan Lian Method for detection of a body part gesture to initiate a web application
JP5587137B2 (ja) * 2010-10-29 2014-09-10 キヤノン株式会社 測定装置及び測定方法
KR20120067757A (ko) * 2010-12-16 2012-06-26 한국전자통신연구원 항공 영상 간 대응 관계 추출 장치 및 그 방법
JP5652227B2 (ja) * 2011-01-25 2015-01-14 ソニー株式会社 画像処理装置および方法、並びにプログラム
CN102156882A (zh) * 2011-04-14 2011-08-17 西北工业大学 一种基于高分辨遥感图像的机场目标检测方法
WO2013029674A1 (en) * 2011-08-31 2013-03-07 Metaio Gmbh Method of matching image features with reference features
US9245194B2 (en) 2012-02-06 2016-01-26 Apple Inc. Efficient line detection method
CN102663395B (zh) 2012-03-05 2013-11-06 西北工业大学 基于自适应多尺度快速离散Beamlet变换的直线检测方法
CN102750703B (zh) * 2012-06-27 2015-01-07 北京航空航天大学 一种基于直线分割的遥感图像机场自动检测方法
US9183458B2 (en) * 2012-07-19 2015-11-10 Qualcomm Incorporated Parameter selection and coarse localization of interest regions for MSER processing
US9633436B2 (en) * 2012-07-26 2017-04-25 Infosys Limited Systems and methods for multi-dimensional object detection
US20140270479A1 (en) * 2013-03-15 2014-09-18 Sony Corporation Systems and methods for parameter estimation of images
CN103383733B (zh) * 2013-05-16 2016-09-14 浙江智尔信息技术有限公司 一种基于半机器学习的车道视频检测方法
CN103308056B (zh) 2013-05-23 2015-09-16 中国科学院自动化研究所 一种道路标线检测方法
CN103914830B (zh) * 2014-02-22 2017-02-01 小米科技有限责任公司 直线检测方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10275213A (ja) * 1997-03-31 1998-10-13 Fuji Photo Film Co Ltd 放射線画像の照射野認識方法および装置、並びに黒化処理方法および装置
US20130335575A1 (en) * 2012-06-14 2013-12-19 Qualcomm Incorporated Accelerated geometric shape detection and accurate pose tracking

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6016017316; R. K. Satzoda et al.: '"Gradient Angle Histograms for Efficient Linear Hough Transform"' 2009 IEEE International Conference on Image Processing (ICIP) , 20091107, pp.3273-3276, IEEE *
JPN6016017320; Kuo-Liang Chung et al.: '"New orientation-based elimination approach for accurate line-detection"' Pattern Recognition Letters Vol.31, No.1, 20100101, pp.11-19, Elsevier B.V. *
JPN6016017325; N. Dalal et al.: '"Histograms of Oriented Gradients for Human Detection"' 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR 2005) Vol.1, 20050625, pp.886-893, IEEE *

Also Published As

Publication number Publication date
MX358505B (es) 2018-08-22
RU2616539C2 (ru) 2017-04-17
CN103914830A (zh) 2014-07-09
BR112014026245A2 (pt) 2017-06-27
EP2911093B1 (en) 2017-08-23
CN103914830B (zh) 2017-02-01
JP6007354B2 (ja) 2016-10-12
RU2015134095A (ru) 2017-02-16
US20150242699A1 (en) 2015-08-27
KR20150108303A (ko) 2015-09-25
WO2015123973A1 (zh) 2015-08-27
US9449245B2 (en) 2016-09-20
KR101613637B1 (ko) 2016-04-19
MX2014012750A (es) 2016-02-19
EP2911093A3 (en) 2015-11-18
EP2911093A2 (en) 2015-08-26

Similar Documents

Publication Publication Date Title
JP6007354B2 (ja) 直線検出方法、装置、プログラム、及び記録媒体
TWI728621B (zh) 圖像處理方法及其裝置、電子設備、電腦可讀儲存媒體和電腦程式
WO2021128578A1 (zh) 图像处理方法及装置、电子设备和存储介质
TWI724736B (zh) 圖像處理方法及裝置、電子設備、儲存媒體和電腦程式
CN105069786B (zh) 直线检测方法及装置
US8879803B2 (en) Method, apparatus, and computer program product for image clustering
US11288531B2 (en) Image processing method and apparatus, electronic device, and storage medium
US20170083741A1 (en) Method and device for generating instruction
CN104756475A (zh) 移动设备中的相机变焦指示符
JP2016532351A (ja) プライバシー情報隠匿方法及び、プライバシー情報隠匿装置、プログラム及び記録媒体
US20150296317A1 (en) Electronic device and recording method thereof
CN110503023A (zh) 活体检测方法及装置、电子设备和存储介质
US9014428B2 (en) Object detection using difference of image frames
CN108307308B (zh) 无线局域网设备的定位方法、装置和存储介质
CN108009563B (zh) 图像处理方法、装置及终端
CN105046260A (zh) 图像预处理方法及装置
CN106485660A (zh) 电子地图的缩放方法和装置
US20220270352A1 (en) Methods, apparatuses, devices, storage media and program products for determining performance parameters
KR20210148134A (ko) 대상 카운트 방법, 장치, 전자 기기, 저장 매체 및 프로그램
CN110673811A (zh) 基于声音信息定位的全景画面展示方法、装置及存储介质
US9633273B2 (en) Method for processing image and electronic device thereof
CN104216969A (zh) 阅读标记方法及装置
CN107993192A (zh) 证件图像校正方法、装置和设备
CN107943317A (zh) 输入方法及装置
US20150262033A1 (en) Method and terminal device for clustering

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160803

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160912

R150 Certificate of patent or registration of utility model

Ref document number: 6007354

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250