JP5845139B2 - 図形検出処理装置、図形検出処理方法及び図形検出処理プログラム - Google Patents

図形検出処理装置、図形検出処理方法及び図形検出処理プログラム Download PDF

Info

Publication number
JP5845139B2
JP5845139B2 JP2012120625A JP2012120625A JP5845139B2 JP 5845139 B2 JP5845139 B2 JP 5845139B2 JP 2012120625 A JP2012120625 A JP 2012120625A JP 2012120625 A JP2012120625 A JP 2012120625A JP 5845139 B2 JP5845139 B2 JP 5845139B2
Authority
JP
Japan
Prior art keywords
graphic
region
probability distribution
image
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012120625A
Other languages
English (en)
Other versions
JP2013246674A (ja
Inventor
仁 新垣
仁 新垣
島村 潤
潤 島村
森本 正志
正志 森本
新井 啓之
啓之 新井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012120625A priority Critical patent/JP5845139B2/ja
Publication of JP2013246674A publication Critical patent/JP2013246674A/ja
Application granted granted Critical
Publication of JP5845139B2 publication Critical patent/JP5845139B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像から円形や四角形、また三角形などの特定の図形を検出する図形検出処理装置、図形検出処理方法及び図形検出処理プログラムに関する。
コンピュータビジョンの分野において、円や直線などの特定の図形を検出する手法としてHough変換(例えば、非特許文献1参照)が広く利用されている。Hough変換とは、まず画像からエッジ(物体の輪郭)検出を行い、次に検出されたエッジに含まれる画素を用いて、円形や直線などの検出対象となる図形の位置や半径(パラメータ)を投票処理により決定するものである。エッジ検出はソーベルフィルタやキャニー法などを用いて行う。
しかしながら、検出対象の図形と背景の色のコントラストが小さい場合やカメラの焦点ぼけにより図形の境界画素の色が背景と混ざってしまっている場合には、エッジを検出すること自体が難しい。ノイズの多い画像やコントラストの低い画像においては、検出対象の図形以外の輪郭のエッジも検出してしまうため、Hough変換では誤検出をしやすいという問題がある。
従来手法において、このようなエッジの抽出が困難な画像に対してのアプローチとして、分離度フィルタを用いた図形検出手法(例えば、非特許文献2参照)がある。この手法は、特定の図形の形をした2つの領域(テンプレート)マスクを用意し、マスク内の2つの領域の分離度を計算する。分離度とは、2つの領域内の画素の輝度値について、線形判別分析法の尺度(クラス内分散とクラス間分散)により2つのマスク領域の輝度値の違いを計算したものである。2つの領域の色や輝度値の違いが大きいほど、分離度も大きい値となる。
しかしながら、この手法は線形判別分析法をもとにしているため、各領域内の輝度値の分布が正規分布であるときには精度良く図形を検出できるが、検出対象となる図形の色が一様でなくて細かい模様があったり、センサのノイズ等の影響により輝度値に大きなばらつきがある場合には、輝度値の分布が正規分布ではなくなるため、図形検出が難しいという問題がある。
Generalizing the Hough transform to detect arbitrary shapes, D.H.Ballard, Pattern Recognition, (1981) 形状抽出とパターン照合の組み合わせによる顔特徴点抽出,福井,山口,電子情報通信学会論文誌,D−II,Vol.80−D−II,No.8 pp.2170−2177(1997)
前述したように、従来手法であるエッジ検出を前提とした図形検出をするハフ変換では、検出対象の図形の色もしくは輝度値と背景の色もしくは輝度値のコントラストが小さい場合には、エッジが安定して抽出できないために図形の検出精度も低くなるという問題がある。
また、検出対象となる図形と背景のコントラストが小さい場合でも安定して図形を検出できる分離度フィルタにおいては、対象となる図形の色(もしくは輝度値)が一様でない場合、つまり図形に模様があったり、センサの測定誤差によるノイズが多い場合には、検出精度が低下するという問題がある。
本発明は、このような事情に鑑みてなされたもので、検出対象となる図形の色もしくは輝度値が一様でない場合や検出対象となる図形と背景の色もしくは輝度値のコントラストが小さい場合にも、安定して図形を検出することができる図形検出処理装置、図形検出処理方法及び図形検出処理プログラムを提供することを目的とする。
本発明は、処理対象の画像を入力する画像入力手段と、前記画像の注目画素に対して、検出すべき図形に応じて予め決められた第1の領域及び第2の領域を有するマスクを設定するマスク設定手段と、前記注目画素を移動しながら、前記第1の領域内の画像特徴量の確率分布である第1の確率分布と、前記第2の領域内の画像特徴量の確率分布である第2の確率分布とを求める確率分布生成手段と、前記第1の確率分布と前記第2の確率分布とに基づいて、前記2つの確率分布の異なる度合いを示す分離度合い指標と、前記第1の領域及び第2の領域内における前記確率分布の自己相似性の度合いを示す自己相似度合い指標とを求め、前記分離度合い指標と前記自己相似度合い指標とから検出すべき図形らしさを示す図形指標を算出する指標算出手段と、前記図形指標に対して、閾値処理を行うことにより、前記注目画素に位置する図形が検出すべき図形であるか否かを判定する判定手段とを備えたことを特徴とする。
本発明は、前記画像特徴量が画素値であり、前記判定手段は、前記注目画素に位置する図形が検出すべき図形であると判定した場合に、前記図形の輪郭が存在するべき画素の画素値勾配の強度と画素値勾配の方向に基づき検出図形の絞り込みを行うことを特徴とする。
本発明は、前記検出すべき図形のテンプレート画像を予め記憶したテンプレート記憶手段をさらに備え、前記判定手段は、前記注目画素に位置する図形が検出すべき図形であると判定した場合に、前記図形と前記テンプレート記憶手段に記憶された前記テンプレート画像とを比較し、比較結果に基づき、検出図形の絞り込みを行うことを特徴とする。
本発明は、前記指標算出手段は、バタチャリア係数を用いて前記分離度合い指標と前記自己相似度合い指標とを求めることを特徴とする。
本発明は、処理対象の画像を入力する画像入力手段を備える図形検出処理装置が行う図形検出方法であって、前記画像の注目画素に対して、検出すべき図形に応じて予め決められた第1の領域及び第2の領域を有するマスクを設定するマスク設定ステップと、前記注目画素を移動しながら、前記第1の領域内の画像特徴量の確率分布である第1の確率分布と、前記第2の領域内の画像特徴量の確率分布である第2の確率分布とを求める確率分布生成ステップと、前記第1の確率分布と前記第2の確率分布とに基づいて、前記2つの確率分布の異なる度合いを示す分離度合い指標と、前記第1の領域及び第2の領域内における前記確率分布の自己相似性の度合いを示す自己相似度合い指標とを求め、前記分離度合い指標と前記自己相似度合い指標とから検出すべき図形らしさを示す図形指標を算出する指標算出ステップと、前記図形指標に対して、閾値処理を行うことにより、前記注目画素に位置する図形が検出すべき図形であるか否かを判定する判定ステップとを有することを特徴とする。
本発明は、コンピュータを、前記図形検出処理装置として機能させるための図形検出処理プログラムである。
本発明によれば、検出対象となる図形の色もしくは輝度値が一様でない場合や検出対象となる図形と背景の色もしくは輝度値のコントラストが小さい場合にも、安定して図形を検出できるという効果が得られる。また、実画像において、センサ等のノイズが大きいような画像や画像全体が暗くてコントラストが低い画像においても精度良く図形を検出することができるという効果も得られる。
本発明の第1の実施形態の構成を示すブロック図である。 図1に示す図形検出処理装置100の処理動作を示すフローチャートである。 入力画像の一例を示す図である。 フィルタ(円形)用マスクの一例を示す図である。 四角形を検出するときのフィルタ用のマスク例を示す図である。 入力画像Iのマンホールを含む注目画素m周辺の拡大図である。 領域Rと領域Rをそれぞれ分割して作成した小領域を示す図である。 半径rを変化させたときの分離度合いの変化を示す図である。 マンホール及び周辺を拡大した画像を示す図である。 第2の実施形態による図形検出処理装置100の処理動作を示すフローチャートである。 入力画像と一部を拡大した拡大図を示す図である。 第3の実施形態による図形検出処理装置100の構成を示すブロック図である。 テンプレート画像の一例を示す説明図である。 図12に示す図形検出処理装置100の処理動作を示すフローチャートである。
以下、図面を参照して、本発明の実施形態による図形検出処理装置を説明する。本実施形態による図形検出処理装置は、特定の形、例えば円形や三角形や矩形(四角形)の図形を検出するものである。以下の説明では、具体的な例としてレーザーレンジファインダにより取得したレーザーの反射強度画像を用いた、円形の物体であるマンホールの検出を行うことを例にして説明する。
<第1の実施形態>
図1は、第1の実施形態による図形検出処理装置の構成を示すブロック図である。この図において、符号100は、画像から特定の図形を検出する図形検出処理装置であり、コンピュータ装置によって構成する。符号101は、カメラもしくはレーザーレンジファインダによって被写体の画像を撮影する被写体撮影部である、被写体撮影部101は、レーザーレンジファインダによる撮影に代えて、RGB輝度値を出力するカメラや赤外線カメラを用いて被写体を撮影するようにしてもよい。被写体撮影部101は、飛行機に設置され、上空から地上を撮影したり、また自動車の上に搭載して周囲を撮影をするものである。符号102は、図形検出処理装置100において必要なパラメータを入力するパラメータ入力部であり、例えばキーボードやマウス、タッチ入力装置などのユーザーインタフェースや、DVD(Digital Versatile Disc)やUSB(Universal Serial Bus)メモリ等の外部記憶装置からのパラメータのデータの転送装置である。
符号103は、被写体撮影部101により撮影した反射強度や輝度値を映像信号として記憶する画像記憶部であり、例えばHDD(Hard Disk Drive)やSSD(Solid State Drive)等のハードウェアによる記憶装置であり、同一でも別々のハードウェアでもよい。符号104は、パラメータ入力部102からパラメータの値を取得し、画像記憶部103から処理対象となる画像Iを取得し、図形検出処理を行う図形検出処理部である。図形形状フィルタ処理部104は、フィルタマスクROI処理部104a、画像特徴量の確率分布生成部104b、分離度合い指標算出部104c、自己相似度合い指標算出部104d及び図形指標計算部104eから構成する。
符号105は、図形検出処理部104の結果を取得し、検出された図形の位置等のパラメータ情報を出力する図形判定部である。符号107は、画像Iと検出された図形のパラメータ情報をアスキーコードなどのテキストデータやバイナリデータに変換し、そのデータをディスプレイ表示用の映像信号として出力する検出図形出力部である。パラメータとは、図形の形や大きさ、また位置情報を意味する。符号108は、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)、PDP(Plasma Display Panel)等の表示装置で構成する検出図形表示部である。
次に、図2、図3を参照して、図1に示す図形検出処理装置100の処理動作を説明する。図2は、図1に示す図形検出処理装置100の処理動作を示すフローチャートである。図3は、入力画像の一例を示す図である。まず、図形形状フィルタ処理部104は、画像記憶部103から画像Iを入力する(ステップS1)。画像Iにおいて、図3で示すような画像Iの左上を原点とした横方向をX軸、縦方向をY軸とした画像座標系であるものとする。画像の画素mについてI(m)は画素mの色(Red,Blue,Green)もしくは輝度値を表す。ここで、画像がRGB(Red,Blue,Green)画像の場合、事前に濃淡画像に変換をするか、もしくは、R、G、Bそれぞれについて以下の処理を独立して行い、図形指標算出部104eで求めたそれぞれの図形指標の平均値を、図形判定部105へ出力する。以下の説明では、「輝度値」(請求項においては「画素値」を用いている)は、R、G、Bそれぞれの反射強度や赤外線の反射強度値、レーザーの反射強度値を意味することとする。
次に、図形形状フィルタ処理部104は、入力画像Iについて平滑化フィルタをかける(ステップS2)。平滑化フィルタによりノイズの影響を抑える。具体的には、ガウシアンフィルタやメディアンフィルタを使用する。フィルタのパラメータに、フィルタのウィンドウの大きさがあるが、ここでは大きさが5画素のウィンドウ、ガウシアンフィルタの標準偏差σは1.0の値を用いる。ただし、ウィンドウサイズや標準偏差σは1.0以外でもよく、最適な値は画像に依存するので実験的に決定される値である。ガウシアンフィルタfのフィルタ係数を以下の式で示す。
ここでΔx,Δyとは、フィルタをかける注目画素mからのx軸とy軸方向の差分量である。
次に、図形形状フィルタ処理部104は、画像Iの各画素mについて以下のステップS4、S5の処理を実行して図形検出フィルタ処理を行う(ステップS3)。これは、領域ベースの輪郭検出手法の1つであり、図4で示すように対象となる図形(図4に示す例では円を対象図形とする)の形のマスクを用意して、フィルタマスクROI処理部104aが処理する。図4は、フィルタ用マスクの一例を示す図である。このマスクは、2つの同心円の半径r1−半径rで囲まれた領域Rと半径r2−半径rで囲まれた領域Rの2つの領域から構成する。もちろん、円形以外のマスクを使うことで、検出対象の図形の形を変えることができる。図5に四角形を検出するときのフィルタ用のマスク例を示す。図5は、四角形を検出するときのフィルタ用のマスクを示す図である。
次に、画像特徴量の確率分布生成部104bは、各領域R(i∈1,2)の画像特徴量の確率分布P(i∈1,2)を計算する(ステップS4)。図6は、入力画像Iのマンホールを含む注目画素m周辺の拡大図である。まず、フィルタマスクROI処理部104aは、注目画素mについて、半径r2の実線の円で囲われる領域をフィルタマスク処理領域ROI(Region of Interest)として設定する。つまり、注目画素mから半径r2以内のメモリアドレスを取得する。ここでは、画像特徴量を輝度値(スカラ値)として説明するが、局所特徴量であるSIFT(Scale-Invariant Feature Transform)やHOG(Histgrams of Oriented Gradients)等の多次元のベクトルを用いてもよい。特徴量が多次元ベクトルになった場合にも、多次元空間での確率分布を求めることで、以下同様の処理を行い図形検出することが可能である。本実施形態では、特徴量を輝度値とした例の確率分布の求め方を説明する。
各領域R(i∈1,2)について、各マスク領域内の画素をもとに輝度値の頻度分布を作成する。図6に、領域Rにおける画素の輝度値(0〜255の値)を階級とし、各輝度値の画素数から頻度を計算した例を示す。この頻度分布の頻度の総和Zを用いて、頻度分布のそれぞれのビン(頻度)の値を頻度の総和Zで割ることで正規化を行い、確率分布P,Pを求める。本実施形態における確率分布とは、頻度分布の総和が1.0に正規化されたヒストグラムのことである。つまり、図6の例では、Zは領域Rの全画素数である。領域Rの確率分布Pも同様にして求める。
次に、分離度合い指標算出部104cと自己相似度合い指標算出部104dは、領域Rと領域Rの確率分布P(i∈1,2)を用いて、領域Rと領域Rの画像特徴量の確率分布の異なる度合いの指標ξsep(分離度合い)と各領域R(i∈1,2)内では、場所によらず模様(画像特徴量)が似ている度合いの指標ξuni(自己相似度合い)を算出する。
次に、図形指標計算部104eは、分離度合い指標算出部104cと自己相似度合い指標算出部104dにおいて算出した2つの指標を用いて、図形指標ζを求める(ステップS5)。分離度合い指標ξsepと自己相似度合い指標ξuniと図形指標ζは、以下の式で求まる。
ただし、SR (j)は領域R(i∈1,2)を分割したj個目の小領域、φ(R)は領域Rの確率分布Pを出力する関数である。jとj’は小領域番号(j,j’∈1,2,3,...,N)であり、simは2つの領域における画像特徴の確率分布の類似度を出力する関数である。小領域SR (j)は、領域RをN分割した領域である。
ここでは、N=4とし、SR (j)は図7に示すように角度θα=45・j度からθβ=θα+90度で囲まれた領域とする。図7は、領域Rと領域Rをそれぞれ分割して作成した小領域を示す図である。simは2つの確率分布の類似度を評価する関数であればよく、Earth Mover’s Distanceやバタチャリア係数(Bhattacharyya Coefficient)、ヒストグラムインタセクションなどである。
本実施形態ではバタチャリア係数を用いる。バタチャリア係数は2つの分布間の類似度を表すものであり、2つの分布が同一であれば1を、分布間に重なりがなければ0を出力する。そのため、(2)式により2つの確率分布が異なる程バタチャリア係数が小さくなり、分離度合いξsepは大きくなる。一方、同一領域内の小領域間の確率分布の形状が類似しているほどξuniは大きくなる。ここで、Pを確率分布、ヒストグラムのビン(階級)をk、ビンの数を大文字のKで表わし、各ビンkの確率をp(k)で表すと、領域Rと領域Ri’のバタチャリア係数を用いて確率分布間距離simを求める。
もちろん、図形指標ζの算出方法は、(2)式以外でもよく、マスク領域間の画像特徴量の分離度合いの指標ξsepと各マスク領域内での画像特徴量の自己相似度合いの指標ξuniの統合方法は、以下のようなパラメータを用いた式でもよい。
ここで、λは2つの指標の重視する重みを決めるためのパラメータである。
また、図3に示す白線近くの画像例3のような位置では領域Rに白線が含まれるために、マンホールがなくても領域Rと領域Rの分離度合いξsepが大きくなる。そこで、ξsepの計算において領域Rとそれを囲む8方向の小領域R l(l∈1,2,3,...,8)の確率分布を比較することで、コントラストの大きい白線やコーナー近くでξsepが大きくなることを抑えることができる。
領域Rと領域Rの画像特徴量の確率分布の異なる度合い(分離度合い)指標ξsepについて、(2)式のξsepの代わりに(7)式のξsep8を図形指標ζの算出する(2)式や(6)式に用いることで、コーナーや白線付近の点に反応しにくい図形検出が可能となる。
次に、パラメータr(半径)について説明する。入力画像Iにおいて検出対象となる図形の大きさが一定でないときにパラメータ半径rの大きさも推定する必要がある。例えば、検出対象図形(マンホール)の半径が16画素、18画素、20画素など様々な大きさがある場合、図8に示すように注目画素mにおいて半径rを16<r< 20で変化させて図形指標ζを求める必要がある。図8は、半径rを変化させたときの分離度合いの変化を示す図である。つまり、r=16〜20すべての値で図形指標ζを計算し、ζが最も大きな値となるときの半径rを画素mにおける図形パラメータ候補とする。
次に、図形判定部105は、フィルタ処理後の図形指標ζについて、局所領域内での最大値となる場所を検出する(ステップS6)。例えば、図9のように、画像を縦と横それぞれH画素のグリッドに区切り、各グリッド内について最大の図形指標ζの値をとる画素を図形が存在する候補地点として出力する。図9は、マンホール及び周辺を拡大した画像を示す図である。グリッドの大きさHは実験的に決めるパラメータであり、ここでは検出図形(円)の直径が最小で32画素なので、Hは32画素と設定する。
次に、図形判定部105は、各候補地点の図形指標ζが閾値Thζ以上か否かを調べる(ステップS7)。閾値Thζ以上の画素位置を図形が存在すると判定する。ただし、閾値Thζは0から1の値をとり、実験的に決定するパラメータである。ここでは、(2)式の図形指標ζの閾値Thζ=0.1とする。
次に、検出図形出力部107は、画像Iと検出された図形のパラメータ情報をアスキーコードなどのテキストデータやバイナリデータに変換し、そのデータをディスプレイ表示用の映像信号として検出図形表示部108へ出力する。
<第2の実施形態>
次に、本発明の第2の実施形態による図形検出処理装置を説明する。図10は、第2の実施形態による図形検出処理装置の処理動作を示すフローチャートである。第2の実施形態における装置構成は、図1に示す装置構成と同様であるので、ここでは詳細な説明を省略する。図10において、図2に示す処理動作と同一の部分には同一の符号を付し、その説明を省略する。図10に示す処理動作が図2に示す処理動作と異なる点は、ステップS8が新たに追加されている点である。
図形判定部105は、求めた図形が存在する候補地点m= [m,m]について、対象図形が存在するか否かの判定をステップS7までの処理推定した図形パラメータ(半径r)を用いて評価する。ただし、m,mは候補地点の位置mのx座標とy座標を表し、添字のTは転置を表す。
図11の拡大図に示すように、十字印の位置に検出対象の円形が存在するか否かを調べる。図11は、入力画像と一部を拡大した拡大図を示す図である。注目画素mに半径rの円が存在する仮定した場合、半径rの円弧上の画素n=[n,n](∈Ω)における輝度勾配の方向をθn(i)、画像の輝度勾配から求めた画素nにおける輝度勾配の方向をθ(i)、ソーベルフィルタにより作成したx方向の輝度勾配画像をE、y軸方向の輝度勾配画像をEとすると、位置mにおける対象図形が存在する尤度Lgrad(m)は次式で求まる。
ただし、εは零割りを避けるための微小値であり、ここではε=0.0001とする。
最後に、図形判定部105は、尤度Lgrad(m)について閾値Thgrad以上の値であれば、画素mに検出対象となる図形が存在すると判定する(ステップS8)。閾値Thgradは0から1の値をとり、実験的に決めるパラメータである。本実施形態ではThgrad=0.2とした。
文献「ハフ変換と分離度フィルタによる人物顔からの両目の検出,川口,日高,安部,信学技法,PRMU99−113(1999)」においても、エッジ情報を用いるという点で同様のアプローチがある。これは、分離度フィルタにより図形位置の候補地点をもとめた後に、求めたパラメータ半径r上の画素のエッジ抽出を行い、エッジ上の画素を用いて投票する方法である。一方、本実施形態ではエッジ上の画素による投票ではなく、半径rの画素の輝度勾配θ(n)とθ(n)の類似度(8)式を用いる点が異なる。これにより、エッジが存在するか判定する処理が必要なく、またエッジ判定精度の影響を受けにくい図形検出ができる。
<第3の実施形態>
次に、本発明の第3の実施形態による図形検出処理装置を説明する。図12は、第3の実施形態による図形検出処理装置100の構成を示すブロック図である。図12において、図1に示す装置と同一の部分には同一の符号を付し、その説明を省略する。図12に示す装置が図1に示す装置と異なる点は、テンプレート記憶部106が新たに追加されている点である。テンプレート記憶部106は、画像記憶部103に記憶されている画像からテンプレート情報を生成し、記憶する。またテンプレート記憶部106は、図形判定部105へテンプレート情報を出力する。ここで、テンプレート情報とは、レーザーレンジファインダにより取得した反射強度の画像やカメラで撮影した輝度値のカラー(R、G、B)の画像のことである。図13に、テンプレート画像の例を示す。図13は、テンプレート画像の一例を示す図である。テンプレート画像は、入力画像から一部を切り出して生成する。
次に、図14を参照して、図12に示す図形検出処理装置100の処理動作を説明する。図14は、図12に示す図形検出処理装置100の処理動作を示すフローチャートである。図14において、図2に示す処理動作と同一の部分には同一の符号を付し、その説明を省略する。図14に示す処理動作が図2に示す処理動作と異なる点は、ステップS9が新たに追加し、図形判定部105は、ステップ7において判定した図形の位置を最終的な検出位置とするのではなく、図形が存在する候補位置とする点が異なる。
図形判定部105は、ステップ7で求めた図形候補位置である画素mを中心として幅W画素の範囲のウィンドウを設定する。このウィンドウ内の画像と予めテンプレート記憶部106に記憶しておいたテンプレート画像を比較することで、画素mの位置に図形が存在しているか否かの判定を行う(ステップS9)。
画像特徴は位置を示す画素mにおけるSIFTやHOG等の局所特徴量、もしくはウィンドウW内の局所領域の画像の輝度値をラスタースキャンして作成したベクトルでもよい。注目画素mの画像特徴量をVmテンプレート画像の特徴量の数をF、テンプレート画像の画像特徴量をVf(f∈1,2,…F)で表わすと次式で尤度Limgが求まる。
尤度Limgについて、閾値Thimg以下の値であれば、画素mに対象図形があると判定する。閾値Thimgは0から1の値をとり、実験的に決めるパラメータである。ここでは閾値Thimg=0.5とした。これ以降の処理動作は、前述した処理動作と同様である。
以上説明したように、従来の図形検出手法である分離度フィルタでは、2つの領域内の画素の画像特徴量(たとえば輝度値、色、テクスチャ)の分布がそれぞれ正規分布であること、つまり検出対象の図形と背景の画素の色に斑がない場合に、図形を精度良く検出できる。これに対して本実施形態では、2つの領域内の画像特徴量(色や輝度値やテクスチャ)の分布の確率分布を比較することで分離度合いを決めるようにした。これにより、画素の輝度値(もしくは色やテクスチャ)の分布が正規分布に従わない、例えば検出対象の図形内の色や背景の色に模様がありその分布が多峰性となるときでも安定して2つの領域の違いが評価でき特定の図形が存在する位置(候補地点)を求めることができる。
また、2つの領域の画像特徴量の確率分布の違いを評価することで図形の存在候補地点を決定したあとに、求めた図形の輪郭が存在するべき画素の輝度勾配の強度と輝度勾配の方向を調べることで、よりノイズに頑健な検出ができる。また、求める図形が特定の物体と限定できる場合(例えば、円形の場合に瞳、道路標識、マンホールのような物体など)、その物体の画像をテンプレート画像として複数登録し、図形が存在する候補地点の周辺領域(局所領域)の画像とテンプレート画像を比較することで、更に検出精度の向上が実現できる。
なお、図1、図12における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより図形検出処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行っても良い。
本発明は、画像から円形や四角形、また三角形などの特定の図形を検出する際に、ノイズを含む画像や背景と検出対象の図形のコントラストが低い画像においても所望の図形を検出することが不可欠な用途に適用できる。
101・・・被写体撮影部、102・・・パラメータ入力部、103・・・画像記憶部、104・・・図形形状フィルタ処理部、104a・・・フィルタマスクROI処理部、104b・・・画像特徴量の確率分布生成部、104c・・・第1指標算出部、104d・・・第2指標算出部、104e・・・図形指標計算部、105・・・図形判定部、106・・・テンプレート記憶部、107・・・検出図形出力部、108・・・検出図形表示部

Claims (7)

  1. 処理対象の画像を入力する画像入力手段と、
    前記画像の注目画素に対して、検出すべき図形に応じて予め決められた第1の領域及び第2の領域を有し、前記第1の領域と前記第2の領域の境界が前記検出すべき図形の形であるマスクを設定するマスク設定手段と、
    前記注目画素を移動しながら、前記第1の領域内の画像特徴量の確率分布である第1の確率分布と、前記第2の領域内の画像特徴量の確率分布である第2の確率分布とを求める確率分布生成手段と、
    前記第1の確率分布と前記第2の確率分布とに基づいて、前記2つの確率分布の異なる度合いを示す分離度合い指標と、前記第1の領域及び第2の領域内における前記確率分布の自己相似性の度合いを示す自己相似度合い指標とを求め、前記分離度合い指標で表される分離度合いが大きいほど、かつ、前記自己相似度合い指標で表される前記各領域内での類似の度合いが高いほど、検出すべき図形らしさが大きくなるよう、検出すべき図形らしさを示す図形指標を算出する指標算出手段と、
    前記図形指標に対して、閾値処理を行うことにより、前記注目画素に位置する図形が検出すべき図形であるか否かを判定する判定手段と
    を備えたことを特徴とする図形検出処理装置。
  2. 前記画像特徴量が画素値であり、
    前記判定手段は、前記注目画素に位置する図形が検出すべき図形であると判定した場合に、前記図形の輪郭が存在するべき画素の画素値勾配の強度と画素値勾配の方向に基づき検出図形の絞り込みを行うことを特徴とする請求項1に記載の図形検出処理装置。
  3. 前記検出すべき図形のテンプレート画像を予め記憶したテンプレート記憶手段をさらに備え、
    前記判定手段は、前記注目画素に位置する図形が検出すべき図形であると判定した場合に、前記図形と前記テンプレート記憶手段に記憶された前記テンプレート画像とを比較し、比較結果に基づき、検出図形の絞り込みを行うことを特徴とする請求項1に記載の図形検出処理装置。
  4. 前記指標算出手段は、バタチャリア係数を用いて前記分離度合い指標と前記自己相似度合い指標とを求めることを特徴とする請求項1から3のいずれか1項に記載の図形検出処理装置。
  5. 前記指標算出手段は、
    前記第2の領域を分割して作成した2つ以上の小領域それぞれと、前記第1の領域との分離度合いの中で、分離度合いが最も小さな組み合わせから前記分離度合い指標を求めることを特徴とする請求項1に記載の図形検出処理装置。
  6. 処理対象の画像を入力する画像入力手段を備える図形検出処理装置が行う図形検出処理方法であって、
    前記画像の注目画素に対して、検出すべき図形に応じて予め決められた第1の領域及び第2の領域を有し、前記第1の領域と前記第2の領域の境界が前記検出すべき図形の形であるマスクを設定するマスク設定ステップと、
    前記注目画素を移動しながら、前記第1の領域内の画像特徴量の確率分布である第1の確率分布と、前記第2の領域内の画像特徴量の確率分布である第2の確率分布とを求める確率分布生成ステップと、
    前記第1の確率分布と前記第2の確率分布とに基づいて、前記2つの確率分布の異なる度合いを示す分離度合い指標と、前記第1の領域及び第2の領域内における前記確率分布の自己相似性の度合いを示す自己相似度合い指標とを求め、前記分離度合い指標で表される分離度合いが大きいほど、かつ、前記自己相似度合い指標で表される前記各領域内での類似の度合いが高いほど、検出すべき図形らしさが大きくなるよう、検出すべき図形らしさを示す図形指標を算出する指標算出ステップと、
    前記図形指標に対して、閾値処理を行うことにより、前記注目画素に位置する図形が検出すべき図形であるか否かを判定する判定ステップと
    を有することを特徴とする図形検出処理方法。
  7. コンピュータを、請求項1からのいずれか1項に記載の図形検出処理装置として機能させるための図形検出処理プログラム。
JP2012120625A 2012-05-28 2012-05-28 図形検出処理装置、図形検出処理方法及び図形検出処理プログラム Active JP5845139B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012120625A JP5845139B2 (ja) 2012-05-28 2012-05-28 図形検出処理装置、図形検出処理方法及び図形検出処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012120625A JP5845139B2 (ja) 2012-05-28 2012-05-28 図形検出処理装置、図形検出処理方法及び図形検出処理プログラム

Publications (2)

Publication Number Publication Date
JP2013246674A JP2013246674A (ja) 2013-12-09
JP5845139B2 true JP5845139B2 (ja) 2016-01-20

Family

ID=49846380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012120625A Active JP5845139B2 (ja) 2012-05-28 2012-05-28 図形検出処理装置、図形検出処理方法及び図形検出処理プログラム

Country Status (1)

Country Link
JP (1) JP5845139B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9727800B2 (en) * 2015-09-25 2017-08-08 Qualcomm Incorporated Optimized object detection
CN117830299B (zh) * 2024-03-04 2024-05-17 湖南南源新材料有限公司 一种无纺布表面缺陷检测方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01238652A (ja) * 1988-03-19 1989-09-22 Fuji Photo Film Co Ltd 放射線画像の被写体認識方法
JPH10283484A (ja) * 1997-04-10 1998-10-23 Tsubakimoto Chain Co 輪郭線抽出方法及び輪郭線抽出装置
JPH1185996A (ja) * 1997-09-12 1999-03-30 Toshiba Corp 分離度フィルタリング処理装置
JP4327653B2 (ja) * 2004-05-10 2009-09-09 シャープマニファクチャリングシステム株式会社 画像処理方法および画像処理装置ならびに画像処理プログラムおよび画像処理プログラムを記録した記録媒体
JP2010205067A (ja) * 2009-03-04 2010-09-16 Fujifilm Corp 領域抽出装置、領域抽出方法及び領域抽出プログラム
EP2395452A1 (en) * 2010-06-11 2011-12-14 Toyota Motor Europe NV/SA Detection of objects in an image using self similarities

Also Published As

Publication number Publication date
JP2013246674A (ja) 2013-12-09

Similar Documents

Publication Publication Date Title
Liasis et al. Satellite images analysis for shadow detection and building height estimation
Hoang et al. Metaheuristic optimized edge detection for recognition of concrete wall cracks: a comparative study on the performances of roberts, prewitt, canny, and sobel algorithms
Jovančević et al. Automated exterior inspection of an aircraft with a pan-tilt-zoom camera mounted on a mobile robot
US8805077B2 (en) Subject region detecting apparatus
EP2079054B1 (en) Detection of blobs in images
JP6069489B2 (ja) 物体認識装置および物体認識方法並びにプログラム
US8923610B2 (en) Image processing apparatus, image processing method, and computer readable medium
Li et al. Texton analysis for mass classification in mammograms
KR102073468B1 (ko) 비전 시스템에서 컬러 이미지에 대해 컬러 후보 포즈들의 점수화를 위한 시스템 및 방법
US9805249B2 (en) Method and device for recognizing dangerousness of object
TW201616451A (zh) 點雲套索選取系統及方法
CN110910445B (zh) 一种物件尺寸检测方法、装置、检测设备及存储介质
Hagara et al. About Edge Detection in Digital Images.
US10503969B2 (en) Hand-raising detection device, non-transitory computer readable medium, and hand-raising detection method
CN109727279B (zh) 一种矢量数据与遥感影像的自动配准方法
EP3300025A1 (en) Image processing device and image processing method
JP5656768B2 (ja) 画像特徴量抽出装置およびそのプログラム
Nguyen et al. Automatic crack detection from 2D images using a crack measure-based B-spline level set model
US20100284579A1 (en) Abnormal shadow candidate detecting method and abnormal shadow candidate detecting apparatus
Zhao et al. Region-based saliency estimation for 3D shape analysis and understanding
CN104268550A (zh) 特征提取方法及装置
JP5845139B2 (ja) 図形検出処理装置、図形検出処理方法及び図形検出処理プログラム
JP5201184B2 (ja) 画像処理装置及びプログラム
CN115953399B (zh) 基于轮廓特征与svdd的工业部件结构性缺陷检测方法
CN112966618A (zh) 着装识别方法、装置、设备及计算机可读介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140711

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150526

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151120

R150 Certificate of patent or registration of utility model

Ref document number: 5845139

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150