JP2013120482A - 画像特徴量抽出装置およびそのプログラム - Google Patents

画像特徴量抽出装置およびそのプログラム Download PDF

Info

Publication number
JP2013120482A
JP2013120482A JP2011267937A JP2011267937A JP2013120482A JP 2013120482 A JP2013120482 A JP 2013120482A JP 2011267937 A JP2011267937 A JP 2011267937A JP 2011267937 A JP2011267937 A JP 2011267937A JP 2013120482 A JP2013120482 A JP 2013120482A
Authority
JP
Japan
Prior art keywords
feature
feature point
occurrence
detection unit
main direction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011267937A
Other languages
English (en)
Other versions
JP5865687B2 (ja
Inventor
Yoshihiko Kawai
吉彦 河合
Masato Fujii
真人 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2011267937A priority Critical patent/JP5865687B2/ja
Publication of JP2013120482A publication Critical patent/JP2013120482A/ja
Application granted granted Critical
Publication of JP5865687B2 publication Critical patent/JP5865687B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】概略の特徴を捉えて一般物体認識の精度を向上させる。
【解決手段】フレーム画像データから複数の特徴点を検出する特徴点検出部20と、これら複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部30と、フレーム画像データからエッジ成分を検出し、複数の特徴点それぞれについて、特徴点近傍の局所領域におけるエッジ成分の主方向を検出する特徴点主方向検出部40と、複数の特徴点それぞれについて、スケール推定値と主方向推定値とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴ベクトルを生成する共起特徴ベクトル生成部50とを備えた。
【選択図】図1

Description

本発明は、画像特徴量抽出装置およびそのプログラムに関する。
画像から「自動車」や「花」といった一般的なオブジェクトを検出する一般物体認識技術が知られている(例えば、非特許文献1参照)。この一般物体認識技術は、情報処理装置が、一般名称により表現される物体を画像から認識する技術である。この一般物体認識技術は、視覚語(Visual Words)のクラスタである語彙を生成するための学習手続と、この学習手続により生成された語彙に基づいて特徴ベクトルを算出する算出手続とによって実現される。学習手続では、情報処理装置は、学習用の画像データから局所特徴量を算出する。局所特徴量としては、例えばScale−Invariant Feature Transform(SIFT)特徴量が適用される。情報処理装置は、このSIFTを適用することにより、画像の回転やスケールの変化に対して安定したオブジェクトの抽出を行うことができる。次に、学習手続において、情報処理装置は、局所特徴量のクラスタ分析処理を実行し、各クラスタの重心ベクトルを視覚語として選択する。また、算出手続では、情報処理装置は、画像認識の対象である画像データから局所特徴量を算出し、距離が最も近い視覚語に各局所特徴量を割り当てる。次に、情報処理装置は、視覚語の出現頻度ヒストグラムを算出し、この出現頻度ヒストグラムを画像の特徴ベクトルとする。
G. Csurka, C. R. Dance, Lixin Fan, J. Willamowski, C. Bray, "Visual Categorization with Bags of Keypoints", Proc. ECCV Workshop on Statistical Learning in Computer Vision, pp. 59-74, 2004.
上記のSIFTは、参照画像および対象画像、映像における前フレーム画像および現フレーム画像等の、二つの画像間の特徴点を対応付けて局所領域における特徴を厳密に規定する方式である。すなわち、SIFTは、画像におけるオブジェクトの認識や追跡に適した方式である。また、SIFTは、画像における特徴点間の適合性を一切考慮せず独立に扱う方式である。よって、SIFTは、特定のオブジェクトを検出することに適した方式である。
したがって、例えばSIFTを適用した従来の一般物体認識技術は、一般名称により表現される物体、すなわち、一般的なオブジェクトの概略の特徴を捉えることが困難であった。
本発明は、上記の問題点に鑑みてなされたものであり、概略の特徴を捉えて一般物体認識の精度を向上させることができる、画像特徴量抽出装置およびそのプログラムを提供することを目的とする。
[1]上記の課題を解決するため、本発明の一態様である画像特徴量抽出装置は、フレーム画像データから複数の特徴点を検出する特徴点検出部と、前記特徴点検出部が検出した前記複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部と、前記フレーム画像データからエッジ成分を検出し、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における前記エッジ成分の主方向を検出する特徴点主方向検出部と、前記複数の特徴点それぞれについて、前記特徴点スケール検出部が推定した前記スケール値と前記特徴点主方向検出部が検出した前記主方向とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴量を生成する共起特徴量生成部と、を備えることを特徴とする。
[2]上記[1]記載の画像特徴量抽出装置において、前記フレーム画像データを分割して得られる複数のブロックそれぞれについて、前記共起特徴量生成部が生成した、前記ブロックに含まれる特徴点の共起特徴量の平均値である平均共起特徴量を計算し、前記複数のブロックすべてについての前記平均共起特徴量を連結することにより、前記フレーム画像データ全体の特徴量を生成する特徴量生成部、をさらに備えたことを特徴とする。
[3]上記[1]または[2]記載の画像特徴量抽出装置において、前記特徴点主方向検出部は、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における重み付きエッジ方向ヒストグラムを生成し、前記重み付きエッジ方向ヒストグラムから最大値に対応するエッジ方向を検出することにより、前記エッジ成分の主方向を推定することを特徴とする。
[4]上記[1]から[3]いずれか一項記載の画像特徴量抽出装置において、前記共起特徴量生成部は、前記複数の特徴点それぞれについて、特徴点を中心とした前記スケール値に対応する半径を有する円周上における2点の共起に基づく共起特徴量を、前記主方向に基づき計算することを特徴とする。
[5]上記の課題を解決するため、本発明の一態様であるプログラムは、コンピュータを、フレーム画像データから複数の特徴点を検出する特徴点検出部と、前記特徴点検出部が検出した前記複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部と、前記フレーム画像データからエッジ成分を検出し、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における前記エッジ成分の主方向を検出する特徴点主方向検出部と、前記複数の特徴点それぞれについて、前記特徴点スケール検出部が推定した前記スケール値と前記特徴点主方向検出部が検出した前記主方向とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴量を生成する共起特徴量生成部と、として機能させる。
本発明によれば、概略の特徴を捉えて一般物体認識の精度を向上させることができる。
本発明の一実施形態である画像特徴量抽出装置の機能構成を示すブロック図である。 特徴点検出部が実行するグリッドサンプリング処理において適用される格子を、フレーム画像に対応させて模式的に表した図である。 特徴点近傍の局所領域に基づき求めた重み付きエッジ方向ヒストグラムを模式的に示す図である。 一特徴点に対する共起特徴ベクトルを概念的に示す図である。 特徴ベクトル生成部が平均共起特徴ベクトルを生成する場合の、フレーム画像の分割の例を模式的に示した図である。 同実施形態において、画像特徴量抽出装置が実行する画像特徴量抽出処理の手順を示すフローチャートである。
以下、本発明を実施するための形態について、図面を参照して詳細に説明する。
[1 構成]
図1は、本発明の一実施形態である画像特徴量抽出装置の機能構成を示すブロック図である。同図が示すように、画像特徴量抽出装置1は、画像データ取得部10と、特徴点検出部20と、特徴点スケール検出部30と、特徴点主方向検出部40と、共起特徴ベクトル生成部(共起特徴量生成部)50と、特徴ベクトル生成部(特徴量生成部)60とを備える。
画像データ取得部10は、図示しない外部装置から供給される画像データを取り込む。外部装置は、例えば、撮影装置や記録装置である。画像データは、静止画像データまたは動画像データである。画像データが静止画像データである場合、画像データ取得部10は、取り込んだ画像データをフレーム画像データとして特徴点検出部20に供給する。また、画像データが動画像データである場合、画像データ取得部10は、取り込んだ動画像データからキーフレームを検出し、このキーフレームをフレーム画像データとして、順次またはあらかじめ決定された所定フレーム数おきに特徴点検出部20に供給する。
特徴点検出部20は、画像データ取得部10から供給されるフレーム画像データを取り込み、このフレーム画像データから複数の特徴点を検出する。例えば、特徴点検出部20は、取り込んだフレーム画像データに対し、グリッドサンプリング処理を実行してフレーム画像上の複数の特徴点を検出する。グリッドサンプリング処理は、フレーム画像に対応させた所定の格子(グリッド)における格子点に対する画素を特徴点として検出する処理である。
特徴点検出部20は、フレーム画像データと複数の特徴点の位置を示す特徴点位置情報とを、特徴点スケール検出部30に供給する。特徴点位置情報は、例えば、複数の特徴点に対応する各画素の座標値である。
特徴点スケール検出部30は、特徴点検出部20から供給されるフレーム画像データと特徴点位置情報とを取り込み、これらフレーム画像データと特徴点位置情報とに基づいて、特徴点ごとに画像スケールの最適値を推定し、スケール推定値とする。画像スケールの最適値とは、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値である。特徴点近傍の局所領域は、特徴点を含みその特徴点の近傍における局所領域である。
特徴点スケール検出部30は、フレーム画像データと特徴点ごとのスケール推定値とを、特徴点主方向検出部40に供給する。
特徴点主方向検出部40は、特徴点スケール検出部30から供給されるフレーム画像データと特徴点ごとのスケール推定値とを取り込む。特徴点主方向検出部40は、取り込んだフレーム画像データに基づいて、特徴点近傍の局所領域からエッジ成分を検出する。エッジ成分は、画素ごとの、エッジの強度を示すエッジ強度と、エッジの方向を示すエッジ方向とを含むデータである。
また、特徴点主方向検出部40は、取り込んだフレーム画像データと特徴点ごとのスケール推定値と検出したエッジ成分とに基づいて、特徴点ごとに主方向を検出し主方向推定値とする。主方向は、特徴点近傍の局所領域におけるエッジ成分の主方向である。
特徴点主方向検出部40は、フレーム画像データと特徴点ごとのスケール推定値と主方向推定値とを、共起特徴ベクトル生成部50に供給する。
共起特徴ベクトル生成部50は、特徴点主方向検出部40から供給される、フレーム画像データと特徴点ごとのスケール推定値と主方向推定値とを取り込む。共起特徴ベクトル生成部50は、フレーム画像データとこれら特徴点ごとのスケール推定値と主方向推定値とに基づいて、当該特徴点に対する局所特徴ベクトルの空間的な共起に基づく共起特徴ベクトル(共起特徴量)を生成する。共起特徴ベクトル生成部50は、生成した特徴点ごとの共起特徴ベクトルを特徴ベクトル生成部60に供給する。
特徴ベクトル生成部60は、共起特徴ベクトル生成部50から供給される共起特徴ベクトルを取り込む。特徴ベクトル生成部60は、フレーム画像を分割して得られる複数のブロックそれぞれについて、当該ブロックに含まれる特徴点の共起特徴ベクトルの平均ベクトルである平均共起特徴ベクトル(平均共起特徴量)を計算する。特徴ベクトル生成部60は、上記の複数のブロックすべてについての平均共起特徴ベクトルを連結し、フレーム画像全体の特徴ベクトル(特徴量)として出力する。
なお、画像特徴量抽出装置1は、図1には図示しない制御部を備える。この制御部は、画像特徴量抽出装置1全体を制御する。制御部は、例えば、中央処理装置(Central Processing Unit;CPU)および半導体記憶装置を含んで構成される。
[2 処理]
[2−1.特徴点の検出処理]
図2は、特徴点検出部20が実行するグリッドサンプリング処理において適用される格子を、フレーム画像に対応させて模式的に表した図である。同図において、Pは、フレーム画像2に対応させた格子のうちの一格子点である。各格子点に対応する画素が特徴点である。なお、同図においては、図を見易くするために、各格子点を丸印で表している。また、格子点間距離(グリッドサイズ)として、x軸方向の格子点間距離をGとし、y軸方向の格子点間距離をGとする。格子点間距離Gと格子点間距離をGとは、同一であってもよいし、異なっていてもよい。
特徴点検出部20は、画像データ取得部10から供給されるフレーム画像データを取り込むと、図2に示すように、フレーム画像2に対応させた格子における格子点に対応する画素を特徴点として検出する。そして、特徴点検出部20は、例えば、検出した複数の特徴点の座標値を示す特徴点位置情報を生成する。
特徴点検出部20は、グリッドサンプリング処理により一定の画素間隔で特徴点を検出することにより、フレーム画像の特性(画質)によらず一定数の特徴点を得ることができる。
[2−2.画像スケールの検出処理]
特徴点スケール検出部30は、特徴点検出部20から供給されるフレーム画像データと特徴点位置情報とを取り込むと、例えば、特徴点位置情報により位置が特定される特徴点ごとに、Difference of Gaussian(DoG)の極大値を計算し、このDoGが極大値となるときのスケール値を一次スケール推定値として求める。DoGは、スケールが異なる二つの平滑化画像の差分データであり、下記の式(1)として表される。ただし、G(u,v,σ)は、分散をσとしたガウス窓(ガウシアンフィルタ)である。この分散σがスケール値である。I(x+u,y+v)はフレーム画像における座標(x+u,y+v)の画素値である。
Figure 2013120482
特徴点スケール検出部30は、特徴点ごとに、スケール値σを初期値σからk倍ずつ変化させてD(x,y,σ)を計算し、このD(x,y,σ)が極大値となるときのスケール値σを一次スケール推定値として抽出する。kは任意の正の係数であり、例えば√2である。
次に、特徴点スケール検出部30は、特徴点ごとに、D(x,y,σ)のスケール値σに対する多項式近似を計算することによって、スケール推定値σ(ハット)を得る。具体的には、特徴点スケール検出部30は、下記の式(2)を計算することにより、D(x,y,σ)をスケール値σに対しテイラー展開して二次近似を得る。
Figure 2013120482
次に、特徴点スケール検出部30は、下記の式(3)に示すとおり、式(2)による二次近似式の導関数を“0(ゼロ)”とすることにより、スケール推定値σ(ハット)を求める。
Figure 2013120482
[2−3.主方向の検出処理]
特徴点主方向検出部40は、特徴点スケール検出部30から供給されるフレーム画像データと特徴点ごとのスケール推定値σ(ハット)とを取り込むと、フレーム画像データに基づいて各画素のエッジ成分を計算する。具体的には、特徴点主方向検出部40は、例えば、ソーベルフィルタ(Sobel Filter)を適用し、下記の式(4)により、フレーム画像における各画素のエッジ成分を計算する。ただし、同式において、フレーム画像に対応する座標系は、例えば、フレーム画像の左上端の画素の位置を原点とし、水平方向をx軸、垂直方向をy軸とした直交座標系である。また、m(x,y)は座標値(x,y)の注目画素におけるエッジ強度、θ(x,y)は注目画素におけるエッジ方向を表す。また、Δxは輝度勾配のx軸方向成分、Δyは輝度勾配のy軸方向成分である。
Figure 2013120482
なお、特徴点主方向検出部40には、ソーベルフィルタ以外にも、例えば、プレウィットフィルタ(Prewitt Filter)、ラプラシアンフィルタ(Laplacian Filter)等を適用してもよい。
次に、特徴点主方向検出部40は、フレーム画像データと特徴点ごとのスケール推定値σ(ハット)と検出したエッジ成分とに基づいて、特徴点ごとに、当該特徴点近傍の局所領域における重み付きエッジ方向ヒストグラムを生成する。具体的には、例えば、特徴点主方向検出部40は、特徴点ごとに、分散Kσのガウス窓を空間的重み付けとした重み付きエッジ方向ヒストグラムを計算する。エッジ方向θ(x,y)をn方向に量子化する場合、ガウス窓の分散Kσに対する重み付きエッジ方向ヒストグラムhx、y、Kσは、下記の式(5)として表される。ただし、G(u,v,Kσ(ハット))は、座標(x+u,y+v)におけるエッジ強度m(x+u,y+v)に対する重み係数であり、座標(x+u,y+v)が座標(x,y)から離れるほど小さな重み係数となるガウス窓である。δ(θ(x+u,y+v))は、量子化されたθ(x+u,y+v)がi番目のビンに属する場合には“1”、それ以外の場合には“0(ゼロ)”となる関数である。
Figure 2013120482
図3は、特徴点近傍の局所領域に基づき求めた重み付きエッジ方向ヒストグラムを模式的に示す図である。同図における上側の図は、座標値(x,y)の画素に対応する特徴点におけるエッジ方向θ(x,y)をn方向(n=8)に量子化する場合の、分散Kσのガウス窓を表している。また、同図における下側の図は、特徴点主方向検出部40が、分散Kσのガウス窓を空間的重み付けとして計算した重み付きエッジ方向ヒストグラムを表している。この重み付きエッジ方向ヒストグラムは、横軸にビン数を8とした階級ごとのエッジ方向θ、縦軸に度数hをとり、エッジ方向θの度数分布を表している。
次に、特徴点主方向検出部40は、特徴点ごとに、重み付きエッジ方向ヒストグラムから最大値に対応するエッジ方向θを検出し、hのエッジ方向θに対する多項式近似を計算することによって、エッジ方向推定値θ(ハット)を得る。具体的には、特徴点主方向検出部40は、下記の式(6)を計算することにより、hをエッジ方向θに対しテイラー展開して二次近似を得る。
Figure 2013120482
次に、特徴点主方向検出部40は、下記の式(7)に示すとおり、式(6)による二次近似式の導関数“0(ゼロ)”とすることにより、主方向推定値θ(ハット)を求める。
Figure 2013120482
[2−4.共起特徴ベクトルの生成処理]
共起特徴ベクトル生成部50は、特徴点主方向検出部40から供給される、フレーム画像データと特徴点ごとのスケール推定値σ(ハット)と主方向推定値θ(ハット)とを取り込むと、当該特徴点を中心とした半径Aσ(ハット)の円周上において点対象となる2点の共起に基づく共起特徴ベクトルを計算する。上記のAは定数である。0ラジアンからπラジアンまでの円周をM等分した場合の、円周上のi番目の点の座標値は、下記の式(8)のとおりである。
Figure 2013120482
すなわち、共起特徴ベクトル生成部50は、特徴点の半径Aσ(ハット)の円周上の一方の点(xθi,yθi)におけるエッジ方向ヒストグラムと、特徴点の位置に対して一方の点(xθi,yθi)と点対称の位置にある他方の点(xθi+π,yθi+π)におけるエッジ方向ヒストグラムとの共起に基づき、下記の式(9)により2点間の共起特徴ベクトルを計算する。ただし、hx,y,Bσ,θ(ハット)は、前記の式(5)と同様に、座標値が(x,y)である画素を中心としたスケールBσ(Bは定数)のガウス窓を畳み込んだ重み付きエッジ方向ヒストグラムを示している。ただし、共起特徴ベクトル生成部50は、各画素におけるエッジ方向を特徴点の主方向推定値θ(ハット)に合わせたうえで、重み付きエッジ方向ヒストグラムを計算する。
Figure 2013120482
図4は、一特徴点に対する共起特徴ベクトルを概念的に示す図である。同図は、座標値が(x,y)である特徴点を中心とした半径Aσ(ハット)の円周をM(M=4)等分して得られる各画素における共起特徴ベクトルUθ0から共起特徴ベクトルUθ3までを示している。
共起特徴ベクトル生成部50は、特徴点を中心とした円周上のM点全てについて共起特徴ベクトルを計算し、これらM個の共起特徴ベクトルを下記の式(10)に示すとおり連結して共起特徴ベクトルを生成する。ただし、式(9)におけるUθiは正方行列であるが、共起特徴ベクトル生成部50は、その正方行列の各行を一列に連結した一次元の行列U’θiに変換してM個の共起特徴ベクトルを連結する。
Figure 2013120482
[2−5.特徴ベクトルの生成処理]
図5(a),(b)は、特徴ベクトル生成部60が平均共起特徴ベクトルを生成する場合の、フレーム画像の分割の例を模式的に示した図である。同図(a)は、フレーム画像をx軸方向において3等分し、ブロック5a,5b,5cに分割した例である。また、同図(b)は、フレーム画像をx軸方向およびy軸方向それぞれにおいて2等分し、ブロック5d,5e,5f,5gに分割した例である。
特徴ベクトル生成部60は、共起特徴ベクトル生成部50から供給される共起特徴ベクトルを取り込むと、同図(a)または同図(b)に示すようにフレーム画像を分割して得られる複数のブロックそれぞれについて、当該ブロックに含まれる特徴点の共起特徴ベクトルの平均ベクトルである平均共起特徴ベクトルを計算する。次に、特徴ベクトル生成部60は、計算したすべての平均共起特徴ベクトルを連結し、フレーム画像全体の特徴ベクトルとして出力する。
[3 画像特徴量抽出装置の動作]
次に、画像特徴量抽出装置1の動作について説明する。
図6は、画像特徴量抽出装置1が実行する画像特徴量抽出処理の手順を示すフローチャートである。ただし、同図は、1フレーム画像データについての処理手順を示す図である。
ステップS1において、画像データ取得部10は、外部装置から供給される画像データを取り込む。取り込まれた画像データが静止画像データである場合、画像データ取得部10は、その画像データをフレーム画像データとして特徴点検出部20に供給する。また、取り込まれた画像データが動画像データである場合、画像データ取得部10は、その動画像データからキーフレームを検出し、このキーフレームをフレーム画像データとして特徴点検出部20に供給する。
次に、ステップS2において、特徴点検出部20は、画像データ取得部10から供給されるフレーム画像データを取り込み、このフレーム画像データから複数の特徴点を検出する。例えば、特徴点検出部20は、取り込んだフレーム画像データに対し、グリッドサンプリング処理を実行してフレーム画像上の複数の特徴点を検出する。
次に、特徴点検出部20は、フレーム画像データと複数の特徴点の位置を示す特徴点位置情報とを、特徴点スケール検出部30に供給する。
次に、ステップS3において、画像特徴量抽出装置1が備える制御部は、処理対象であるフレーム画像データにおいて、未処理の特徴点があるか否かを判定する。そして、制御部は、未処理の特徴点があると判定した場合(S3:YES)は、一つの未処理の特徴点を指定してステップS4の処理に移す。一方、制御部は、全ての特徴点についての処理が完了していると判定した場合(S3:NO)は、ステップS7の処理に移す。
ステップS4において、特徴点スケール検出部30は、特徴点検出部20から供給されるフレーム画像データと特徴点位置情報とを取り込み、これらフレーム画像データと特徴点位置情報とに基づいて、画像スケールの最適値であるスケール推定値を推定する。
次に、特徴点スケール検出部30は、フレーム画像データとスケール推定値とを、特徴点主方向検出部40に供給する。
次に、ステップS5において、特徴点主方向検出部40は、特徴点スケール検出部30から供給されるフレーム画像データとスケール推定値とを取り込む。
次に、特徴点主方向検出部40は、取り込んだフレーム画像データに基づいて、特徴点近傍の局所領域からエッジ成分を検出する。
次に、特徴点主方向検出部40は、取り込んだフレーム画像データとスケール推定値と検出したエッジ成分とに基づいて、主方向推定値を推定する。
次に、特徴点主方向検出部40は、フレーム画像データとスケール推定値と主方向推定値とを、共起特徴ベクトル生成部50に供給する。
次に、ステップS6において、共起特徴ベクトル生成部50は、特徴点主方向検出部40から供給される、フレーム画像データとスケール推定値と主方向推定値とを取り込む。
次に、共起特徴ベクトル生成部50は、フレーム画像データとスケール推定値と主方向推定値とに基づいて、当該特徴点に対する局所特徴ベクトルの空間的な共起に基づく共起特徴ベクトルを生成する。
次に、共起特徴ベクトル生成部50は、生成した共起特徴ベクトルを特徴ベクトル生成部60に供給する。
次に、制御部は、ステップS3の処理に移す。
ステップS7において、特徴ベクトル生成部60は、共起特徴ベクトル生成部50から供給される、特徴点ごとの共起特徴ベクトルを取り込んだ後、フレーム画像を分割して得られる複数のブロックそれぞれについて、当該ブロックに含まれる特徴点の共起特徴ベクトルの平均ベクトルである平均共起特徴ベクトルを計算する。
次に、特徴ベクトル生成部60は、上記の複数のブロックすべてについての平均共起特徴ベクトルを連結し、フレーム画像全体の特徴ベクトルとして出力する。
次に、制御部は、本フローチャートの処理を終了させる。
以上、詳述したとおり、本発明の一実施形態である画像特徴量抽出装置1は、外部装置から供給される画像データを取り込んでフレーム画像データを出力する画像データ取得部10と、フレーム画像データから複数の特徴点を検出する特徴点検出部20とを備えた。
また、画像特徴量抽出装置1は、特徴点検出部20が検出した複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部30を備えた。
また、画像特徴量抽出装置1は、フレーム画像データからエッジ成分を検出し、複数の特徴点それぞれについて、特徴点近傍の局所領域におけるエッジ成分の主方向を検出する特徴点主方向検出部を備えた。
また、画像特徴量抽出装置1は、複数の特徴点それぞれについて、特徴点スケール検出部30が推定したスケール推定値と特徴点主方向検出部40が推定した主方向推定値とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴ベクトルを生成する共起特徴ベクトル生成部50を備えた。
また、画像特徴量抽出装置1は、フレーム画像データを分割して得られる複数のブロックそれぞれについて、共起特徴ベクトル生成部50が生成した、ブロックに含まれる特徴点の共起特徴量の平均値である平均共起特徴量を計算し、複数のブロックすべてについての平均共起特徴量を連結することにより、フレーム画像データ全体の特徴量を生成する特徴ベクトル生成部60を備えた。
このように構成したことにより、本発明の一実施形態である画像特徴量抽出装置1は、フレーム画像データから検出した特徴点の周辺領域、つまり特徴点近傍の局所領域における局所特徴ベクトルの共起に基づいて、画像の内容を特徴付ける特徴ベクトルを生成して得ることができる。また、画像特徴量抽出装置1は、フレーム画像の回転およびスケール変化に対して不変な局所特徴ベクトルを生成することができる。
したがって、本実施形態によれば、局所特徴量間の適合性を考慮し、概略の特徴を捉えて一般物体認識の精度を向上することができる。
また、本実施形態によれば、フレーム画像の回転およびスケール変化に対して頑健(ロバスト)な一般物体認識を行わせることができる。
なお、上述した画像特徴量抽出装置1が出力する特徴ベクトルは、例えば、ラベルが付与された学習データとともに、画像データからのオブジェクトの認識に利用されたり、特徴ベクトル間のマッチングによって類似画像の検索に利用されたりすることができる。
また、上述した実施形態である画像特徴量抽出装置の一部の機能をコンピュータで実現するようにしてもよい。この場合、その制御機能を実現するためのプログラム(画像特徴量抽出プログラム)をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませて、このコンピュータシステムが実行することによって実現してもよい。なお、このコンピュータシステムとは、オペレーティング・システム(Operating System;OS)や周辺装置のハードウェアを含むものである。また、コンピュータ読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、光ディスク、メモリカード等の可搬型記録媒体、コンピュータシステムに備えられる磁気ハードディスクやソリッドステートドライブ等の記憶装置のことをいう。さらに、コンピュータ読み取り可能な記録媒体とは、インターネット等のコンピュータネットワーク、および電話回線や携帯電話網を介してプログラムを送信する場合の通信回線のように、短時間の間、動的にプログラムを保持するもの、さらには、その場合のサーバ装置やクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持するものを含んでもよい。また上記のプログラムは、前述した機能の一部を実現するためのものであってもよく、さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせにより実現するものであってもよい。
以上、本発明の実施の形態について図面を参照して詳述したが、具体的な構成はその実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれる。
1 画像特徴量抽出装置
10 画像データ取得部
20 特徴点検出部
30 特徴点スケール検出部
40 特徴点主方向検出部
50 共起特徴ベクトル生成部
60 特徴ベクトル生成部

Claims (5)

  1. フレーム画像データから複数の特徴点を検出する特徴点検出部と、
    前記特徴点検出部が検出した前記複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部と、
    前記フレーム画像データからエッジ成分を検出し、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における前記エッジ成分の主方向を検出する特徴点主方向検出部と、
    前記複数の特徴点それぞれについて、前記特徴点スケール検出部が推定した前記スケール値と前記特徴点主方向検出部が検出した前記主方向とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴量を生成する共起特徴量生成部と、
    を備えることを特徴とする画像特徴量抽出装置。
  2. 前記フレーム画像データを分割して得られる複数のブロックそれぞれについて、前記共起特徴量生成部が生成した、前記ブロックに含まれる特徴点の共起特徴量の平均値である平均共起特徴量を計算し、前記複数のブロックすべてについての前記平均共起特徴量を連結することにより、前記フレーム画像データ全体の特徴量を生成する特徴量生成部、
    をさらに備えたことを特徴とする請求項1記載の画像特徴量抽出装置。
  3. 前記特徴点主方向検出部は、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における重み付きエッジ方向ヒストグラムを生成し、前記重み付きエッジ方向ヒストグラムから最大値に対応するエッジ方向を検出することにより、前記エッジ成分の主方向を推定する
    ことを特徴とする請求項1または2記載の画像特徴量抽出装置。
  4. 前記共起特徴量生成部は、前記複数の特徴点それぞれについて、特徴点を中心とした前記スケール値に対応する半径を有する円周上における2点の共起に基づく共起特徴量を、前記主方向に基づき計算する
    ことを特徴とする請求項1から3いずれか一項記載の画像特徴量抽出装置。
  5. コンピュータを、
    フレーム画像データから複数の特徴点を検出する特徴点検出部と、
    前記特徴点検出部が検出した前記複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部と、
    前記フレーム画像データからエッジ成分を検出し、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における前記エッジ成分の主方向を検出する特徴点主方向検出部と、
    前記複数の特徴点それぞれについて、前記特徴点スケール検出部が推定した前記スケール値と前記特徴点主方向検出部が検出した前記主方向とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴量を生成する共起特徴量生成部と、
    として機能させるためのプログラム。
JP2011267937A 2011-12-07 2011-12-07 画像特徴量抽出装置およびそのプログラム Expired - Fee Related JP5865687B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011267937A JP5865687B2 (ja) 2011-12-07 2011-12-07 画像特徴量抽出装置およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011267937A JP5865687B2 (ja) 2011-12-07 2011-12-07 画像特徴量抽出装置およびそのプログラム

Publications (2)

Publication Number Publication Date
JP2013120482A true JP2013120482A (ja) 2013-06-17
JP5865687B2 JP5865687B2 (ja) 2016-02-17

Family

ID=48773098

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011267937A Expired - Fee Related JP5865687B2 (ja) 2011-12-07 2011-12-07 画像特徴量抽出装置およびそのプログラム

Country Status (1)

Country Link
JP (1) JP5865687B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336964A (zh) * 2013-07-12 2013-10-02 北京邮电大学 一种基于模值差镜像不变性的sift图像匹配方法
JP2019046334A (ja) * 2017-09-06 2019-03-22 日本放送協会 分類モデル生成装置、画像データ分類装置およびそれらのプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010086540A (ja) * 2008-10-01 2010-04-15 Fuji Xerox Co Ltd 特徴記述子ベクトル生成方法、システムおよびプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010086540A (ja) * 2008-10-01 2010-04-15 Fuji Xerox Co Ltd 特徴記述子ベクトル生成方法、システムおよびプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6015032044; 河合 吉彦: '局所特徴の共起を考慮した映像意味内容の解析手法' FIT2011 第10回情報科学技術フォーラム 講演論文集 第3分冊, 20110822, p.259-260, 社団法人電子情報通信学会 *
JPN6015032046; 西村 朋己: '一般物体認識に適したvisual wordの作成法' 情報処理学会研究報告 第2008巻 第115号, 20081120, p.237-242, 社団法人情報処理学会 *
JPN6015032048; 藤吉 弘亘: 'Gradientベースの特徴抽出 -SIFTとHOG-' 情報処理学会研究報告 第2007巻 第87号, 20070903, p.211-224, 社団法人情報処理学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336964A (zh) * 2013-07-12 2013-10-02 北京邮电大学 一种基于模值差镜像不变性的sift图像匹配方法
JP2019046334A (ja) * 2017-09-06 2019-03-22 日本放送協会 分類モデル生成装置、画像データ分類装置およびそれらのプログラム

Also Published As

Publication number Publication date
JP5865687B2 (ja) 2016-02-17

Similar Documents

Publication Publication Date Title
Kim et al. Spatiotemporal saliency detection and its applications in static and dynamic scenes
Winlock et al. Toward real-time grocery detection for the visually impaired
US9727974B2 (en) System for video super resolution using semantic components
US9710698B2 (en) Method, apparatus and computer program product for human-face features extraction
US10255507B2 (en) Detection of an object in a distorted image
US20110243381A1 (en) Methods for tracking objects using random projections, distance learning and a hybrid template library and apparatuses thereof
US20150098645A1 (en) Method, apparatus and system for selecting a frame
JP5656768B2 (ja) 画像特徴量抽出装置およびそのプログラム
JP6071002B2 (ja) 信頼度取得装置、信頼度取得方法および信頼度取得プログラム
CN111199197B (zh) 一种人脸识别的图像提取方法及处理设备
JP2017033372A (ja) 人物認識装置及びそのプログラム
JP2018124689A (ja) 移動物体検出装置、移動物体検出システム、及び移動物体検出方法
Fu et al. Salient object detection via color contrast and color distribution
JP2011253354A (ja) 画像処理装置および方法、並びにプログラム
CN108647605B (zh) 一种结合全局颜色与局部结构特征的人眼凝视点提取方法
Balaji et al. Cardiac view classification using speed Up robust
JP5865687B2 (ja) 画像特徴量抽出装置およびそのプログラム
JP2016219879A (ja) 画像処理装置、画像処理方法及びプログラム
Zhou et al. Superpixel-driven level set tracking
JP5051671B2 (ja) 情報処理装置、情報処理方法およびプログラム
CN110910418B (zh) 基于旋转不变性图像特征描述子的目标跟踪算法
CN113705660A (zh) 目标识别方法及相关设备
KR101276792B1 (ko) 눈 검출 장치 및 방법
Wu et al. Kernel-based motion-blurred target tracking
JP4812743B2 (ja) 顔認識装置、顔認識方法、顔認識プログラムおよびそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150811

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151228

R150 Certificate of patent or registration of utility model

Ref document number: 5865687

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees