JP2013120482A - 画像特徴量抽出装置およびそのプログラム - Google Patents
画像特徴量抽出装置およびそのプログラム Download PDFInfo
- Publication number
- JP2013120482A JP2013120482A JP2011267937A JP2011267937A JP2013120482A JP 2013120482 A JP2013120482 A JP 2013120482A JP 2011267937 A JP2011267937 A JP 2011267937A JP 2011267937 A JP2011267937 A JP 2011267937A JP 2013120482 A JP2013120482 A JP 2013120482A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- feature point
- occurrence
- detection unit
- main direction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】フレーム画像データから複数の特徴点を検出する特徴点検出部20と、これら複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部30と、フレーム画像データからエッジ成分を検出し、複数の特徴点それぞれについて、特徴点近傍の局所領域におけるエッジ成分の主方向を検出する特徴点主方向検出部40と、複数の特徴点それぞれについて、スケール推定値と主方向推定値とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴ベクトルを生成する共起特徴ベクトル生成部50とを備えた。
【選択図】図1
Description
したがって、例えばSIFTを適用した従来の一般物体認識技術は、一般名称により表現される物体、すなわち、一般的なオブジェクトの概略の特徴を捉えることが困難であった。
[2]上記[1]記載の画像特徴量抽出装置において、前記フレーム画像データを分割して得られる複数のブロックそれぞれについて、前記共起特徴量生成部が生成した、前記ブロックに含まれる特徴点の共起特徴量の平均値である平均共起特徴量を計算し、前記複数のブロックすべてについての前記平均共起特徴量を連結することにより、前記フレーム画像データ全体の特徴量を生成する特徴量生成部、をさらに備えたことを特徴とする。
[3]上記[1]または[2]記載の画像特徴量抽出装置において、前記特徴点主方向検出部は、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における重み付きエッジ方向ヒストグラムを生成し、前記重み付きエッジ方向ヒストグラムから最大値に対応するエッジ方向を検出することにより、前記エッジ成分の主方向を推定することを特徴とする。
[4]上記[1]から[3]いずれか一項記載の画像特徴量抽出装置において、前記共起特徴量生成部は、前記複数の特徴点それぞれについて、特徴点を中心とした前記スケール値に対応する半径を有する円周上における2点の共起に基づく共起特徴量を、前記主方向に基づき計算することを特徴とする。
[5]上記の課題を解決するため、本発明の一態様であるプログラムは、コンピュータを、フレーム画像データから複数の特徴点を検出する特徴点検出部と、前記特徴点検出部が検出した前記複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部と、前記フレーム画像データからエッジ成分を検出し、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における前記エッジ成分の主方向を検出する特徴点主方向検出部と、前記複数の特徴点それぞれについて、前記特徴点スケール検出部が推定した前記スケール値と前記特徴点主方向検出部が検出した前記主方向とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴量を生成する共起特徴量生成部と、として機能させる。
[1 構成]
図1は、本発明の一実施形態である画像特徴量抽出装置の機能構成を示すブロック図である。同図が示すように、画像特徴量抽出装置1は、画像データ取得部10と、特徴点検出部20と、特徴点スケール検出部30と、特徴点主方向検出部40と、共起特徴ベクトル生成部(共起特徴量生成部)50と、特徴ベクトル生成部(特徴量生成部)60とを備える。
特徴点検出部20は、フレーム画像データと複数の特徴点の位置を示す特徴点位置情報とを、特徴点スケール検出部30に供給する。特徴点位置情報は、例えば、複数の特徴点に対応する各画素の座標値である。
特徴点スケール検出部30は、フレーム画像データと特徴点ごとのスケール推定値とを、特徴点主方向検出部40に供給する。
また、特徴点主方向検出部40は、取り込んだフレーム画像データと特徴点ごとのスケール推定値と検出したエッジ成分とに基づいて、特徴点ごとに主方向を検出し主方向推定値とする。主方向は、特徴点近傍の局所領域におけるエッジ成分の主方向である。
特徴点主方向検出部40は、フレーム画像データと特徴点ごとのスケール推定値と主方向推定値とを、共起特徴ベクトル生成部50に供給する。
[2−1.特徴点の検出処理]
図2は、特徴点検出部20が実行するグリッドサンプリング処理において適用される格子を、フレーム画像に対応させて模式的に表した図である。同図において、Pは、フレーム画像2に対応させた格子のうちの一格子点である。各格子点に対応する画素が特徴点である。なお、同図においては、図を見易くするために、各格子点を丸印で表している。また、格子点間距離(グリッドサイズ)として、x軸方向の格子点間距離をGxとし、y軸方向の格子点間距離をGyとする。格子点間距離Gxと格子点間距離をGyとは、同一であってもよいし、異なっていてもよい。
特徴点検出部20は、グリッドサンプリング処理により一定の画素間隔で特徴点を検出することにより、フレーム画像の特性(画質)によらず一定数の特徴点を得ることができる。
特徴点スケール検出部30は、特徴点検出部20から供給されるフレーム画像データと特徴点位置情報とを取り込むと、例えば、特徴点位置情報により位置が特定される特徴点ごとに、Difference of Gaussian(DoG)の極大値を計算し、このDoGが極大値となるときのスケール値を一次スケール推定値として求める。DoGは、スケールが異なる二つの平滑化画像の差分データであり、下記の式(1)として表される。ただし、G(u,v,σ)は、分散をσとしたガウス窓(ガウシアンフィルタ)である。この分散σがスケール値である。I(x+u,y+v)はフレーム画像における座標(x+u,y+v)の画素値である。
特徴点主方向検出部40は、特徴点スケール検出部30から供給されるフレーム画像データと特徴点ごとのスケール推定値σ(ハット)とを取り込むと、フレーム画像データに基づいて各画素のエッジ成分を計算する。具体的には、特徴点主方向検出部40は、例えば、ソーベルフィルタ(Sobel Filter)を適用し、下記の式(4)により、フレーム画像における各画素のエッジ成分を計算する。ただし、同式において、フレーム画像に対応する座標系は、例えば、フレーム画像の左上端の画素の位置を原点とし、水平方向をx軸、垂直方向をy軸とした直交座標系である。また、m(x,y)は座標値(x,y)の注目画素におけるエッジ強度、θ(x,y)は注目画素におけるエッジ方向を表す。また、Δxは輝度勾配のx軸方向成分、Δyは輝度勾配のy軸方向成分である。
共起特徴ベクトル生成部50は、特徴点主方向検出部40から供給される、フレーム画像データと特徴点ごとのスケール推定値σ(ハット)と主方向推定値θ(ハット)とを取り込むと、当該特徴点を中心とした半径Aσ(ハット)の円周上において点対象となる2点の共起に基づく共起特徴ベクトルを計算する。上記のAは定数である。0ラジアンからπラジアンまでの円周をM等分した場合の、円周上のi番目の点の座標値は、下記の式(8)のとおりである。
図5(a),(b)は、特徴ベクトル生成部60が平均共起特徴ベクトルを生成する場合の、フレーム画像の分割の例を模式的に示した図である。同図(a)は、フレーム画像をx軸方向において3等分し、ブロック5a,5b,5cに分割した例である。また、同図(b)は、フレーム画像をx軸方向およびy軸方向それぞれにおいて2等分し、ブロック5d,5e,5f,5gに分割した例である。
特徴ベクトル生成部60は、共起特徴ベクトル生成部50から供給される共起特徴ベクトルを取り込むと、同図(a)または同図(b)に示すようにフレーム画像を分割して得られる複数のブロックそれぞれについて、当該ブロックに含まれる特徴点の共起特徴ベクトルの平均ベクトルである平均共起特徴ベクトルを計算する。次に、特徴ベクトル生成部60は、計算したすべての平均共起特徴ベクトルを連結し、フレーム画像全体の特徴ベクトルとして出力する。
次に、画像特徴量抽出装置1の動作について説明する。
図6は、画像特徴量抽出装置1が実行する画像特徴量抽出処理の手順を示すフローチャートである。ただし、同図は、1フレーム画像データについての処理手順を示す図である。
ステップS1において、画像データ取得部10は、外部装置から供給される画像データを取り込む。取り込まれた画像データが静止画像データである場合、画像データ取得部10は、その画像データをフレーム画像データとして特徴点検出部20に供給する。また、取り込まれた画像データが動画像データである場合、画像データ取得部10は、その動画像データからキーフレームを検出し、このキーフレームをフレーム画像データとして特徴点検出部20に供給する。
次に、特徴点検出部20は、フレーム画像データと複数の特徴点の位置を示す特徴点位置情報とを、特徴点スケール検出部30に供給する。
次に、特徴点スケール検出部30は、フレーム画像データとスケール推定値とを、特徴点主方向検出部40に供給する。
次に、特徴点主方向検出部40は、取り込んだフレーム画像データに基づいて、特徴点近傍の局所領域からエッジ成分を検出する。
次に、特徴点主方向検出部40は、取り込んだフレーム画像データとスケール推定値と検出したエッジ成分とに基づいて、主方向推定値を推定する。
次に、特徴点主方向検出部40は、フレーム画像データとスケール推定値と主方向推定値とを、共起特徴ベクトル生成部50に供給する。
次に、共起特徴ベクトル生成部50は、フレーム画像データとスケール推定値と主方向推定値とに基づいて、当該特徴点に対する局所特徴ベクトルの空間的な共起に基づく共起特徴ベクトルを生成する。
次に、共起特徴ベクトル生成部50は、生成した共起特徴ベクトルを特徴ベクトル生成部60に供給する。
次に、制御部は、ステップS3の処理に移す。
次に、特徴ベクトル生成部60は、上記の複数のブロックすべてについての平均共起特徴ベクトルを連結し、フレーム画像全体の特徴ベクトルとして出力する。
次に、制御部は、本フローチャートの処理を終了させる。
また、画像特徴量抽出装置1は、特徴点検出部20が検出した複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部30を備えた。
また、画像特徴量抽出装置1は、フレーム画像データからエッジ成分を検出し、複数の特徴点それぞれについて、特徴点近傍の局所領域におけるエッジ成分の主方向を検出する特徴点主方向検出部を備えた。
また、画像特徴量抽出装置1は、複数の特徴点それぞれについて、特徴点スケール検出部30が推定したスケール推定値と特徴点主方向検出部40が推定した主方向推定値とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴ベクトルを生成する共起特徴ベクトル生成部50を備えた。
したがって、本実施形態によれば、局所特徴量間の適合性を考慮し、概略の特徴を捉えて一般物体認識の精度を向上することができる。
また、本実施形態によれば、フレーム画像の回転およびスケール変化に対して頑健(ロバスト)な一般物体認識を行わせることができる。
10 画像データ取得部
20 特徴点検出部
30 特徴点スケール検出部
40 特徴点主方向検出部
50 共起特徴ベクトル生成部
60 特徴ベクトル生成部
Claims (5)
- フレーム画像データから複数の特徴点を検出する特徴点検出部と、
前記特徴点検出部が検出した前記複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部と、
前記フレーム画像データからエッジ成分を検出し、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における前記エッジ成分の主方向を検出する特徴点主方向検出部と、
前記複数の特徴点それぞれについて、前記特徴点スケール検出部が推定した前記スケール値と前記特徴点主方向検出部が検出した前記主方向とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴量を生成する共起特徴量生成部と、
を備えることを特徴とする画像特徴量抽出装置。 - 前記フレーム画像データを分割して得られる複数のブロックそれぞれについて、前記共起特徴量生成部が生成した、前記ブロックに含まれる特徴点の共起特徴量の平均値である平均共起特徴量を計算し、前記複数のブロックすべてについての前記平均共起特徴量を連結することにより、前記フレーム画像データ全体の特徴量を生成する特徴量生成部、
をさらに備えたことを特徴とする請求項1記載の画像特徴量抽出装置。 - 前記特徴点主方向検出部は、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における重み付きエッジ方向ヒストグラムを生成し、前記重み付きエッジ方向ヒストグラムから最大値に対応するエッジ方向を検出することにより、前記エッジ成分の主方向を推定する
ことを特徴とする請求項1または2記載の画像特徴量抽出装置。 - 前記共起特徴量生成部は、前記複数の特徴点それぞれについて、特徴点を中心とした前記スケール値に対応する半径を有する円周上における2点の共起に基づく共起特徴量を、前記主方向に基づき計算する
ことを特徴とする請求項1から3いずれか一項記載の画像特徴量抽出装置。 - コンピュータを、
フレーム画像データから複数の特徴点を検出する特徴点検出部と、
前記特徴点検出部が検出した前記複数の特徴点それぞれについて、特徴点近傍の局所領域における画像のエッジ成分を含む範囲を示すスケール値を推定する特徴点スケール検出部と、
前記フレーム画像データからエッジ成分を検出し、前記複数の特徴点それぞれについて、特徴点近傍の局所領域における前記エッジ成分の主方向を検出する特徴点主方向検出部と、
前記複数の特徴点それぞれについて、前記特徴点スケール検出部が推定した前記スケール値と前記特徴点主方向検出部が検出した前記主方向とに基づき、特徴点に対する局所特徴量の空間的な共起に基づく共起特徴量を生成する共起特徴量生成部と、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011267937A JP5865687B2 (ja) | 2011-12-07 | 2011-12-07 | 画像特徴量抽出装置およびそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011267937A JP5865687B2 (ja) | 2011-12-07 | 2011-12-07 | 画像特徴量抽出装置およびそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013120482A true JP2013120482A (ja) | 2013-06-17 |
JP5865687B2 JP5865687B2 (ja) | 2016-02-17 |
Family
ID=48773098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011267937A Expired - Fee Related JP5865687B2 (ja) | 2011-12-07 | 2011-12-07 | 画像特徴量抽出装置およびそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5865687B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103336964A (zh) * | 2013-07-12 | 2013-10-02 | 北京邮电大学 | 一种基于模值差镜像不变性的sift图像匹配方法 |
JP2019046334A (ja) * | 2017-09-06 | 2019-03-22 | 日本放送協会 | 分類モデル生成装置、画像データ分類装置およびそれらのプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010086540A (ja) * | 2008-10-01 | 2010-04-15 | Fuji Xerox Co Ltd | 特徴記述子ベクトル生成方法、システムおよびプログラム |
-
2011
- 2011-12-07 JP JP2011267937A patent/JP5865687B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010086540A (ja) * | 2008-10-01 | 2010-04-15 | Fuji Xerox Co Ltd | 特徴記述子ベクトル生成方法、システムおよびプログラム |
Non-Patent Citations (3)
Title |
---|
JPN6015032044; 河合 吉彦: '局所特徴の共起を考慮した映像意味内容の解析手法' FIT2011 第10回情報科学技術フォーラム 講演論文集 第3分冊, 20110822, p.259-260, 社団法人電子情報通信学会 * |
JPN6015032046; 西村 朋己: '一般物体認識に適したvisual wordの作成法' 情報処理学会研究報告 第2008巻 第115号, 20081120, p.237-242, 社団法人情報処理学会 * |
JPN6015032048; 藤吉 弘亘: 'Gradientベースの特徴抽出 -SIFTとHOG-' 情報処理学会研究報告 第2007巻 第87号, 20070903, p.211-224, 社団法人情報処理学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103336964A (zh) * | 2013-07-12 | 2013-10-02 | 北京邮电大学 | 一种基于模值差镜像不变性的sift图像匹配方法 |
JP2019046334A (ja) * | 2017-09-06 | 2019-03-22 | 日本放送協会 | 分類モデル生成装置、画像データ分類装置およびそれらのプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5865687B2 (ja) | 2016-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | Spatiotemporal saliency detection and its applications in static and dynamic scenes | |
Winlock et al. | Toward real-time grocery detection for the visually impaired | |
US9727974B2 (en) | System for video super resolution using semantic components | |
US9710698B2 (en) | Method, apparatus and computer program product for human-face features extraction | |
US10255507B2 (en) | Detection of an object in a distorted image | |
US20110243381A1 (en) | Methods for tracking objects using random projections, distance learning and a hybrid template library and apparatuses thereof | |
US20150098645A1 (en) | Method, apparatus and system for selecting a frame | |
JP5656768B2 (ja) | 画像特徴量抽出装置およびそのプログラム | |
JP6071002B2 (ja) | 信頼度取得装置、信頼度取得方法および信頼度取得プログラム | |
CN111199197B (zh) | 一种人脸识别的图像提取方法及处理设备 | |
JP2017033372A (ja) | 人物認識装置及びそのプログラム | |
JP2018124689A (ja) | 移動物体検出装置、移動物体検出システム、及び移動物体検出方法 | |
Fu et al. | Salient object detection via color contrast and color distribution | |
JP2011253354A (ja) | 画像処理装置および方法、並びにプログラム | |
CN108647605B (zh) | 一种结合全局颜色与局部结构特征的人眼凝视点提取方法 | |
Balaji et al. | Cardiac view classification using speed Up robust | |
JP5865687B2 (ja) | 画像特徴量抽出装置およびそのプログラム | |
JP2016219879A (ja) | 画像処理装置、画像処理方法及びプログラム | |
Zhou et al. | Superpixel-driven level set tracking | |
JP5051671B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN110910418B (zh) | 基于旋转不变性图像特征描述子的目标跟踪算法 | |
CN113705660A (zh) | 目标识别方法及相关设备 | |
KR101276792B1 (ko) | 눈 검출 장치 및 방법 | |
Wu et al. | Kernel-based motion-blurred target tracking | |
JP4812743B2 (ja) | 顔認識装置、顔認識方法、顔認識プログラムおよびそのプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150811 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5865687 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |