JP5878634B2 - 特徴抽出方法、プログラム及びシステム - Google Patents

特徴抽出方法、プログラム及びシステム Download PDF

Info

Publication number
JP5878634B2
JP5878634B2 JP2014530490A JP2014530490A JP5878634B2 JP 5878634 B2 JP5878634 B2 JP 5878634B2 JP 2014530490 A JP2014530490 A JP 2014530490A JP 2014530490 A JP2014530490 A JP 2014530490A JP 5878634 B2 JP5878634 B2 JP 5878634B2
Authority
JP
Japan
Prior art keywords
image
calculating
vector
variable array
acceleration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014530490A
Other languages
English (en)
Other versions
JPWO2014027500A1 (ja
Inventor
俊博 ▲高▼橋
俊博 ▲高▼橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2014530490A priority Critical patent/JP5878634B2/ja
Application granted granted Critical
Publication of JP5878634B2 publication Critical patent/JP5878634B2/ja
Publication of JPWO2014027500A1 publication Critical patent/JPWO2014027500A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/579Depth or shape recovery from multiple images from motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Description

この発明は、画像から特徴量を抽出し、位置推定を行うための技法に関する。
近年、ショッピングセンターや公共施設などにおける顧客の動線解析や在庫管理など、屋内で位置を推定する技術の要望が高まっている。
屋内では、WiFiやRFIDなどの無線機器を用いるとノイズが大きいため、正確な位置推定が難しい。GPSは比較的正確な位置推定を与えるが、屋内ではGPSは使えない。そこで、移動体にカメラを取り付け、撮像した画像を解析することで位置を予測する技法が注目されている。
これに関する従来技術として、WO2008/087974は、複数のカメラの位置関係を算出する技術、および、算出した位置関係に基づいてユーザインタフェースを生成する技術に関し、GPSを用いず、撮像により、複数のカメラの位置を算出することを開示する。
藤吉 弘亘、"Gradientベースの特徴抽出 : SIFTとHOG", 情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] 2007(87), 211-224, 2007-09-03は、SIFTのアルゴリズムについて概説し、DOG画像からの極値検出や、HOGについても説明する。
特開2011−53181は、地磁気センサを搭載する必要がなく、利用者の向きを推定したり、その推定結果に従って表示部の表示情報を制御したりすることができる、信頼性の高い情報端末装置を提供するために、SIFT(Scale-Invariant Feature Transform)特徴量を使用して、方位を推定することを開示する。
SIFTは、画像の特徴抽出技法の一つで、特徴点検出と、特徴点の周囲の特徴ベクトル計算方法に関するものであるが、これとは別に、画像から特異点とカメラ位置の3次元上の位置関係を復元する技術として、Structure from Motion(SfM)が知られており、SfMは例えば、特開平10−40385、特開2009−237845、特開2009−237847などに記載がある。
SfMは、コーナーになっている部分を取り出すなど、画像から特徴点を検出し、特徴点の周囲の8x8ピクセルの明るさを並べて、単純に64ビットの特徴ベクトルを作るなどの方法で特徴点の周囲の画素から特徴ベクトルを計算し、複数の画素間でマッチングを行なう技術であり、これにより、特徴点の3次元上の位置と、カメラの位置を同時に復元することができる。
しかし、SfMを安定して求めるには、ノイズに頑健、すなわち画像のブレに対して頑健且つ画像の回転・拡大縮小に頑健な特徴量の計算手法が必要であるところ、従来の方法は計算コストが大きいという問題があった。一般的にSfMを求めるためには、ピクセル数に比例した計算量が必要なので、計算コストに対する配慮は本質的である。
WO2008/087974 特開2011−53181 特開平10−40385 特開2009−237845 特開2009−237847
藤吉 弘亘、"Gradientベースの特徴抽出 : SIFTとHOG", 情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] 2007(87), 211-224, 2007-09-03
従って、この発明の目的は、高速且つ頑健にSfMを求める技法を提供することにある。
この発明は、SfMで利用される特徴量は重力方向と平行な直線が多く、利用可能なモバイル・デバイスであるスマート・フォンなどに、加速度センサあるいはジャイロセンサが付属していることに着目して、上記課題を解決するものである。
この発明によれば、サーバの役割を果たすコンピュータ・システムが、スマート・フォンから、通信機能により、画像と加速度センサの測定結果を受け取る。
コンピュータ・システムはまず、画像から垂直方向のエッジだけを抽出する。そのために、加速度センサを用いて、カメラ座標系における重力ベクトルを求める。そして次に、システムは、重力ベクトルを用いてスクリーン座標系での垂直方向の消失点(u',v')を求める。
次にコンピュータ・システムは、スクリーン座標系の各ピクセル(u,v)毎に、輝度のu方向及びv方向の微分ベクトルを計算する。そして、微分ベクトルと(u'-u,v'-v)のなすcos成分を求め、その2つのベクトルを長さ1で正規化した後、内積を計算する。このとき、cosの絶対値がある閾値以上の場合、その画素は垂直方向のエッジをもっていると判定する。
次にコンピュータ・システムは、垂直方向に並んだエッジの集合に対して、垂直方向のエッジ強度の総和を求める。具体的には、スクリーン座標(u,v)をカメラ座標系に変換し、スクリーン座標(u,v)の2軸から1軸に射影する。そして、(u,v)における微分ベクトルの絶対値を計算し、テーブルsum[q]に書き込む。
こうしてsum[q]が用意されると、コンピュータ・システムは、sum[q]をw×1の横長の画像とみなし、例えば、DoG(difference of Gaussian)関数を使って極値を計算する。この極値を用いて、特徴量を計算する。
この発明によれば、モバイル・デバイスから受け取った画像と加速度センサの測定結果に基づき、垂直方向に並んだエッジを検出し、それらのエッジを用いて特徴抽出を行なうので、より少ない計算量で高速に位置推定を行なうことが可能となる。
室内で、スマート・フォンにより加速度データと画像データを取得して、処理のためにコンピュータに送信する様子を示す図である。 本発明で使用されるコンピュータのハードウェアの例示的なブロック図である。 本発明の処理に係る、機能ブロック図である。 sumの計算のための処理のフローチャートを示す図である。 DoGの計算及び極値検出処理のフローチャートを示す図である。 特徴量計算処理のフローチャートを示す図である。 カメラ座標系、スクリーン、重力方向の関係を示す図である。 画素の2軸の座標を、重力方向と直交する1軸に射影する方法を示す図である。 各画素と消失点を結ぶ地面と垂直な直線を、スクリーンに射影した様子を示す図である。 画像における、抽出されたキーポイントを示す図である。
以下、図面を参照して、本発明の実施例を説明する。特に断わらない限り、同一の参照番号は、図面を通して、同一の対象を指すものとする。また、以下で説明するのは、本発明の一実施形態であり、この発明を、この実施例で説明する内容に限定する意図はないことに留意されたい。
図1は、本発明を実施するための一例の全体構成を示す概要図である。図1において、部屋102には、収納庫104などの場所的特徴物が配置されている。
オペレータ106は、加速度センサとカメラ機能をもつ、スマート・フォン108で、部屋102の内部を撮影し、その撮影したイメージ・データと、加速度センサの測定データを、無線通信により、室内に配置されているコンピュータ110に送信する。
コンピュータ110は、送信されたイメージ・データと、加速度センサの測定データを受信し、これらのデータを用いて特徴を抽出し、場所を推定する処理を行なう。コンピュータ110は、スマート・フォン108から加速度センサの測定データと画像データを受信可能な構成であるなら、遠隔の場所に配置していてもよい。その場合、WiFiなどの受信ステーションを経由して、遠隔の場所に配置されたコンピュータ110に情報が転送されることになる。あるいは、最近のスマート・フォン108は、処理能力が高いので、スマート・フォン108の内部で、以下で説明する、特徴を抽出する処理を行なうようにしてもよい。以下の実施例では説明の便宜上、スマート・フォン108とは別のコンピュータ110で、特徴を抽出し、場所を推定する処理を行なうものとして説明を行なう。
図2は、コンピュータ110のハードウェア構成のブロック図を示す。図2において、システム・バス202には、CPU204と、主記憶(RAM)206と、ハードディスク・ドライブ(HDD)208と、キーボード210と、マウス212と、ディスプレイ214が接続されている。CPU204は、好適には、32ビットまたは64ビットのアーキテクチャに基づくものであり、例えば、インテル社の、Core(商標) i7、Core(商標) i5、AMD Athlon (商標)IIなどを使用することができる。主記憶206は、好適には、4GB以上の容量をもつものである。
システム・バス202にはさらに、通信インターフェース216が接続されている。通信インターフェース216は、例えばIEEE802.11a/b/gの規格に従い、アンテナ218を介して、スマート・フォン108と通信可能である。なお、コンピュータ110がスマート・フォン108からデータを受け取る方式は、IEEE802.11a/b/gに限定されず、パケット通信など、任意の方式を使用することができる。
ハードディスク・ドライブ208には、オペレーティング・システムが、格納されている。オペレーティング・システムは、Linux(商標)、マイクロソフト社のWindows 7(商標)、Windows XP(商標)、アップルコンピュータのMac OSX(商標)などの、CPU204に適合する任意のものを使用することができる。
ハードディスク・ドライブ208にはさらに、図3に関連して後で説明する、メイン・プログラム302、sum計算ルーチン306、DoGの計算&極値検出ルーチン308、及び特徴量計算ルーチン310が保存されている。これらは、C、C++、Java(R)などの既存の任意のプログラミング言語で作成することができる。
図3は、コンピュータ110における、本発明に関連する機能を実行する部分のソフトウェア構成のブロック図である。
図3において、メイン・プログラム302は、キーボード210やマウス212の操作により起動され、通信モジュール304の働きで、WiFiなどの仕組みにより、スマート・フォン108から、画像データと、加速度センサの測定データを受け取り、好適にはハードディスク・ドライブ208に保存する。
メイン・プログラム302はさらに、sum計算ルーチン306とDoGの計算&極値検出ルーチン308と特徴量計算ルーチン310を起動し、スマート・フォン108から送信された画像データと、加速度センサの測定データに基づき、本発明に従い、特徴抽出を開始する。
より具体的には、sum計算ルーチン306は、スマート・フォン108から送信された画像データと、加速度センサの測定データとから、1次元配列であるsumを計算する処理を行なう。sum計算ルーチン306の処理の詳細は、図4のフローチャートを参照して、後でより詳しく説明する。
DoGの計算&極値検出ルーチン308は、sum計算ルーチン306によって計算されたsumの値を用いて、DoG (Difference of Gaussian)を計算し、極値を検出する処理を行なう。DoGの計算&極値検出ルーチン308の処理の詳細は、図5のフローチャートを参照して、後でより詳しく説明する。
特徴量計算ルーチン310は、DoGの計算&極値検出ルーチン308によって検出された極値(キーポイント)に基づき、特徴量を計算する処理を行なう。特徴量計算ルーチン310の処理の詳細は、図6のフローチャートを参照して、後でより詳しく説明する。
次に、図4のフローチャートを参照して、sum計算ルーチン306の処理について説明する。sum計算ルーチン306は、ステップ402に示すように、画像の輝度I(u,v)と、閾値の値thresholdを引数として、メイン・プログラム302により呼び出される。ここで、画像の輝度I(u,v)とは、ピクセル座標(x,y) = (u,v)における画素の輝度である。閾値の値thresholdは、1つの実施例では0.95とセットされる。
sum計算ルーチン306は、ステップ404で、消失点u',v'を求める。すなわち、wを画像の幅、hを画像の高さ、fを焦点距離、Vg = (xg,yg,zg)を、スマート・フォン108から受け取った、重力方向をあらわす加速度の値のベクトルとすると、以下のような式により、消失点u',v'を計算する。
u' = f*xg/zg + w/2
v' = -f*yg/zg + h/2
sum計算ルーチン306は、ステップ406で、下記の式により、全ピクセル(u,v)に対して、du(u,v), dv(u,v), dlen(u,v)を求める。ここで、du(u,v)は、(u,v)におけるu方向の微分であり、dv(u,v)は、(u,v)におけるv方向の微分である。
Figure 0005878634



なおここでは、微分を、前進差分と後進差分の差の平均をとる形で計算したが、適宜、前進差分だけ、あるいは後進差分だけのような任意の微分の計算方式を採用することができる。
sum計算ルーチン306は次に、ステップ408で、全ピクセル(u,v)に対して、消失点に向かうベクトル(u'-u,v'-v)と、(-dv(u,v),du(u,v))のなす角のコサイン(cosine)成分c(u,v)を次の式で求める。
Figure 0005878634


sum計算ルーチン306は次に、ステップ410で、水平面に射影した点q(u,v)を求める。より具体的にはまず、V = (x,y,1) = ((u - w/2)/f, -(v - h/2)/f, 1)で、スクリーン座標から、カメラ座標に変換した点を求める。図7は、カメラ座標系、スクリーン、重力方向の関係を模式的に示す図である。次にsum計算ルーチン306は、Vh = (xh,yh,1) = V - Vg*<V,Vg>/<Vg,Vg>と(xg/zg,yg/zg,1)を通り、スクリーン上(z = 1)で、Vgと直交する位置を求め、Vhのx座標xhを、例えば、小数点以下を切り捨てることにより整数化した値をq(u,v)とする。すなわち、q(u,v) = (int) xhである。ここで、<V,Vg>は、ベクトルVとベクトルVgの内積をあらわす。図8に、射影によりq(u,v)を求める様子を模式的に示す。
sum計算ルーチン306は次に、ステップ412で、1次元配列sumを用意する。
sum計算ルーチン306は次に、ステップ414からステップ420までで、全ピクセル(u,v)に亘る処理を行なう。すなわち、ステップ416で、所与のピクセル(u,v)について、|c(u,v)| > thresholdかどうか判断し、もしそうなら、ステップ418で、sum[q(u,v)] += dlen(u,v)により、dlen(u,v)の値を足し込む。この実施例では、threshold = 0.95と設定されている。なお、dlen(u,v)の値はステップ406で、すべての(u,v)について、予め計算されている。
このとき、sum[q(u,v)]の値は、q(u,v)を通り地面と垂直な直線をスクリーンに射影した直線に沿って、垂直方向のエッジの強さを合算した値である。また、q(u,v)とは、q(u,v)を通り地面と垂直な直線を表している。
このようにして、ステップ414からステップ420までで、全ピクセル(u,v)に亘って処理が完了すると、Dogの計算及び極値検出に必要なsumの値が得られる。
次に、図5のフローチャートを参照して、DoGの計算及び極値検出ルーチン308の処理について説明する。DoGの計算及び極値検出ルーチン308は、ステップ502に示すように、sum計算ルーチン306によって計算されたsumと、パラメータdを入力として、メイン・プログラム302により呼び出される。
DoGの計算及び極値検出ルーチン308は、ステップ504で、標準偏差σ = σ0、σ0k、σ0k2、σ0k3、・・・で、sumをガウシアン平滑化し、sum1、sum2、sum3、sum4・・・をそれぞれ得る。
ガウシアン平滑化とは、下記のような関数を畳み込む計算を行なうことである。
Figure 0005878634


kはσの分割数であり、スケールスペースの分割数をsとすると、k = 21/sと設定される。ここで、例えば藤吉 弘亘、"Gradientベースの特徴抽出 : SIFTとHOG", 情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] 2007(87), 211-224, 2007-09-03などの記載に基づき、σ0 = 1.6、分割数s = 3とおくものとする。
DoGの計算及び極値検出ルーチン308は、ステップ506で、下記のとおり差分画像を計算して、dog1、dog2、dog3、・・・を得る。
dog1 = sum2 - sum1
dog2 = sum3 - sum2
dog3 = sum4 - sum3
・・・
ステップ508からステップ514までは、全てのq,iはの組み合わせに亘る処理であり、ステップ510でDoGの計算及び極値検出ルーチン308は、q,iの全ての近傍のq',i'で、dogi[q] < dogi'[q'] - dが成立するかどうか、すなわち、dogi[q]が極値になっているかどうかを判断し、もしそうなら、ステップ512で、q,iを検出した直線として記録する。なお、q,iの近傍のq',i'とはq±δ、i±δ以内のようなq',i'であって、例えば、δ = 2などと選んでおく。また、dの値は、大きいほど、より先鋭な極値を選ぶように条件設定される。
DoGの計算及び極値検出ルーチン308は、ステップ510でq,iの全ての近傍のq',i'で、dogi[q] < dogi'[q'] - dが成立すると判断すると、ステップ512で、q,iを、検出した直線として記録する。
こうしてステップ508からステップ514までを全てのq,iの組み合わせに亘って処理すると、全ての極値(q,i)の組み合わせが集まることになる。極値(q,i)において、i番目のDoGの値を求めるために使われた標準偏差をσとすると、(q,σ)をキーポイントと呼ぶ。dogi = sumi+1 - sumiにおいて、標準偏差σは、例えばsumi+1またはsumiのガウシアン平滑化における標準偏差である。
図10は、ある画像における抽出されたキーポイントの例を示す。
次に、図6のフローチャートを参照して、特徴量計算ルーチン310の処理について説明する。特徴量計算ルーチン310は、全てのキーポイントの値(q,σ)を入力として、メイン・プログラム302により呼び出される。特徴量計算ルーチン310は、藤吉 弘亘、"Gradientベースの特徴抽出 : SIFTとHOG", 情報処理学会研究報告. CVIM, [コンピュータビジョンとイメージメディア] 2007(87), 211-224, 2007-09-03に記述されているような、HoG(Histograms of Oriented Gradients)に基づく特徴抽出を行なう。
図6において、ステップ602からステップ620までのループは、全てのキーポイントの値における、個々のキーポイントの値(p,σ)毎の処理に対応する。ここで、σは、極値(q,i)におけるdogiの計算に使用されたsumi+1またはsumiのガウシアン平滑化における標準偏差である。
特徴量計算ルーチン310は、ステップ604で、下記の式により、qに対するスクリーン上の直線u = av + bを求める。
xh = (q - w/2)/f
yh = -(xg*xh + zg)/yg
uh = q
vh = -yh*f + h/2
a = (uh - u')/(vh - v')
b = uh - a*vh
ステップ606からステップ614までのループは、0,1,2,...,hの個々のvに対する処理である。
特徴量計算ルーチン310は、ステップ608で、ステップ604で決定されたa,bを用いて、u = av + bの計算を行なう。
特徴量計算ルーチン310は、ステップ610で、(u,v)が垂直方向のエッジかどうか判断し、そうでないなら次のステップ612をスキップし、そうなら、ステップ612で、def = I(u -σ,v) - I(u +σ,v)と、dot(u,v)を計算する。ここで、dot(u,v)は、(u'-u,v'-v)と、(-dv(u,v),du(u,v))の内積である。ここでσは、当該キーポイントを計算した際のガウシアン平滑化の標準偏差である。
こうして、v = 0,1,,...,hの各々についてステップ606からステップ614までのループを辿ると、v = 0,1,,...,hの各々についてdef = I(u -σ,v) - I(u +σ,v)と、dot(u,v)が揃う。そこで特徴量計算ルーチン310はステップ616で、各々のdefを降順にソートし、defに対応するdot(u,v)を足しこんでいく。そして、dotの累算が、dotの総和の半数を超えたところのdefの値を以って、defのmedian(中央値)とする。
次に特徴量計算ルーチン310はステップ618で、ステップ616でmedianとして選ばれたdefに対応する(u,v)におけるI(u -σ,v)とI(u +σ,v)の2つの輝度を、当該直線の特徴量とする。
このようにして、ステップ602からステップ620までを、全てのキーポイント(q,σ)について処理することにより、全てのキーポイント(q,σ)についての特徴量が得られる。
メイン・プログラム302は、このようにして得られたキーポイント(q,σ)についての特徴量でもって、既存の画像から抽出された直線の特徴量とマッチするものを探す。そして、クエリー画像の直線と、既存の画像の直線のマッチングができたら、バンドル調整(Bundle Adjustment)技法を使って、スマート・フォン108の位置を推定することができる。
以上のように、加速度センサとカメラ機能をもつスマート・フォンから、加速度データと画像データを取得する例について説明してきたが、この発明は、スマート・フォンに限定されず、加速度を測定する機能とカメラ機能をもつ任意のデバイスを使用することができる。また、加速度センサ−以外にも、ジャイロ・センサにより加速度を測定するようにしてもよい。
また、加速度データと画像データをコンピュータに送信する技術は、WiFi以外の任意の無線通信を使用することができ、有線通信を使用してもよい。
また、上記実施例では、スマート・フォンの加速度センサとカメラ機能のデータを使用し、その後の処理は別のコンピュータに送って特徴量の抽出、あるいは位置の推定を行なうようにしたが、最近のスマート・フォンの処理能力や仕様に鑑みると、別のコンピュータで行なわれる処理の一部または全部をスマート・フォン上で行なうようにすることも可能である。
さらに、加速度データと画像データを処理するためのコンピュータは、特定のハードウェアやオペレーティング・システムには限定されず、任意のプラットフォームのコンピュータが使用可能である。
108・・・スマート・フォン
110・・・コンピュータ
204・・・CPU
206・・・RAM
208・・・ハードディスク・ドライブ
216・・・通信インターフェース
304・・・通信モジュール
306・・・sum計算ルーチン
308・・・DoGの計算&極値検出ルーチン
310・・・特徴量計算ルーチン

Claims (21)

  1. コンピュータの処理により、画像から特徴を抽出する方法であって、
    画像取得手段と、加速度測定手段をもつモバイル・デバイスから、画像と、加速度の測定データを受け取るステップと、
    前記加速度の測定データに基づき、前記画像のカメラ座標系における重力ベクトルを求めるステップと、
    前記重力ベクトルを用いて、前記画像のスクリーン座標系での垂直方向の消失点を求めるステップと、
    前記スクリーン座標系の各ピクセル毎に2軸方向の微分ベクトルを求めるステップと、
    前記消失点から前記各ピクセルをむすぶ結線ベクトルを求めるステップと、
    前記微分ベクトルと前記結線ベクトルのなす角度がある閾値の範囲にあることに基づき、垂直方向のエッジを特定するステップと、
    前記垂直方向のエッジ強度の総和を求めて所定の変数配列に書き込むステップと、
    前記変数配列に基づきキーポイントを抽出するステップと、
    前記キーポイントから特徴量を計算するステップを有する、
    特徴抽出方法。
  2. 前記加速度測定手段は、加速度センサである、請求項1に記載の方法。
  3. 前記垂直方向のエッジ強度の総和を求めて所定の変数配列に書き込むステップは、スクリーン座標を(u,v)とし、前記消失点を(u',v')をとしたとき、前記微分ベクトルと(u'-u,v'-v)の内積の絶対値を計算し、前記変数配列に書き込むステップを有する、請求項1に記載の方法。
  4. 前記キーポイントを抽出するステップは、前記変数配列を横長の画像とみなし、DoG関数を使って極値を計算するステップを含む、請求項1に記載の方法。
  5. 前記モバイル・デバイスは、スマート・フォンである、請求項1に記載の方法。
  6. 前記特徴量を計算するステップが、HoGを計算するステップを有する、請求項1に記載の方法。
  7. 前記モバイル・デバイスにより、前記ステップの一部または全てが実行される、請求項1に記載の方法。
  8. コンピュータの処理により、画像から特徴を抽出するプログラムであって、
    前記コンピュータに、
    画像取得手段と、加速度測定手段をもつモバイル・デバイスから、画像と、加速度の測定データを受け取るステップと、
    前記加速度の測定データに基づき、前記画像のカメラ座標系における重力ベクトルを求めるステップと、
    前記重力ベクトルを用いて、前記画像のスクリーン座標系での垂直方向の消失点を求めるステップと、
    前記スクリーン座標系の各ピクセル毎に2軸方向の微分ベクトルを求めるステップと、
    前記消失点から前記各ピクセルをむすぶ結線ベクトルを求めるステップと、
    前記微分ベクトルと前記結線ベクトルのなす角度がある閾値の範囲にあることに基づき、垂直方向のエッジを特定するステップと、
    前記垂直方向のエッジ強度の総和を求めて所定の変数配列に書き込むステップと、
    前記変数配列に基づきキーポイントを抽出するステップと、
    前記キーポイントから特徴量を計算するステップを実行させる、
    特徴抽出プログラム。
  9. 前記モバイル・デバイスは、スマート・フォンである、請求項8に記載のプログラム。
  10. 前記加速度測定手段は、加速度センサである、請求項9に記載のプログラム。
  11. 前記垂直方向のエッジ強度の総和を求めて所定の変数配列に書き込むステップは、スクリーン座標を(u,v)とし、前記消失点を(u',v')をとしたとき、前記微分ベクトルと(u'-u,v'-v)の内積の絶対値を計算し、前記変数配列に書き込むステップを有する、請求項8に記載のプログラム。
  12. 前記キーポイントを抽出するステップは、前記変数配列を横長の画像とみなし、DoG関数を使って極値を計算するステップを含む、請求項8に記載のプログラム。
  13. 前記特徴量を計算するステップが、HoGを計算するステップを有する、請求項8に記載のプログラム。
  14. 前記モバイル・デバイスにより、前記ステップの一部または全てが実行される、請求項8に記載のプログラム。
  15. コンピュータの処理により、画像から特徴を抽出するシステムであって、
    画像取得手段と、加速度測定手段をもつモバイル・デバイスから、画像と、加速度の測定データを受け取る手段と、
    前記加速度の測定データに基づき、カメラ座標系における重力ベクトルを求める手段と、
    前記重力ベクトルを用いて、スクリーン座標系での垂直方向の消失点を求める手段と、
    スクリーン座標系の各ピクセル毎に2軸方向の微分ベクトルを求める手段と、
    前記消失点から前記各ピクセルをむすぶ結線ベクトルを求める手段と、
    前記微分ベクトルと前記結線ベクトルのなす角度がある閾値の範囲にあることに基づき、垂直方向のエッジを特定する手段と、
    前記垂直方向のエッジ強度の総和を求めて所定の変数配列に書き込む手段と、
    前記変数配列に基づきキーポイントを抽出する手段と、
    前記キーポイントから特徴量を計算する手段を有する、
    特徴抽出システム。
  16. 前記モバイル・デバイスは、スマート・フォンである、請求項15に記載のシステム。
  17. 前記加速度測定手段は、加速度センサである、請求項16に記載のシステム。
  18. 前記垂直方向のエッジ強度の総和を求めて所定の変数配列に書き込む手段は、スクリーン座標を(u,v)とし、前記消失点を(u',v')をとしたとき、前記微分ベクトルと(u'-u,v'-v)の内積の絶対値を計算し、前記変数配列に書き込む処理を行なう、請求項15に記載のシステム。
  19. 前記キーポイントを抽出する手段は、前記変数配列を横長の画像とみなし、DoG関数を使って極値を計算する処理を行なう、請求項15に記載のシステム。
  20. 前記特徴量を計算する手段が、HoGを計算する処理を行なう、請求項15に記載のシステム。
  21. コンピュータの処理により、画像から特徴を抽出するモバイル・デバイスであって、
    画像取得手段と、
    加速度測定手段と、
    前記加速度測定手段からの測定データに基づき、前記画像取得手段により取得した画像のカメラ座標系における重力ベクトルを求める手段と、
    前記重力ベクトルを用いて、前記画像のスクリーン座標系での垂直方向の消失点を求める手段と、
    前記スクリーン座標系の各ピクセル毎に2軸方向の微分ベクトルを求める手段と、
    前記消失点から前記各ピクセルをむすぶ結線ベクトルを求める手段と、
    前記微分ベクトルと前記結線ベクトルのなす角度がある閾値の範囲にあることに基づき、垂直方向のエッジを特定する手段と、
    前記垂直方向のエッジ強度の総和を求めて所定の変数配列に書き込む手段と、
    前記変数配列に基づきキーポイントを抽出する手段と、
    前記キーポイントから特徴量を計算する手段を有する、
    モバイル・デバイス。
JP2014530490A 2012-08-15 2013-06-13 特徴抽出方法、プログラム及びシステム Active JP5878634B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014530490A JP5878634B2 (ja) 2012-08-15 2013-06-13 特徴抽出方法、プログラム及びシステム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2012179994 2012-08-15
JP2012179994 2012-08-15
PCT/JP2013/066316 WO2014027500A1 (ja) 2012-08-15 2013-06-13 特徴抽出方法、プログラム及びシステム
JP2014530490A JP5878634B2 (ja) 2012-08-15 2013-06-13 特徴抽出方法、プログラム及びシステム

Publications (2)

Publication Number Publication Date
JP5878634B2 true JP5878634B2 (ja) 2016-03-08
JPWO2014027500A1 JPWO2014027500A1 (ja) 2016-07-25

Family

ID=50100051

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014530490A Active JP5878634B2 (ja) 2012-08-15 2013-06-13 特徴抽出方法、プログラム及びシステム

Country Status (6)

Country Link
US (2) US9087268B2 (ja)
JP (1) JP5878634B2 (ja)
CN (1) CN104508706B (ja)
DE (1) DE112013003541B4 (ja)
GB (1) GB2519266B (ja)
WO (1) WO2014027500A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104508706B (zh) 2012-08-15 2017-03-22 国际商业机器公司 特征提取方法、程序和系统
US9135705B2 (en) * 2012-10-16 2015-09-15 Qualcomm Incorporated Sensor calibration and position estimation based on vanishing point determination
KR102546714B1 (ko) * 2015-12-15 2023-06-23 삼성전자주식회사 전자장치 및 그 거치대
JP2021122079A (ja) * 2018-05-08 2021-08-26 ソニーグループ株式会社 情報処理装置、情報処理方法、及びプログラム
KR20210034253A (ko) 2019-09-20 2021-03-30 삼성전자주식회사 위치 추정 장치 및 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113197A (ja) * 2009-11-25 2011-06-09 Kddi Corp 画像検索方法およびシステム
JP2012127896A (ja) * 2010-12-17 2012-07-05 Kumamoto Univ 移動体位置測定装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3548652B2 (ja) 1996-07-24 2004-07-28 株式会社東芝 物体形状復元装置及びその方法
US6091833A (en) * 1996-08-28 2000-07-18 Matsushita Electric Industrial Co., Ltd. Local positioning apparatus, and a method therefor
JP4157620B2 (ja) * 1998-06-19 2008-10-01 株式会社東芝 移動物体検出装置及びその方法
JP4007899B2 (ja) * 2002-11-07 2007-11-14 オリンパス株式会社 運動検出装置
JP4142460B2 (ja) * 2003-01-31 2008-09-03 オリンパス株式会社 運動検出装置
JP4046186B2 (ja) 2003-02-03 2008-02-13 学校法人明治大学 自己位置計測方法及び装置
US7961909B2 (en) * 2006-03-08 2011-06-14 Electronic Scripting Products, Inc. Computer interface employing a manipulated object with absolute pose detection component and a display
US7583858B2 (en) * 2004-10-12 2009-09-01 Eastman Kodak Company Image processing based on direction of gravity
JP4552658B2 (ja) * 2005-01-13 2010-09-29 日立金属株式会社 2軸磁気センサを用いた姿勢検知方法およびそのプログラム
JP4617993B2 (ja) * 2005-04-28 2011-01-26 ソニー株式会社 画像処理装置および画像処理方法、プログラム、並びに、記録媒体
JP4820221B2 (ja) * 2006-06-29 2011-11-24 日立オートモティブシステムズ株式会社 車載カメラのキャリブレーション装置およびプログラム
JP4789745B2 (ja) 2006-08-11 2011-10-12 キヤノン株式会社 画像処理装置および方法
CN101192269B (zh) * 2006-11-29 2012-05-02 佳能株式会社 从图像估计消失点的方法和装置、计算机程序及其存储介质
WO2008087974A1 (ja) 2007-01-16 2008-07-24 Panasonic Corporation データ処理装置、方法、記録媒体
JP5083887B2 (ja) 2007-12-05 2012-11-28 Kddi株式会社 情報端末装置
JP2009237847A (ja) 2008-03-27 2009-10-15 Sony Corp 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP4985516B2 (ja) 2008-03-27 2012-07-25 ソニー株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
AT506928B1 (de) * 2008-05-28 2012-07-15 Kiwisecurity Software Gmbh Verfahren zur videoanalyse
JP5266953B2 (ja) * 2008-08-19 2013-08-21 セイコーエプソン株式会社 投写型表示装置および表示方法
JP5080409B2 (ja) 2008-09-11 2012-11-21 Kddi株式会社 情報端末装置
JP5089545B2 (ja) * 2008-09-17 2012-12-05 日立オートモティブシステムズ株式会社 道路境界検出判断装置
US8970690B2 (en) * 2009-02-13 2015-03-03 Metaio Gmbh Methods and systems for determining the pose of a camera with respect to at least one object of a real environment
JP5279083B2 (ja) 2009-09-04 2013-09-04 Kddi株式会社 情報端末装置
US9041796B2 (en) * 2010-08-01 2015-05-26 Francis Ruben Malka Method, tool, and device for determining the coordinates of points on a surface by means of an accelerometer and a camera
CN102542603A (zh) * 2011-01-04 2012-07-04 鸿富锦精密工业(深圳)有限公司 电子装置及利用其进行指定场景设计的方法
JP5630282B2 (ja) 2011-01-19 2014-11-26 ソニー株式会社 データ処理装置、及び、データ処理方法
CN104508706B (zh) 2012-08-15 2017-03-22 国际商业机器公司 特征提取方法、程序和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113197A (ja) * 2009-11-25 2011-06-09 Kddi Corp 画像検索方法およびシステム
JP2012127896A (ja) * 2010-12-17 2012-07-05 Kumamoto Univ 移動体位置測定装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6015052727; 鳥居 秋彦: '多視点3次元復元の研究動向' 情報処理学会研究報告 CVIM No.176, 20110415, p.1-22, 一般社団法人情報処理学会 *

Also Published As

Publication number Publication date
GB2519266A (en) 2015-04-15
WO2014027500A1 (ja) 2014-02-20
US9020196B2 (en) 2015-04-28
US20140050353A1 (en) 2014-02-20
GB201502309D0 (en) 2015-04-01
US20140050359A1 (en) 2014-02-20
JPWO2014027500A1 (ja) 2016-07-25
CN104508706B (zh) 2017-03-22
US9087268B2 (en) 2015-07-21
GB2519266B (en) 2015-08-26
DE112013003541T5 (de) 2015-04-09
DE112013003541B4 (de) 2018-10-25
CN104508706A (zh) 2015-04-08

Similar Documents

Publication Publication Date Title
JP5878634B2 (ja) 特徴抽出方法、プログラム及びシステム
CN110111388B (zh) 三维物体位姿参数估计方法及视觉设备
EP3434626B1 (en) Projection instruction device, parcel sorting system, and projection instruction method
JP2017520063A5 (ja)
JP5146446B2 (ja) 移動体検知装置および移動体検知プログラムと移動体検知方法
TW202034270A (zh) 車輛事故的鑑定方法及裝置、電子設備
EP2960859B1 (en) Constructing a 3d structure
US9396553B2 (en) Vehicle dimension estimation from vehicle images
JP6021689B2 (ja) 車両諸元計測処理装置、車両諸元計測方法及びプログラム
CN113029128B (zh) 视觉导航方法及相关装置、移动终端、存储介质
EP3434622A1 (en) Instruction projecting device, package sorting system and instruction projecting method
EP3434621A1 (en) Instruction projecting device, package sorting system and instruction projecting method
JP2018120283A (ja) 情報処理装置、情報処理方法及びプログラム
CN111382637A (zh) 行人检测跟踪方法、装置、终端设备及介质
CN108052869B (zh) 车道线识别方法、装置及计算机可读存储介质
Huttunen et al. A monocular camera gyroscope
CN109903308B (zh) 用于获取信息的方法及装置
CN112585957A (zh) 车站监控系统及车站监控方法
CN112489240A (zh) 一种商品陈列巡检方法、巡检机器人以及存储介质
CN112435291A (zh) 一种多目标体积测量方法、装置及存储介质
CN112037261A (zh) 一种图像动态特征去除方法及装置
CN111339226A (zh) 一种基于分类检测网络构建地图方法及装置
EP3434625A1 (en) Projection instruction device, parcel sorting system, and projection instruction method
CN112712018B (en) Identification map building method, visual positioning method and device
WO2024119914A1 (zh) 机器人运动信息的确定方法、系统、机器人和介质

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160128

R150 Certificate of patent or registration of utility model

Ref document number: 5878634

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150