JP7464135B2 - 移動量推定装置、移動量推定方法およびプログラム - Google Patents

移動量推定装置、移動量推定方法およびプログラム Download PDF

Info

Publication number
JP7464135B2
JP7464135B2 JP2022546791A JP2022546791A JP7464135B2 JP 7464135 B2 JP7464135 B2 JP 7464135B2 JP 2022546791 A JP2022546791 A JP 2022546791A JP 2022546791 A JP2022546791 A JP 2022546791A JP 7464135 B2 JP7464135 B2 JP 7464135B2
Authority
JP
Japan
Prior art keywords
image
movement amount
amount estimation
feature points
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022546791A
Other languages
English (en)
Other versions
JPWO2022049690A1 (ja
Inventor
彦俊 中里
健二 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2022049690A1 publication Critical patent/JPWO2022049690A1/ja
Application granted granted Critical
Publication of JP7464135B2 publication Critical patent/JP7464135B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

本発明は、2映像間の移動量を推定する、移動量推定装置、移動量推定方法およびプログラムに関する。
例えば、自動車等の移動対象を複数のカメラ等のデバイスで捕捉して撮影する場合において、そのデバイス(カメラデバイス)の最適な制御値は、その配置位置によって変動する。従来、画像と視点座標という2つのセンサ情報を用いて、そのシーンに固有の変数を推論し、未知の視点座標から対応する観測画像を、深層生成モデルを用いて予測する技術が開発されている(例えば、非特許文献1参照)。この技術を利用することで、変動するデバイスの配置位置を推定することが可能である。
谷口尚平、他2名、「メタ学習としてのGenerative Query Network」、一般社団法人人工知能学会、2019年度人工知能学会全国大会(第33回)、人工知能学会全国大会論文集 2Q5-J-2-03、 2019年6月
従来の深層生成モデルを用いた3次元モデリング手法では、3次元空間上の視点座標から観測画像を予測するために3次元空間モデルを予め用意しておく必要があった。この場合において、デバイスの配置位置が変動(状況が変化)するときには、各状況において最適なデバイス制御値の割り出しを実行していた。
しかしながら、デバイスの位置が頻繁に移動するような場合では、膨大な状況数を必要とし、新しい状況が発生するごとに、3次元空間モデルを再定義し、デバイス制御値を学習し直す必要があった。このため、最適値へ収束するまでの準備時間の増大を招き、サービス品質維持時間の低下に結びつくものであった。
このような点に鑑みて本発明がなされたのであり、本発明は、カメラデバイスの配置位置が変化した場合でも、そのカメラデバイスの移動量を、3次元空間モデルを用いずに撮影画像から簡易に算出すること、を課題とする。
本発明に係る変動量推定装置は、カメラデバイスの配置位置の変化に伴う画像間の移動量を推定する移動量推定装置であって、前記カメラデバイスの過去の配置位置それぞれで撮影された比較対象となる画像を示す過去画像を記憶する記憶部と、新たな配置位置のカメラデバイスにより撮影された画像を、比較元となる画像を示す現在画像として取り込み、前記記憶部から前記過去画像を取り込み、前記現在画像および前記過去画像から所定の特徴量抽出アルゴリズムを用いてそれぞれの特徴点を抽出して、当該特徴点間のマッチングを行う特徴量抽出部と、複数の前記マッチングされた特徴点のうちから所定数の特徴点を選択し、選択した前記所定数の特徴点の位置の変化からホモグラフィ行列を算出し、算出したホモグラフィ行列を用いて、選択した前記所定数の特徴点以外の特徴点それぞれについての特徴点間の座標のずれを示す誤差距離を計算して当該誤差距離の総和を算出し、前記誤差距離の総和の算出をすべての特徴点の選択の組み合わせで行い、算出された複数の前記誤差距離の総和のうちの最小値を算出した際の前記ホモグラフィ行列を、前記現在画像と前記過去画像の座標の変化を示すホモグラフィ行列として採用し、採用した前記ホモグラフィ行列の固有値を用いて、前記新たな配置位置のカメラデバイスの移動量を推定する移動量推定部と、を備え、前記移動量推定部は、採用した前記ホモグラフィ行列の固有値を用いて、値が小さい程前記現在画像と前記過去画像との類似度が高くなる指標としてのL2ノルムを算出し、前記特徴量抽出部が、新規の配置パターンのカメラデバイス群における各カメラデバイスの複数の前記現在画像を取り込み、前記移動量推定部が複数の前記現在画像それぞれの比較対象となる過去画像について算出した前記L2ノルムのうちの最小値の前記過去画像を選択する処理を実行し、当該選択した過去画像について前記移動量推定部が算出した複数の前記誤差距離の総和のうちの最小値を所定の距離で割った値を用いて、前記新規の配置パターンの各カメラデバイスと、その現在画像に類似する過去画像を撮影したカメラデバイスとの推定距離をホップ数として算出する類似デバイス抽出部をさらに備えることを特徴とする。
本発明によれば、カメラデバイスの配置位置が変化した場合でも、そのカメラデバイスの移動量を、3次元空間モデルを用いずに撮影画像から簡易に算出することができる。
本実施形態に係る移動量推定装置が実行する処理の概要を説明する図である。 本実施形態に係る移動量推定装置の構成を示すブロック図である。 ホモグラフィ行列の内容を説明する図である。 現在画像と比較した各過去画像における、L2ノルム(類似度:Sim)の値を示す図である。 本実施形態に係るL2ノルムとホモグラフィ行列における固有値の例を示す図である。 現在画像と比較した各過去画像における、X軸方向の移動量と、Y軸方向の移動量と、L2ノルム(類似度:Sim)の値を示す図である。 本実施形態に係る類似デバイス抽出部による、ホップ数の算出処理を説明する図である。 本実施形態に係る移動量推定装置が実行する移動量推定処理の流れを示すフローチャートである。 本実施形態に係る移動量推定装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。 特徴量抽出手法による画像の特徴量の抽出処理を説明する図である。 特徴量抽出手法による画像間の特徴量のマッチングを説明する図である。 従来の特徴量抽出手法において移動量を推定する際の課題を説明する図である。
次に、本発明を実施するための形態(以下、「本実施形態」と称する。)について説明する。まず、本発明の概要を説明する。
<概要>
これまで、画像内の物体から局所的な特徴量を抽出する手法として、SIFT(Scale Invariant Feature Transform)、SURF(Speeded-Up Robust Features)、ORB(Oriented FAST and Rotated BRIEF)、AKAZE(Accelerated KAZE)等の様々な特徴量抽出手法が開発されている。この特徴量抽出技術では、図10に示すように、エッジ(画素値が変化する境界)やコーナー(エッジの集合)を特徴点として算出する。
この特徴量抽出手法の中でも、AKAZEは、画像内からエッジやコーナーを抽出した上で、フィルタ処理を行うことにより、注目画素の近傍を考慮しつつ、フィルタサイズを変更することで近傍範囲を変化させることができる。よって、AKAZEは、画像の拡大・縮小の変化や、画像のスライド(平行移動)、画像の回転等に強いロバスト的な特徴量抽出アルゴリズムとして知られている。
このAKAZE等の特徴量抽出手法を用いて、画像内での特定の物体を構成する特徴点グループを抽出する処理を行い、図11に示すように、現在画像(比較元画像:符号5a)と過去画像(比較対象画像:符号5b)の異なる2つの画像に共通する特徴点のベクトルを比較することにより、ベクトルの類似度が高い特徴点のマッチングを行うことができる(現在画像と過去画像の特徴点のマッチング:符号5m)。
そして、マッチングされた特徴点の位置の変化量を「データ間距離」とし、データ間距離が小さいほど2つの画像間の変化量も少なく、類似度が高い画像であると判定することができる。
これにより、従来の特徴量抽出手法のみからデータ間距離を算出する場合、カメラデバイスの配置位置が平行移動している場合には特徴量の変化から画像の変化量を算出することが可能である。しかしながら、例えば、図12で示すように、現在画像5aと、過去画像5b,5b、やズーム画像5bとの比較において、画像の変化内容(傾きや拡大・縮小)によっては、各特徴点の変化量の分散が大きくなり、画像間の変化量が一意に求められず、誤差を多く内包する可能性がある。
そこで、本実施形態に係る移動量推定装置1(図2参照)は、AKAZE等の従来の特徴量抽出手法に、画像間の変化量を表現できるホモグラフィ行列(詳細は後記)を組み合わせることにより、画像間の変化量を一意に求め、画像を撮影したカメラデバイスの移動量を推定することを特徴とする。
図1は、本実施形態に係る移動量推定装置1が実行する処理の概要を説明する図である。
図1に示すように、移動量推定装置1は、比較元画像である現在画像5a(新たな位置に配置されたカメラデバイスが撮影した画像)と、比較対象である過去画像5b(過去に他の位置で撮影された画像)とを取り込み、特徴量抽出アルゴリズムを用いて、それぞれの画像から特徴量を抽出する(ステップS1)。
移動量推定装置1は、現在画像5aと過去画像5bとの間で特徴点のマッチングを行い(ステップS2)、2つの画像のマッチングされた各特徴点の位置の変化からホモグラフィ行列を算出する(ステップS3)。そして、移動量推定装置1は、算出したホモグラフィ行列から画像の類似度を推定し(ステップS4)、類似度が所定のレベルよりも高い(後記する「L2ノルム」が所定の閾値以下である)画像同士で、カメラ位置の移動量の推定を行う(ステップS5)。なお、各処理の詳細は後記する。
以下、移動量推定装置1の詳細について説明する。
<本実施形態>
図2は、本実施形態に係る移動量推定装置1の構成を示すブロック図である。
移動量推定装置1は、通信ネットワーク等を介して複数のデバイス(カメラデバイス50)に接続され、当該デバイスが撮影した画像を用いて、新たに配置されるカメラデバイス50(比較元のデバイス)と配置済みのカメラデバイス50(比較対象のデバイス)との間のデバイスの移動量を推定する装置である。
この移動量推定装置1は、制御部10と、入出力部11と、記憶部12とを備える。
入出力部11は、他の装置(複数のカメラデバイス50等)との間の情報について入出力を行う。この入出力部11は、通信回線を介して情報の送受信を行う通信インタフェースと、不図示のキーボード等の入力装置やモニタ等の出力装置との間で情報の入出力を行う入出力インタフェースとから構成される。
記憶部12は、ハードディスクやフラッシュメモリ、RAM(Random Access Memory)等により構成される。
この記憶部12には、デバイス毎の画像データ200が記憶される(詳細は後記)。
また、記憶部12には、さらに、制御部10の各機能部を実行させるためのプログラムや、制御部10の処理に必要な情報が一時的に記憶される。
制御部10は、移動量推定装置1が実行する処理の全般を司り、画像認識部110と、類似デバイス抽出部120とを含んで構成される。
画像認識部110は、比較元画像である現在画像5aと、比較対象である過去画像5bとを取り込み、特徴量抽出アルゴリズムを用いて、それぞれの画像から特徴量を抽出する。そして、画像認識部110は、現在画像5aと過去画像5bとの間で特徴点のマッチングを行う。画像認識部110は、2つの画像のマッチングされた各特徴点の位置の変化からホモグラフィ行列を算出し、算出したホモグラフィ行列から画像の変化量を推定する。
この画像認識部110は、特徴量抽出部111と移動量推定部112とを含んで構成される。
特徴量抽出部111は、カメラデバイス50から比較元画像である現在画像5aを取得する。また、特徴量抽出部111は、記憶部12内の画像データ200から、複数のカメラデバイス50により撮影された過去画像5bを取得する。なお、画像データ200には、各カメラデバイス50に対応付けて、そのカメラデバイス50が撮影した画像(過去画像5b)が記憶される。
また、比較元画像となる現在画像5aを送信してきたカメラデバイス50は、既存の(過去の)カメラデバイス50の配置位置において撮影された画像ではなく、新たに配置された位置で撮影した画像を送信するデバイスであるものとする。
特徴量抽出部111は、例えばAKAZE等の所定の特徴量抽出アルゴリズムを用いて、現在画像5aおよび1つ以上の過去画像5bからそれぞれの特徴量を抽出し、各特徴点のベクトルを比較することにより、ベクトルの類似度が高い特徴点をマッチングする。つまり、特徴量抽出部111は、画像間の特徴点の組合せを算出する。
なお、特徴量抽出部111による特徴量の抽出手法は、AKAZEに限定されず、2つの画像間での特徴点の変動量を推定できる手法であれば、他の手法でも適用可能である。
移動量推定部112は、図3の符号31に示す、変換前画像55aと、変換後画像55bとにおいてマッチングされた各特徴点の位置の変化からホモグラフィ行列(図3の符号100)を算出する。ホモグラフィとは、ある平面を、射影変換を用いて別の平面に射影することをいう。
ホモグラフィ行列100は、ある画像において、射影変換(拡大・縮小、回転、平行移動など)が行われた場合、元画像の画像座標(変換前座標:x,y)から変換後の画像座標(変換後座標:x′,y′)に射影することができる3×3の行列で表される。
変換後座標(x′,y′)は、変換前座標(x,y)とホモグラフィ行列とを用いて図3の式(1)のように表すことができる。
ホモグラフィ変換では、図3の符号32に示すように、ホモグラフィ行列100の各要素を、9つのパラメータ(h11,h12,…,h33)で表現する。
ここで、例えば、座標x,yに依存しない影響を示すパラメータ「h13,h23」に着目すればX軸・Y軸方向の移動量を推定することができる。また、スケールに対する影響度を示すパラメータ「h31,h32」に着目すれば、スケール(拡大・縮小)の変化量を推定することができる。よって、ホモグラフィ行列の各要素(パラメータ)を利用することにより、実際のカメラ位置の変化量を推定することが可能になる。
ホモグラフィ行列における固有値Hを確定するためには、4組以上の特徴量のペア(所定数の特徴点)が必要となる。本実施形態に係る移動量推定部112は、4組以上の特徴量のペアが存在する場合には、そのすべての特徴量のペアに関して、後記する誤差距離の総和Sを算出する。そして、移動量推定部112は、算出した誤差距離の総和Sが最も小さい4組のペアによるホモグラフィ行列の固有値Hを採用する。
≪ホモグラフィ行列における固有値Hの確定処理≫
移動量推定部112は、ホモグラフィ行列における固有値Hの確定処理を以下に示す手順で行う。
ここで、変換前の座標を変換前座標aとし、変換後の座標を変換後座標a′とする。また、n組(ここでは、例として10組)の特徴量のペア(以下、「特徴量ペア」と称する。)があるとする。
(手順1)n組(10組)の特徴量ペアのうち、ランダムの4組の特徴量ペア(所定数の特徴点)を選び、ホモグラフィ行列を算出する。
(手順2)残り6組の特徴量ペアのそれぞれについて、(手順1)で算出されたホモグラフィ行列と座標(Ha)とを使って算出した値と実際の座標(Ha′)との差√(x+y)(誤差距離:変換後座標を(0,0)としたときの座標平面上の2点間の距離であり、特徴点間の座標のずれを示す。)を残り6組の特徴量ペアそれぞれについて求め、その誤差距離の総和Sを算出する。
(手順3)(手順2)で算出された誤差距離の総和Sを、全通りの特徴量ペア(ここでは、10通り)計算する。
(手順4)誤差距離の総和Sが最も小さい特徴量ペア(4組の特徴量ペア)で算出されたホモグラフィ行列を採用し、固有値Hとして確定する。
なお、移動量推定部112は、採用したホモグラフィ行列における誤差距離の情報(最も小さい誤差距離の総和S)を、後記する新たな配置パターンのカメラデバイス50に関するホップ数の算出に利用するため、記憶部12に記憶しておく。
本実施形態では、特徴点の位置の変化量であるデータ間距離としてホモグラフィ行列で示される固有ベクトルを利用し、2画像間の類似度を示す指標として、ホモグラフィ行列における固有値を用いたL2ノルムを採用する。
L2ノルムは、画像間の類似度(Sim)を示す指標であり、以下の式(2)で示される。
Figure 0007464135000001
ここで、xは、ホモグラフィ行列の固有値を示す。
移動量推定部112は、確定したホモグラフィ行列の固有値HからこのL2ノルムを計算する。このL2ノルムは、値が小さいほど類似度が高いものとなる。
図4のグラフ(符号41)は、現在画像5aと比較した各過去画像5bについての、L2ノルムである画像間の類似度(Sim)(縦軸)の値を示している。
図4では、過去画像「05.jpg」は、他の過去画像5bに比べL2ノルムの値が低くなっている。これにより、現在画像5aと過去画像「05.jpg」の類似度が高いことが示される。
また、図5に示す各過去画像5bについてのL2ノルムを示すグラフ(符号41)では、過去画像「05.jpg」および「04.jpg」において、L2ノルムがそれぞれ「0.0226」「0.0245」と小さい値となっている。
よって、この2つの過去画像5bは、現在画像5aとの類似度が高いことが示される。このとき、「05.jpg」および「04.jpg」のホモグラフィ行列の固有値は、図5の符号Hと符号Hで示される。
そして、このホモグラフィ行列の固有値H,H4から、例えば、X軸方向の移動量を示す値(h13成分)、Y軸方向の移動量を示す値(h23成分)が示される。なお、X軸方向の移動量(h13成分:符号aで示す値)は、Y軸方向の移動量(h23成分:符号bで示す値)よりも大きな値であることがわかる。また、スケール(拡大・縮小)の変化量を示す値(h31成分,h32成分:符号cで示す値)が全体として小さな値であることがわかる。
図6は、現在画像5aと比較した各過去画像5bにおける、X軸方向の移動量と、Y軸方向の移動量と、L2ノルム(類似度:Sim)の値を示す図である。移動量推定部112は、画像間の類似度(Sim)を示すL2ノルムの値が所定の閾値以下の場合に、画像間の類似度が高いとして、画像同士で推定されたX軸方向とY軸方向の移動量が、実際の変動量に比例し信頼できるデータであるとする。
一方、L2ノルムの値が所定の閾値を超える場合、画像間の類似度が低く、現在画像5aと過去画像5bの2つの画像が全体として様相が大きく変わっており、一致する特徴量(特徴点)が少なかったり、特徴量自身のマッピングがずれていることが起因して、推定される変動量と実際の画像との間にずれが発生しやすいものとなる。つまり、X軸方向、Y軸方向の移動量の信頼度は低いものとなる。
図6に示す例では、例えば、L2ノルムの所定の閾値が「5.000e-01」であるとする。移動量推定部112は、L2ノルムの値が「5.000e-01」以下である過去画像5b(5b12,5b13,5b14,5b15,5b16)(図6において各データを斜線で囲んだ過去画像)を類似度の高い画像として抽出する。図6に示す例では、比較元となる現在画像5aと同様に、駅舎と列車の両方が映っている過去画像5bが類似度の高い画像として抽出される。
そして、移動量推定部112は、類似度の高い画像として抽出した、X軸方向、Y軸方向の移動量を、カメラデバイス50の移動量として推定する。
なお、例えば、A-B-C-D-Eの位置順にカメラデバイスが配置されているとき、移動量推定装置1は、A-Eの移動量を直接計算するよりも、A-B、B-C、C-D、D-Eのような近傍デバイスのみの移動量を個別に計算し組み合わせる方が、類似度の高い画像同士でデバイスの移動量を推定できるため有効である。
以上説明した、画像認識部110の特徴量抽出部111および移動量推定部112は、複数のカメラデバイス50で構成される新規の配置パターンとして、複数のカメラデバイス50からの画像(現在画像5a)を取得した場合には、各カメラデバイス50から取得したそれぞれの画像に対して、上記した特徴量抽出処理と、ホモグラフィ行列の算出によるデータ間距離(固有値H)およびL2ノルムの算出を実行する。
図2に戻り、類似デバイス抽出部120の処理について説明する。
類似デバイス抽出部120は、新規に配置されたパターン(以下、「新規配置パターン」と称する。)のカメラデバイス群の画像(各現在画像5a)を移動量推定装置1が取得した場合、画像認識部110が、上記において説明した処理を行い、画像データ200に記憶された過去画像5bと比較することにより算出したデータ間距離(固有値H)およびL2ノルムを用いて、L2ノルムが所定の閾値以下の過去画像5bを抽出する。これにより、類似デバイス抽出部120は、画像間の類似度が高い、つまり、新規配置パターンのカメラデバイス50と配置位置の近いデバイスを抽出する。
ここで、類似デバイス抽出部120は、新規配置パターンのカメラデバイス50毎に、抽出したデバイスの中で、L2ノルムの値が最小のカメラデバイス50を選択する。そして、類似デバイス抽出部120は、選択したカメラデバイス50それぞれについて、移動量推定部112が算出した誤差距離の総和Sを、所定の距離N(Nは、2点間を1ポップとして規定する距離)で割った値について小数点を繰り上げ(Roundup)し、ホップ数(推定距離)として保持する。
なお、新規配置パターンに類似するカメラデバイス50を選択する前提として、各カメラデバイス50におけるカメラズーム倍率は常に一定であり不変であるとする。また、各カメラデバイス50の絶対的な位置情報は、他の手段からは得られないものとする。
図7は、本実施形態に係る類似デバイス抽出部120による、ホップ数の算出処理を説明する図である。ここでは、類似デバイス抽出部120が、新規配置パターンのデバイス「A」「B」「C」の配置位置に近いデバイスの距離を推定する場合で説明する。なお、デバイス「A」「B」は、図7において同一機種として同じ記号「〇」で示し、デバイスCは、それとは異なる機種として記号「△」で示している。
デバイス「A」の近傍では、L2ノルムの値であるSim(類似度)が所定の閾値(Th)以下(Sim<Th)であり、そのうちの最小値として選択されたデバイス「P1」が抽出される。そして、デバイス「A」は、デバイス「P1」の近傍の1ホップ以内の距離にあると推定される(H(A,P1)=1)。
同様に、デバイス「B」の近傍には、Simが所定の閾値(Th)以下(Sim<Th)であり、そのうちの最小値として選択されたデバイス「P3」が抽出される。なお、デバイス「P2」は、Simが所定の閾値(Th)を超えているので抽出されない。そして、デバイス「B」は、デバイスP3の近傍の3ホップ以内の距離にあると推定される(H(A,P1)=3)。
同様に、デバイスCの近傍には、Simが所定の閾値(Th)以下(Sim<Th)であり、そのうちの最小値として選択されたデバイス「P4」が抽出される。なお、デバイス「P5」は、Simが所定の閾値(Th)を超えているので抽出されない。そして、デバイス「C」は、デバイス「P4」の近傍の2ホップ以内の距離にあると推定される(H(A,P1)=2)。
このようにして、類似デバイス抽出部120は、新規配置パターンにおける各カメラデバイス50の現在画像5aから、L2ノルム(Sim)が所定の閾値以下であり、そのL2ノルムの値が最小のカメラデバイス50を抽出する。そして、類似デバイス抽出部120は、新規配置パターンおけるカメラデバイス50と抽出したカメラデバイス50との間の誤差距離の総和Sを用いて、ホップ数(推定距離)を算出することができる。
以上より、移動量推定装置1は、類似すると判定された2映像間の距離差を、その環境下で定義されたホップ単位に変換することにより、実際のカメラデバイス50間の物理的な距離差に比例した正確なずれを算出することができる。
<処理の流れ>
次に、本実施形態に係る移動量推定装置1が、現在画像5aと過去画像5bとを用いてカメラデバイス50の移動量を推定する処理(移動量推定処理)について図8を参照して説明する。
≪移動量推定処理≫
図8は、本実施形態に係る移動量推定装置1が実行する移動量推定処理の流れを示すフローチャートである。
まず、移動量推定装置1の画像認識部110(特徴量抽出部111)は、比較元画像である現在画像5aを、カメラデバイス50から取り込み、所定の特徴量抽出アルゴリズムを用いて特徴量を抽出する(ステップS10)。
続いて、特徴量抽出部111は、記憶部12に記憶された画像データ200から比較対象となる過去画像5bを取り込み、所定の特徴量抽出アルゴリズムを用いて特徴量を抽出する(ステップS11)。
次に、特徴量抽出部111は、現在画像5aの特徴量(特徴点)と過去画像5bの特徴量(特徴点)とのマッチングを行い、画像間の特徴点の組み合わせを算出する(ステップS12)。
そして、画像認識部110の移動量推定部112は、マッチングされた特徴点の位置の変化からホモグラフィ行列を算出する(ステップS13)。
具体的には、移動量推定部112は、上記のように、ランダムに4つの特徴量ペア(所定数の特徴点)を選んだ上でホモグラフィ行列を算出し、残りの特徴量ペアについて、当該ホモグラフィ行列で算出した座標と実際の座標との距離を距離誤差としてその総和Sを算出する。移動量推定部112は、全通りの特徴量ペアについての距離誤差の総和Sを算出し、総和Sが最も小さい特徴量ペア(4つの特徴量ペア)で算出されたホモグラフィ行列を、その画像間のホモグラフィ行列として算出する。
続いて、移動量推定部112は、ステップS13において算出したホモグラフィ行列を用いて、画像間の類似度(Sim)を示すL2ノルムを、上記した式(2)により算出する(ステップS14)。
このL2ノルムの値が、所定の閾値以下の場合に、画像間の類似度が高いものとなる。なお、L2ノルムの値が、所定の閾値を超える場合には、その画像の類似度は低いものとし、画像からの移動量の推定はできない。
また、移動量推定部112は、L2ノルムが所定の閾値以下の場合には、ステップS13において算出したホモグラフィ行列の固有値を参照して、移動量を推定する(ステップS15)。例えば、移動量推定部112は、ホモグラフィ行列のパラメータ(h13成分)により、X軸方向の移動量を推定する。ホモグラフィ行列のパラメータ(h23成分)により、Y軸方向の移動量を推定する。また、ホモグラフィ行列のパラメータ(h31成分,h32成分)により、スケール(拡大・縮小)の変化量を推定する。
次に、類似デバイス抽出部120は、ステップS14において算出されたL2ノルムの値が所定値以下の過去画像5bを抽出し、抽出した過去画像5bの中でL2ノルムの値が最小となる画像およびそのカメラデバイス50を選択する(ステップS16)。
そして、類似デバイス抽出部120は、現在画像5aと、L2ノルムが最小となる画像との間において、ステップS13でホモグラフィ行列を導出する際に算出した誤差距離の総和Sの値に基づき、ホップ数を算出する(ステップS17)。
このようにすることで、移動量推定装置1は、新たに配置されたカメラデバイス50の画像(現在画像5a)と、過去のカメラデバイス50で撮影された画像(過去画像5b)とから、カメラデバイス50の移動量を推定することができる。
また、移動量推定装置1は、類似すると判定された2映像間の距離差を、その環境下で定義されたホップ単位に変換することにより、実際のカメラデバイス50間の物理的な距離差に比例した正確なずれを算出することができる。
<ハードウェア構成>
本実施形態に係る移動量推定装置1は、例えば図9に示すようなコンピュータ900によって実現される。
図9は、本実施形態に係る移動量推定装置1の機能を実現するコンピュータ900の一例を示すハードウェア構成図である。コンピュータ900は、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM903、HDD(Hard Disk Drive)904、入出力I/F(Interface)905、通信I/F906およびメディアI/F907を有する。
CPU901は、ROM902またはHDD904に記憶されたプログラムに基づき作動し、図2に示す移動量推定装置1の制御部10による制御を行う。ROM902は、コンピュータ900の起動時にCPU901により実行されるブートプログラムや、コンピュータ900のハードウェアに係るプログラム等を記憶する。
CPU901は、入出力I/F905を介して、マウスやキーボード等の入力装置910、および、ディスプレイ等の出力装置911を制御する。CPU901は、入出力I/F905を介して、入力装置910からデータを取得するともに、生成したデータを出力装置911へ出力する。なお、プロセッサとしてCPU901とともに、GPU(Graphics Processing Unit)等を用いても良い。
HDD904は、CPU901により実行されるプログラムおよび当該プログラムによって使用されるデータ等を記憶する。通信I/F906は、通信網(例えば、NW(Network)920)を介して他の装置からデータを受信してCPU901へ出力し、また、CPU901が生成したデータを、通信網を介して他の装置へ送信する。
メディアI/F907は、記録媒体912に格納されたプログラムまたはデータを読み取り、RAM903を介してCPU901へ出力する。CPU901は、目的の処理に係るプログラムを、メディアI/F907を介して記録媒体912からRAM903上にロードし、ロードしたプログラムを実行する。記録媒体912は、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto Optical disk)等の光磁気記録媒体、磁気記録媒体、導体メモリテープ媒体又は半導体メモリ等である。
例えば、コンピュータ900が本実施形態に係る移動量推定装置1として機能する場合、コンピュータ900のCPU901は、RAM903上にロードされたプログラムを実行することにより移動量推定装置1の機能を実現する。また、HDD904には、RAM903内のデータが記憶される。CPU901は、目的の処理に係るプログラムを記録媒体912から読み取って実行する。この他、CPU901は、他の装置から通信網(NW920)を介して目的の処理に係るプログラムを読み込んでもよい。
<効果>
以下、本発明に係る移動量推定装置1等の効果について説明する。
本発明に係る移動量推定装置は、カメラデバイス50の配置位置の変化に伴う画像間の移動量を推定する移動量推定装置1であって、カメラデバイス50の過去の配置位置それぞれで撮影された比較対象となる画像を示す過去画像5bを記憶する記憶部12と、新たな配置位置のカメラデバイス50により撮影された画像を、比較元となる画像を示す現在画像5aとして取り込み、記憶部12から過去画像5bを取り込み、現在画像5aおよび過去画像5bから所定の特徴量抽出アルゴリズムを用いてそれぞれの特徴点を抽出して、当該特徴点間のマッチングを行う特徴量抽出部111と、複数のマッチングされた特徴点のうちから所定数の特徴点を選択し、選択した所定数の特徴点の位置の変化からホモグラフィ行列を算出し、算出したホモグラフィ行列を用いて、選択した所定数の特徴点以外の特徴点それぞれについての特徴点間の座標のずれを示す誤差距離を計算して当該誤差距離の総和を算出し、誤差距離の総和の算出をすべての特徴点の選択の組み合わせで行い、算出された複数の誤差距離の総和のうちの最小値を算出した際のホモグラフィ行列を、現在画像5aと過去画像5bの座標の変化を示すホモグラフィ行列として採用し、採用したホモグラフィ行列の固有値を用いて、新たな配置位置のカメラデバイス50の移動量を推定する移動量推定部と、を備えることを特徴とする。
このように、移動量推定装置1は、所定の特徴量抽出アルゴリズムにより抽出した現在画像5aと過去画像5bの特徴点の位置の変化から、画像間の変化量を示すホモグラフィ行列を算出することができる。これにより、カメラデバイス50の配置位置が変化した場合でも、そのカメラデバイス50の移動量を、3次元空間モデルを用いずに撮影画像から算出したホモグラフィ行列の固有値に基づき簡易に算出することができる。
また、移動量推定装置1において、移動量推定部112が、採用したホモグラフィ行列の固有値を用いて、値が小さい程現在画像5aと過去画像5bとの類似度が高くなる指標としてのL2ノルムを算出することを特徴とする。
このようにすることにより、移動量推定装置1は、例えば、算出したL2ノルムが所定の閾値以下の過去画像を、現在画像に類似する画像として抽出することができる。
また、移動量推定装置1において、特徴量抽出部111が、新規の配置パターンのカメラデバイス群における各カメラデバイス50の複数の現在画像5aを取り込み、移動量推定部112が複数の現在画像5aそれぞれの比較対象となる過去画像5bについて算出したL2ノルムのうちの最小値の過去画像5bを選択する処理を実行し、当該選択した過去画像5bについて移動量推定部112が算出した複数の誤差距離の総和のうちの最小値を所定の距離で割った値を用いて、新規の配置パターンの各カメラデバイス50と、その現在画像5aに類似する過去画像5bを撮影したカメラデバイス50との推定距離をホップ数として算出する類似デバイス抽出部120をさらに備えることを特徴とする。
このように、移動量推定装置1は、新規の配置パターンの各カメラデバイス50の現在画像5aに類似する過去画像5bを選択する。そして、移動量推定装置1は、その選択した過去画像5bを撮影したカメラデバイス50と新規の配置パターンのカメラデバイス50との推定距離をホップ数として算出することができる。よって、移動量推定装置1は、実際のカメラデバイス50間の物理的な距離差に比例した正確なずれを算出することができる。
なお、本発明は、以上説明した実施形態に限定されるものではなく、多くの変形が本発明の技術的思想内で当分野において通常の知識を有する者により可能である。
1 移動量推定装置
10 制御部
11 入出力部
12 記憶部
50 カメラデバイス
100 ホモグラフィ行列
110 画像認識部
111 特徴量抽出部
112 移動量推定部
120 類似デバイス抽出部
200 画像データ

Claims (3)

  1. カメラデバイスの配置位置の変化に伴う画像間の移動量を推定する移動量推定装置であって、
    前記カメラデバイスの過去の配置位置それぞれで撮影された比較対象となる画像を示す過去画像を記憶する記憶部と、
    新たな配置位置のカメラデバイスにより撮影された画像を、比較元となる画像を示す現在画像として取り込み、前記記憶部から前記過去画像を取り込み、前記現在画像および前記過去画像から所定の特徴量抽出アルゴリズムを用いてそれぞれの特徴点を抽出して、当該特徴点間のマッチングを行う特徴量抽出部と、
    複数の前記マッチングされた特徴点のうちから所定数の特徴点を選択し、選択した前記所定数の特徴点の位置の変化からホモグラフィ行列を算出し、算出したホモグラフィ行列を用いて、選択した前記所定数の特徴点以外の特徴点それぞれについての特徴点間の座標のずれを示す誤差距離を計算して当該誤差距離の総和を算出し、前記誤差距離の総和の算出をすべての特徴点の選択の組み合わせで行い、算出された複数の前記誤差距離の総和のうちの最小値を算出した際の前記ホモグラフィ行列を、前記現在画像と前記過去画像の座標の変化を示すホモグラフィ行列として採用し、採用した前記ホモグラフィ行列の固有値を用いて、前記新たな配置位置のカメラデバイスの移動量を推定する移動量推定部と、を備え
    前記移動量推定部は、採用した前記ホモグラフィ行列の固有値を用いて、値が小さい程前記現在画像と前記過去画像との類似度が高くなる指標としてのL2ノルムを算出し、
    前記特徴量抽出部が、新規の配置パターンのカメラデバイス群における各カメラデバイスの複数の前記現在画像を取り込み、前記移動量推定部が複数の前記現在画像それぞれの比較対象となる過去画像について算出した前記L2ノルムのうちの最小値の前記過去画像を選択する処理を実行し、
    当該選択した過去画像について前記移動量推定部が算出した複数の前記誤差距離の総和のうちの最小値を所定の距離で割った値を用いて、前記新規の配置パターンの各カメラデバイスと、その現在画像に類似する過去画像を撮影したカメラデバイスとの推定距離をホップ数として算出する類似デバイス抽出部
    をさらに備えることを特徴とする移動量推定装置。
  2. カメラデバイスの配置位置の変化に伴う画像間の移動量を推定する移動量推定装置の移動量推定方法であって、
    前記移動量推定装置は、
    前記カメラデバイスの過去の配置位置それぞれで撮影された比較対象となる画像を示す過去画像を記憶する記憶部を備えており、
    新たな配置位置のカメラデバイスにより撮影された画像を、比較元となる画像を示す現在画像として取り込み、前記記憶部から前記過去画像を取り込み、前記現在画像および前記過去画像から所定の特徴量抽出アルゴリズムを用いてそれぞれの特徴点を抽出して、当該特徴点間のマッチングを行う特徴量抽出ステップと、
    複数の前記マッチングされた特徴点のうちから所定数の特徴点を選択し、選択した前記所定数の特徴点の位置の変化からホモグラフィ行列を算出し、算出したホモグラフィ行列を用いて、選択した前記所定数の特徴点以外の特徴点それぞれについての特徴点間の座標のずれを示す誤差距離を計算して当該誤差距離の総和を算出し、前記誤差距離の総和の算出をすべての特徴点の選択の組み合わせで行い、算出された複数の前記誤差距離の総和のうちの最小値を算出した際の前記ホモグラフィ行列を、前記現在画像と前記過去画像の座標の変化を示すホモグラフィ行列として採用し、採用した前記ホモグラフィ行列の固有値を用いて、前記新たな配置位置のカメラデバイスの移動量を推定する移動量推定ステップと、を実行し、
    前記移動量推定ステップにおいて、採用した前記ホモグラフィ行列の固有値を用いて、値が小さい程前記現在画像と前記過去画像との類似度が高くなる指標としてのL2ノルムを算出し、
    前記特徴量抽出ステップにおいて、新規の配置パターンのカメラデバイス群における各カメラデバイスの複数の前記現在画像を取り込み、前記移動量推定ステップにおいて複数の前記現在画像それぞれの比較対象となる過去画像について算出した前記L2ノルムのうちの最小値の前記過去画像を選択する処理を実行し、
    当該選択した過去画像について前記移動量推定ステップにおいて算出した複数の前記誤差距離の総和のうちの最小値を所定の距離で割った値を用いて、前記新規の配置パターンの各カメラデバイスと、その現在画像に類似する過去画像を撮影したカメラデバイスとの推定距離をホップ数として算出する類似デバイス抽出ステップを実行すること
    特徴とする移動量推定方法。
  3. コンピュータを、請求項1に記載の移動量推定装置として機能させるためのプログラム。
JP2022546791A 2020-09-03 2020-09-03 移動量推定装置、移動量推定方法およびプログラム Active JP7464135B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/033405 WO2022049690A1 (ja) 2020-09-03 2020-09-03 移動量推定装置、移動量推定方法およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2022049690A1 JPWO2022049690A1 (ja) 2022-03-10
JP7464135B2 true JP7464135B2 (ja) 2024-04-09

Family

ID=80491888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022546791A Active JP7464135B2 (ja) 2020-09-03 2020-09-03 移動量推定装置、移動量推定方法およびプログラム

Country Status (2)

Country Link
JP (1) JP7464135B2 (ja)
WO (1) WO2022049690A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007043679A1 (ja) 2005-10-14 2007-04-19 Sharp Kabushiki Kaisha 情報処理装置およびプログラム
WO2010050206A1 (ja) 2008-10-28 2010-05-06 日本電気株式会社 なりすまし検知システム、なりすまし検知方法及びなりすまし検知プログラム
JP2014192613A (ja) 2013-03-26 2014-10-06 Canon Inc 画像処理装置及び方法、及び撮像装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007043679A1 (ja) 2005-10-14 2007-04-19 Sharp Kabushiki Kaisha 情報処理装置およびプログラム
WO2010050206A1 (ja) 2008-10-28 2010-05-06 日本電気株式会社 なりすまし検知システム、なりすまし検知方法及びなりすまし検知プログラム
JP2014192613A (ja) 2013-03-26 2014-10-06 Canon Inc 画像処理装置及び方法、及び撮像装置

Also Published As

Publication number Publication date
WO2022049690A1 (ja) 2022-03-10
JPWO2022049690A1 (ja) 2022-03-10

Similar Documents

Publication Publication Date Title
CN111325796B (zh) 用于确定视觉设备的位姿的方法和装置
US10334168B2 (en) Threshold determination in a RANSAC algorithm
US10373380B2 (en) 3-dimensional scene analysis for augmented reality operations
US9177381B2 (en) Depth estimate determination, systems and methods
US10957068B2 (en) Information processing apparatus and method of controlling the same
JP2016095849A (ja) 前景画像分割方法及び装置、プログラム、並びに記録媒体
US10861185B2 (en) Information processing apparatus and method of controlling the same
KR20170091496A (ko) 양안 시차 영상의 처리 방법 및 장치
US11030478B1 (en) System and method for correspondence map determination
JP2018113021A (ja) 情報処理装置およびその制御方法、プログラム
US20150371396A1 (en) Constructing a 3d structure
KR101478709B1 (ko) Rgb-d 영상 특징점 추출 및 특징 기술자 생성 방법 및 장치
JP2024508024A (ja) 画像データの処理方法及び装置
KR102074929B1 (ko) 깊이 영상을 통한 평면 검출 방법 및 장치 그리고 비일시적 컴퓨터 판독가능 기록매체
JP2010072700A (ja) 画像処理装置、画像処理方法、及び、撮像システム
JP7464135B2 (ja) 移動量推定装置、移動量推定方法およびプログラム
JP2006113832A (ja) ステレオ画像処理装置およびプログラム
JP2023056466A (ja) グローバル測位装置及び方法
US20230419605A1 (en) Map generation apparatus, map generation method, and non-transitory computer-readable medium storing program
JP6843552B2 (ja) 画像処理装置、画像処理方法およびプログラム。
WO2017042852A1 (en) Object recognition appratus, object recognition method and storage medium
JP6641313B2 (ja) 領域抽出装置及びプログラム
JP7380895B2 (ja) 転移学習装置、転移学習方法およびプログラム
JP2002170111A (ja) 画像合成装置、画像合成方法および画像合成プログラムを記録した記録媒体
JP2018200175A (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240311

R150 Certificate of patent or registration of utility model

Ref document number: 7464135

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150