JP2016015037A - 情報処理装置及びその制御方法、並びに、ビデオカメラ - Google Patents
情報処理装置及びその制御方法、並びに、ビデオカメラ Download PDFInfo
- Publication number
- JP2016015037A JP2016015037A JP2014137066A JP2014137066A JP2016015037A JP 2016015037 A JP2016015037 A JP 2016015037A JP 2014137066 A JP2014137066 A JP 2014137066A JP 2014137066 A JP2014137066 A JP 2014137066A JP 2016015037 A JP2016015037 A JP 2016015037A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- space
- affine transformation
- image
- coordinates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000010365 information processing Effects 0.000 title claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims abstract description 195
- 230000009466 transformation Effects 0.000 claims abstract description 91
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 44
- 238000000605 extraction Methods 0.000 claims 1
- 238000003672 processing method Methods 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 15
- 238000001514 detection method Methods 0.000 description 8
- 230000015654 memory Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000004870 electrical engineering Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 229940050561 matrix product Drugs 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Studio Devices (AREA)
Abstract
【課題】 例えば2つの画像における画像1から画像2へのホモグラフィ行列の推定を高速に行えるようにする。
【解決手段】 n(n=2,3)次元の第1の空間の特徴点から第2の空間の特徴点への射影変換行列の推定を行う情報処理方法であって、前記第1の空間、第2の空間の特徴点座標とは異なる基準座標を設け、当該基準座標の原点と各座標軸の単位座標の点で構成されるn+1点から、前記第1の空間に対する第1のアフィン変換パラメータを抽出する工程と、該アフィン変換パラメータから逆アフィン変換行列を生成する工程と、該逆アフィン変換行列を他の行列に乗算して、前記射影変換行列を推定する工程とを有する。
【選択図】 図2
【解決手段】 n(n=2,3)次元の第1の空間の特徴点から第2の空間の特徴点への射影変換行列の推定を行う情報処理方法であって、前記第1の空間、第2の空間の特徴点座標とは異なる基準座標を設け、当該基準座標の原点と各座標軸の単位座標の点で構成されるn+1点から、前記第1の空間に対する第1のアフィン変換パラメータを抽出する工程と、該アフィン変換パラメータから逆アフィン変換行列を生成する工程と、該逆アフィン変換行列を他の行列に乗算して、前記射影変換行列を推定する工程とを有する。
【選択図】 図2
Description
本発明は、2次元又は3次元座標データを2次元座標データに変換するための座標変換行列の演算技術に関するものである。
射影変換には2次元空間から2次元空間への変換であるホモグラフィ変換や、3次元空間から3次元空間への変換などがある。2つの空間の対応点の座標データから前記ホモグラフィ変換行列や3次元射影変換行列を計算することはコンピュータビジョンにおいて基本的な処理である。これらの行列は、パノラマ画像の生成、プロジェクタの投影位置の補正、平面パターンを用いるカメラ校正、対象物の3次元形状推定・復元、道路面上の障害物検出など幅広い用途で利用することが出来る。
以下、ホモグラフィ行列を利用して実現する動画撮影カメラの防振機能の原理、ホモグラフィ行列の求め方を説明した後、その課題について言及する。
動画撮影して得られる連続フレームのフレーム間のブレを幾何変換行列として検出し、該幾何変換行列を十数フレームに渡って平滑化した行列で、画像を逆補正することにより、フレーム間のブレを平滑化でき、動画撮影時の手ぶれ防振機能を実現できる。
カメラから被写体までの距離が十分に離れており、被写体の各注目点が同一平面上に存在すると見なしても問題無い場合、前記フレーム間のブレを表現する幾何変換行列はホモグラフィ行列で表すことができ、フレーム間の画素の座標は式(1)で対応付けられる。
式(1)における右辺の3行3列の行列がホモグラフィ行列であり、前のフレームの(u,v)座標の画素は、(x,y)座標に変換される。また、式(1)は、同次座標を用いることにより、非線形な射影変換を線形演算で表現できるようにしたものである。
式(1)の3行3列の右下の9番目の要素を規格化と称し、1に設定すると、他の8つの要素が自由な値をとることが可能であり、自由度8の行列となる。一方、式(1)の関係で表される2画像間の座標を展開すると、次の式(A)に示す2つの方程式が得られる。
(gu1+hv1+1)x1=au1+bv1+c
(gu1+hv1+1)y1=au1+bv1+f …(A)
(gu1+hv1+1)x1=au1+bv1+c
(gu1+hv1+1)y1=au1+bv1+f …(A)
4組の対応点から8つの方程式、すなわち、8元連立方程式を立てることができ、この連立方程式を解くことによりホモグラフィ行列を1つ求めることができる。
このような方法を用い、画像中の4つの特徴点の組合せに対して、ホモグラフィ行列を求めて評価を行い、その中で評価結果の一番良い行列を選出し、画像間の関係を表すホモグラフィ行列とするといった推定方法が、RANSAC推定として知られている。評価の高い行列を得るには、なるべく多くの特徴点の組合せに対してホモグラフィ行列を求めて評価を行う必要があり、その回数は画像毎に数百〜数千という数になる。
該連立方程式を解く手法としてガウス法、ガウスジョルダン法などがよく知られているが、演算量が多い上に、数値計算上の演算誤差が大きくなることがある。もちろん、その対策としてピボットという手法も考えられているが、それを実行するとさらに処理量が増える。
一方、非特許文献1において、上記手法とは全く異なるアプローチで画像間のホモグラフィ行列を推定する手法が述べられている。該手法について簡単に説明する。
画像1から画像2へのホモグラフィ行列を推定する際に、それらの画像とは別の空間に、単位正方形を定め、該単位正方形から画像1への第1のホモグラフィ行列H1と、該単位正方形から画像2への第2のホモグラフィ行列H2とを推定する。その後に、第1のホモグラフィ行列H1の逆行列H1-1に第2のホモグラフィ行列H2を乗算し、H2・H1-1を画像1から画像2へのホモグラフィ行列として算出する、というものである。
この手法では、2つのホモグラフィ行列を推定し、一方のホモグラフィ行列の逆行列を計算し、該ホモグラフィ行列の逆行列ともう一方のホモグラフィ行列とを乗算するといった処理が必要となる。
ビデオカメラなどの撮像装置における防振機能等の用途では、1フレーム中から何百もの特徴点を抽出し、フレーム間で対応点を探索する。そして、1フレーム時間内に該対応点の種々の組合せに対して、ホモグラフィ行列を推定計算する必要があり、1つの行列推定を高速に行う必要がある。昨今のビデオカメラにおける撮像画素数は多くなる一方であることを踏まえると、より短時間に上記の行列推定を行う技術が望まれる所以である。
この課題を解決するため、例えば本発明の情報処理装置は以下の構成を備える。すなわち、
n(n=2、又は3)次元の第1の空間の特徴点から第2の空間の特徴点への射影変換行列の推定を行う情報処理装置であって、
前記第1の空間、第2の空間の特徴点座標とは異なる基準座標を設け、当該基準座標の原点と各座標軸の単位座標点で構成されるn+1点から、前記第1の空間に対する第1のアフィン変換パラメータを抽出する手段と、
該アフィン変換パラメータから逆アフィン変換行列を生成する手段と、
該逆アフィン変換行列を他の行列に乗算して、前記射影変換行列を推定する手段とを有する。
n(n=2、又は3)次元の第1の空間の特徴点から第2の空間の特徴点への射影変換行列の推定を行う情報処理装置であって、
前記第1の空間、第2の空間の特徴点座標とは異なる基準座標を設け、当該基準座標の原点と各座標軸の単位座標点で構成されるn+1点から、前記第1の空間に対する第1のアフィン変換パラメータを抽出する手段と、
該アフィン変換パラメータから逆アフィン変換行列を生成する手段と、
該逆アフィン変換行列を他の行列に乗算して、前記射影変換行列を推定する手段とを有する。
本発明によれば、例えば2つ画像に対するホモグラフィ行列の内、逆行列を求める側のホモグラフィ行列をアフィン変換行列に関する処理に置き換えることが可能となり、演算処理を削減することができ、画像1から画像2へのホモグラフィ行列の推定を高速に行えるようになる。
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。なお、以下ではホモグラフィ行列を推定する情報処理装置として、防振機能を有するビデオカメラに適用した例を説明する。
[第1の実施形態]
図5は実施形態におけるビデオカメラの主要部分のブロック構成図である。以下、同図を参照し、構成要素とその機能を説明する。
図5は実施形態におけるビデオカメラの主要部分のブロック構成図である。以下、同図を参照し、構成要素とその機能を説明する。
制御部501は装置全体の制御を司るものであり、CPU等のプロセッサを含む。また、制御部501は、その処理手順(プログラム)を格納するメモリ501aを有する。そして、制御部501には、操作者からの指示を受け付けるための操作部502が接続されている。撮像部503は、光学レンズ、撮像素子で構成され、例えば1秒当たり30フレームの画像データを取得し、スイッチ504を介してフレームメモリ505,506に、フレーム単位に交互にフレーム画像を格納する。この結果、フレームメモリ505,506には時間的に前後する2個のフレーム画像が保持されることになる。ブレ検出部508は、フレームメモリ505,506に格納された連続する2つのフレーム画像からホモグラフィ変換行列を推定することで、ブレ量を検出する。そして、ブレ検出部508は推定したホモグラフィ変換行列に基づくスキャン順を決定し、その情報をスキャン部509に提供する。スイッチ507は、フレームメモリ505,506のうち、後続する側のフレーム画像を格納している方をスキャン部509と接続する。スキャン部509は、ブレ検出部508からの情報に基づき、スイッチ507が選択中のフレームメモリから画像データを読み出し、ブレ量を相殺したフレーム画像を符号化部510に出力する。符号化部510は、スキャン部509から出力されたフレーム画像を符号化し、符号化データを記録部511に出力する。記録部511は、符号化データを、メモリカード(例えばSDカード)等の記憶媒体512に動画像ファイルとして記録する。ブレ検出部508、スキャン部509、符号化部510、記録部511は、それぞれ独立の回路で構成してもよいし、制御部501と同一のプロセッサが、メモリ501aに格納されたそれぞれ別の処理手順(プログラム)を実行することで、実現してもよい。
次に上記実施形態におけるブレ検出部508におけるホモグラフィ変換行列の推定処理を説明する。本実施形態はホモグラフィ行列および3次元から3次元への射影変換行列を画像・空間間の対応特徴点から推定する処理に関するものである。本実施形態の変換行列の推定処理の一部において、基準座標の原点(0,0)及び2つの単位座標点(1,0)、(0,1)から、時間的に前に位置するフレーム画像1の対応付けした3つの特徴点へのアフィン変換行列を推定し、該アフィン変換行列の逆行列を計算する。そして、処理を含んだフレーム画像1(以下、単に画像1)から時間的に後続するフレーム画像2(以下、単に画像2)へのホモグラフィ行列の推定処理を行う。
まず、第1の実施形態におけるホモグラフィ行列の分解と、分解した各行列について説明する。下記の式(2)の左辺は自由度8のホモグラフィ行列を表しており、該ホモグラフィ行列を、右辺左側に示す自由度6のアフィン変換行列と右辺右側に示す自由度2のパラメータ行列とに分解する。このように分解すると、後述するように各パラメータの推定や逆行列の計算を簡略化することが出来るようになる。
式(2)の右辺左側の第1の行列が自由度6、右辺右側の第2の行列が自由度2であることは一目瞭然であり、それらの積である左辺の行列は自由度8になる。よって、自由度8のホモグラフィ行列は、式(2)の左辺にて表現でき、式(2)の右辺のように分解できる。後は右辺の2つの行列を求めればよい。
本実施形態におけるパラメータ推定処理の最大の特徴は、右辺の2つの行列のパラメータを推定することである。これらのパラメータは後述するように各行列で独立に求めることができ、逆行列パラメータも独立に計算できる。これらによりパラメータ推定を簡略化できるわけである。
本実施形態では、画像とは別に定める基準座標における原点(0,0)及び2つの単位座標(1,0)、(0,1)を、画像中の特徴点3点に対応付ける。この対応付けはアフィン変換行列で表現でき、それが式(2)の右辺の第1の行列である。そして、右辺第2の行列は、画像中の4つ目の特徴点に対応する基準座標の座標値を定めるパラメータ行列である。
一般的に、アフィン変換行列は、対応付ける3点の座標が定まれば求められる。ここでは、一方の座標の3点を図1(A)に示す基準座標の原点(0,0)及び2つの単位座標(1,0)、(0,1)とする。そして、対応付ける画像中の3つの特徴点と座標を図1(B)に示す、Q0(x0,y0),Q1(x1,y1),Q3(x3,y3)とすると、そのアフィン変換行列は式(2)の右辺第1の行列になることは、次に示す式(3)から直ちに分かる。
上記式(3)の左辺左側の行列はアフィン変換行列であり、左辺右側の行列は基準座標上の前記3点の同次座標、右辺は変換後の同次座標を表している。
次に、式(2)右辺第2行列のパラメータ推定の前に、該行列の性質について説明する。該行列による変換は、基準座標の原点(0,0)と2つの単位座標(1,0)、(0,1)を変換後も保ち、座標(1,1)を(s,t)/(s+t−1)へ移動する。これを同次座標で表現すると式(4)のようになる。
この変換行列は、一般の射影変換行列からアフィン変換成分を除いた、遠近感を表現する射影成分のみの行列であると言える。そこで、本明細書では、これ以降、該変換行列を「射影成分行列」と呼ぶことにする。
式(4)における右辺の行列の上2行の2次元座標、すなわち、前記基準座標の3点と(1,1)を前記射影成分行列で変換した4点に対して、R0(0,0),R1(1,0),R3(0,1),R2(s/(s+t−1),t/(s+t−1))と定める。それらの位置関係は、例えば図1(C)のように表せる。
ここで、3つの点、点1点2点3から形成される三角形の面積を「△点1点2点3」にて表現する。すると点R2を頂点とする3種の三角形の面積の比、△R0R2R3:△R1R2R0:△R1R2R3は、s:t:1、になることが分かる。ちなみに変換前の比は1:1:1である。∵△R0R2R3=1×s/(s+t−1)/2=s/2(s+t−1)
△R1R2R0=1×t/(s+t−1)/2=t/2(s+t−1)
△R1R2R3=△R1R2R0+△R0R2R3−△R0R1R3
=(s+t)/2(s+t−1)−1/2=1/2(s+t−1)
上記R2に対応させる画像中の4つ目の特徴点と座標をQ2(x2,y2)とし、全4つの特徴点の位置関係を図1(D)に示す。上記面積比に対応する該画像における面積比は、△Q0Q2Q3:△Q1Q2Q0:△Q1Q2Q3、になる。
△R1R2R0=1×t/(s+t−1)/2=t/2(s+t−1)
△R1R2R3=△R1R2R0+△R0R2R3−△R0R1R3
=(s+t)/2(s+t−1)−1/2=1/2(s+t−1)
上記R2に対応させる画像中の4つ目の特徴点と座標をQ2(x2,y2)とし、全4つの特徴点の位置関係を図1(D)に示す。上記面積比に対応する該画像における面積比は、△Q0Q2Q3:△Q1Q2Q0:△Q1Q2Q3、になる。
「領域の面積比を保存する」アフィン変換の性質に基づき、R2をQ2に対応させる、すなわち、R2を前記アフィン変換行列で変換した点がQ2と同じになるようにする。
そのためには、s=△Q0Q2Q3/△Q1Q2Q3,t=△Q1Q2Q0/△Q1Q2Q3,に設定すればよいことが分かる。
そのためには、s=△Q0Q2Q3/△Q1Q2Q3,t=△Q1Q2Q0/△Q1Q2Q3,に設定すればよいことが分かる。
具体的には式(5)に示すように、各々の三角形の2辺のベクトルの外積の比によって設定することができる。これで、「射影成分行列」における2つの射影成分パラメータが決まり、該行列が確定する。
先に示した非特許文献1における推定手法と同様に、本実施形態においても、基準座標から画像1と画像2に対するホモグラフィ行列を推定する。そのため、これまでに説明した、式(2)右辺のアフィン変換行列と射影成分行列のパラメータを該2つの画像に対して求める。
これまでに説明した諸性質を利用し、画像1から画像2へのホモグラフィ行列を推定する、ブレ検出部508における演算処理を、図2に示す処理フローを用いて説明する。
ステップS201にて、画像2の4つの特徴点の座標から射影成分パラメータs2,t2を計算する。ステップS202にて、式(2)の左辺の行列における計算式に基づき、射影成分パラメータs2,t2と特徴点座標から、画像2に対するホモグラフィ行列H2を算出する。
次に、ステップS203にて、画像1の4つの特徴点の座標から射影成分パラメータs1,t1を求めて射影成分行列を生成し、その逆行列Pinvを計算する。そして、ステップS204にて、画像1の3つの特徴点の座標からアフィン変換パラメータを抽出し、このアフィン変換の逆変換行列Ainvを生成する。
ステップS205にて、射影成分行列の逆行列Pinvとアフィン変換の逆変換行列Ainvの積を計算して、基準座標から画像1へのホモグラフィ行列H1の逆行列(H1-1)を算出する。次に、ステップS206にて、ホモグラフィ行列H1の逆行列(H1-1)に、ステップ202で算出したホモグラフィ行列H2を乗算して、画像1から画像2に対するホモグラフィ行列H21を計算する。
以上を要約すると、まず最初に、ホモグラフィ行列をアフィン変換行列とパラメータ行列の積に分解できることを示した。しかし、該パラメータ行列に関する性質や求め方について報告した先行技術が無いため、この分解はこれまで意味の無いものであった。本願発明者は、該パラメータ行列の主要なパラメータが、特徴点の座標から得られる幾何学的な特徴量である面積と密接な関係があることを見出し、この行列による変換は特徴点が形作る面積の比を変換する性質があることを示した。この面積の比を変換する性質が遠近感を醸し出すものであるため、該行列を「射影成分行列」と命名した。そして、該行列による変換の後に行うアフィン変換は、前記面積の比を保存した変換を行う関係にある。これらに基づいて、画像間の関係を表すホモグラフィ行列を少ない演算量で計算する新たな方法を示したのが本実施形態である。
特徴点の座標情報から各々独立に算出できるアフィン変換行列と射影成分行列の積でホモグラフィ行列を算出できるようにしたので、該ホモグラフィ行列の逆行列を各々の行列の逆行列の積によって計算できるようになった。その結果、画像間のホモグラフィ行列を少ない計算量で演算可能となった。
なお、射影成分行列の2つのパラメータs,tは、射影変換行列の3行目の左2つの要素に、各々1を加算した関係にあるため、従来手法で該2つの要素を求め、それに1を加算して射影成分行列の2つのパラメータs,tを計算してもよい。そのように計算しても前記ホモグラフィ行列の逆行列を前記2つの行列の逆行列の積によって計算できる。
[第2の実施形態]
前記射影成分行列間の演算には次のような性質がある。
上記の式(6)から、該射影成分行列の行列積は、2つのパラメータs,tを乗算するだけでよく、3行目の要素は各々から1を減算すればよいことが分かる。また、式(7)から、該射影成分行列の逆行列は、2つのパラメータs,tを逆数に変換するだけでよく、3行目の要素は各々から1を減算すればよいことが分かる。
前記射影成分行列間の演算には次のような性質がある。
以上の性質を利用して、本第2の実施形態では射影成分行列に関する演算をまとめて行う。具体的には、各々の画像の特徴点の座標値から、三角形の面積とその比を計算し、パラメータsiとti(i=1,2)を求める。
画像1に対する射影成分行列の逆行列と、画像2に対する射影成分行列のとの積は、画像1のパラメータの逆数を画像2の対応するパラメータに乗算するだけ、言い換えると、画像2のパラメータを画像1の対応するパラメータで割るだけである。この結果を使って、画像2に対するアフィン変換行列との積を計算する。この計算は第1の実施形態で述べたように、式(2)の左辺の行列中の計算式を用いる。そして、アフィン変換の逆行列を計算し、上記結果に乗算する。
次に示す式(8)は、画像1の座標をuv座標、画像2の座標をxy座標として区別し、画像1から画像2へのホモグラフィ行列を4つの行列の積として表し、左3つの行列を統合して1つのホモグラフィ行列の計算式にまとめている。本第2の実施形態では、前述の三角形の面積比を求めた後、該計算式によりホモグラフィ行列を算出する。
本第2の実施形態によれば、画像1から画像2へのホモグラフィ行列を、第1の実施形態より、さらに少ない演算量で計算することができる。
ここで本第2の実施形態における画像1から画像2へのホモグラフィ行列の推定演算処理を、図3に示す処理フローを用いて説明する。
ステップS301にて、画像1の4つの特徴点の座標から3種の三角形の面積を計算し、それらの比から射影成分パラメータs1,t1を算出する。ステップS302にて、画像2の4つの特徴点の座標から3つの種類の三角形の面積を計算し、それらの比から射影成分パラメータs2,t2を算出する。
次に、ステップS303にて、画像1と画像2の射影成分パラメータを統合した射影成分パラメータs=s2/s1,t=t2/t1を計算する。そして、ステップS304にて、前記統合した射影成分パラメータs,tと画像2の特徴点の座標を、式(2)の左辺に代入し、ホモグラフィ行列H2’を算出する。
ステップS305にて、画像1の3つの特徴点の座標からアフィン変換パラメータを抽出し該アフィン変換の逆変換行列Ainvを生成する。そして、ステップS306にて、このアフィン変換の逆変換行列(逆アフィン変換行列)Ainvに、ステップ304で算出したホモグラフィ行列H2’を乗算して、画像1から画像2に対するホモグラフィ行列H21を計算する。
図3の処理フローでは、射影成分パラメータs1,t1,S2,t2を算出した後に統合したが、第1の実施形態で用いた各種三角形の面積表現を用いると、
s2/s1=△Q0Q2Q3×△R1R2R3/(△Q1Q2Q3×△R0R2R3)
t2/t1=△Q1Q2Q0×△R1R2R3/(△Q1Q2Q3×△R1R2R0)
であるため、上記の統合パラメータを三角形の面積から直接計算してもよい。この場合、図3における3つの処理ステップS301,S302,S303は、上記統合パラメータを算出する1つのステップに置き換えられる。
s2/s1=△Q0Q2Q3×△R1R2R3/(△Q1Q2Q3×△R0R2R3)
t2/t1=△Q1Q2Q0×△R1R2R3/(△Q1Q2Q3×△R1R2R0)
であるため、上記の統合パラメータを三角形の面積から直接計算してもよい。この場合、図3における3つの処理ステップS301,S302,S303は、上記統合パラメータを算出する1つのステップに置き換えられる。
[第3の実施形態]
上記では、画像1から画像2に対するホモグラフィ行列H21の算出例を示したが、本第3の実施形態ではn次元空間(nは2、又は3)の空間1から空間2への射影変換行列Pを求める例を示す。
上記では、画像1から画像2に対するホモグラフィ行列H21の算出例を示したが、本第3の実施形態ではn次元空間(nは2、又は3)の空間1から空間2への射影変換行列Pを求める例を示す。
まず、空間1,2とは別の基準空間において原点(0,0,0)及び3つの単位座標(1,0,0),(0,1,0),(0,0,1)を定め、それらに対応付けする空間1(または空間2)の4つの特徴点と座標を次のように表現する。
Q000(x000,y000,z000),
Q100(x100,y100,z100),
Q010(x010,y010,z010),
Q001(x001,y001,z001)
また、5つ目の特徴点と座標を
Q111(x111,y111,z111)
とする。
Q000(x000,y000,z000),
Q100(x100,y100,z100),
Q010(x010,y010,z010),
Q001(x001,y001,z001)
また、5つ目の特徴点と座標を
Q111(x111,y111,z111)
とする。
まず、3次元(n=3であるので、座標軸が3つ)の射影変換行列を3次元アフィン変換行列と射影成分行列に分解した式を、上記対応付けした特徴点座標を用いて表すと、式(9)のようになる。
アフィン変換行列はこの段階で確定するので、後は射影成分行列の3つのパラメータs,t,uを求めれば済む。
該射影成分行列による変換は、前記原点(0,0,0)及び3つの単位座標(1,0,0),(0,1,0),(0,0,1)を保ち、座標(1,1,1)を(s,t,u)/(s+t+u−2)へ移動する。これは該移動した点を頂点とする4種の四面体の体積比がs:t:u:2になるような座標である。分かり易いよう、該座標変換を式(10)に示す。
そして、該移動した座標と前記5つ目の特徴点Q111とを対応づける。3次元アフィン変換は「領域の体積比を保存する」性質があるため、空間1の対応する4種の四面体の体積を算出して、その比をs,t,uに設定する。具体的には次のようにする。
3次元空間上の4点によって定まる四面体の体積の記号を便宜的に△(点列)とし、
v=△(Q100,Q010,Q001,Q111)/2 と置くと、
s=△(Q000,Q010,Q001,Q111)/v,
t=△(Q100,Q000,Q001,Q111)/v,
u=△(Q100,Q010,Q000,Q111)/v,である。
3次元空間上の4点によって定まる四面体の体積の記号を便宜的に△(点列)とし、
v=△(Q100,Q010,Q001,Q111)/2 と置くと、
s=△(Q000,Q010,Q001,Q111)/v,
t=△(Q100,Q000,Q001,Q111)/v,
u=△(Q100,Q010,Q000,Q111)/v,である。
他のパラメータt,uの計算式もほぼ同じ形で容易に類推できるため列記するのを省略する。
空間1の特徴点座標を用いて算出したものをs1,t1,u1とし、空間2の特徴点座標を用いて算出したものをs2,t2,u2とすれば、空間1と空間2を合わせた射影成分パラメータs,t,uは、上記の第2の実施形態で示したように、s=s2/s1,t=t2/t1,u=u2/u1となる。該パラメータs,t,uと空間2の特徴点座標を式(9)の左辺に代入して行列を計算すると、基準空間から空間2への射影変換に空間1の射影成分を取り込んだ、射影変換行列が得られる。後は、空間1のアフィン変換行列の逆行列を計算し、該逆行列を上記射影変換行列に乗算すれば、空間1から空間2への3次元射影変換行列が得られる。
従来は幾何学的な意味の無い演算を数多く行って、3次元の射影変換行列を計算する必要があったが、本実施形態によれば、特徴点の座標情報から体積特徴量を計算して射影成分パラメータを算出し、それと特徴点座標を用いてホモグラフィ行列を計算できる。
本実施形態は3次元空間から3次元空間への射影変換行列を算出するものであるが、空間の次元に応じて基準空間の単位座標と特徴空間の特徴点を追加すれば、4次元以上の空間の射影変換行列の算出にも容易に応用できる。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
501…制御部、502…操作部、503…撮像部、504、507…スイッチ、505、506…フレームバッファ、508…ブレ検出部、509…スキャン部、510…符号化部、511…記録部、512…記憶媒体
Claims (7)
- n(n=2、又は、3)次元の第1の空間の特徴点から第2の空間の特徴点への射影変換行列の推定を行う情報処理装置であって、
前記第1の空間、第2の空間の特徴点座標とは異なる基準座標を設け、当該基準座標の原点と各座標軸の単位座標点で構成されるn+1点から、前記第1の空間に対する第1のアフィン変換パラメータを抽出する手段と、
該アフィン変換パラメータから逆アフィン変換行列を生成する手段と、
該逆アフィン変換行列を他の行列に乗算して、前記射影変換行列を推定する手段と
を有する情報処理装置。 - 前記n次元空間におけるn+2個の特徴点の中のn+1個で形成されるn+1の種類の面積もしくは体積の比から、遠近感に関するn個の射影成分パラメータを算出する手段を有することを特徴とする請求項1に記載の情報処理装置。
- 前記逆アフィン変換行列を乗算する他の行列は、前記射影成分パラメータを行列で表現した射影成分行列、またはホモグラフィ行列であることを特徴とする請求項2に記載の情報処理装置。
- 前記nを2とし、時間的に連続して動画像を構成するフレーム画像を撮像する手段と、請求項1乃至3のいずれか1項に記載の情報処理装置とを含み、時間的に先行して撮像したフレーム画像を前記第1の空間、後続するフレーム画像を前記第2の空間として、前記第1の空間に対する前記第2の空間のブレ量に対応する、ホモグラフィ変換行列を前記射影変換行列として求めることを特徴とするビデオカメラ。
- n(n=2、又は、3)次元の第1の空間の特徴点から第2の空間の特徴点への射影変換行列の推定を行う情報処理装置の制御方法であって、
抽出手段が、前記第1の空間、第2の空間の特徴点座標とは異なる基準座標を設け、当該基準座標の原点と各座標軸の単位座標の点で構成されるn+1点から、前記第1の空間に対する第1のアフィン変換パラメータを抽出する工程と、
生成手段が、該アフィン変換パラメータから逆アフィン変換行列を生成する工程と、
推定手段が、該逆アフィン変換行列を他の行列に乗算して、前記射影変換行列を推定する工程と
を有する情報処理装置の制御方法。 - コンピュータに読み込ませ実行させることで、前記コンピュータに請求項5の方法に記載の各工程を実行させるためのプログラム。
- 請求項6に記載のプログラムを格納したコンピュータが読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014137066A JP2016015037A (ja) | 2014-07-02 | 2014-07-02 | 情報処理装置及びその制御方法、並びに、ビデオカメラ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014137066A JP2016015037A (ja) | 2014-07-02 | 2014-07-02 | 情報処理装置及びその制御方法、並びに、ビデオカメラ |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016015037A true JP2016015037A (ja) | 2016-01-28 |
Family
ID=55231167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014137066A Pending JP2016015037A (ja) | 2014-07-02 | 2014-07-02 | 情報処理装置及びその制御方法、並びに、ビデオカメラ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016015037A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017143351A (ja) * | 2016-02-08 | 2017-08-17 | Kddi株式会社 | カメラのキャリブレーション装置、方法及びプログラム |
CN110070491A (zh) * | 2019-03-16 | 2019-07-30 | 平安城市建设科技(深圳)有限公司 | 银行卡图片矫正方法、装置、设备及存储介质 |
CN110428457A (zh) * | 2019-08-08 | 2019-11-08 | 苏州中科全象智能科技有限公司 | 一种视觉定位中的点集仿射变换算法 |
JP2020107356A (ja) * | 2016-05-20 | 2020-07-09 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | 畳み込み画像変換推定を実行するための方法およびシステム |
CN111461814A (zh) * | 2020-03-11 | 2020-07-28 | 深圳市新镜介网络有限公司 | 虚拟眼镜的试戴方法、终端设备及存储介质 |
CN111657858A (zh) * | 2019-03-07 | 2020-09-15 | 株式会社日立制作所 | 图像诊断装置、图像处理方法和程序 |
-
2014
- 2014-07-02 JP JP2014137066A patent/JP2016015037A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017143351A (ja) * | 2016-02-08 | 2017-08-17 | Kddi株式会社 | カメラのキャリブレーション装置、方法及びプログラム |
JP2020107356A (ja) * | 2016-05-20 | 2020-07-09 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | 畳み込み画像変換推定を実行するための方法およびシステム |
JP7005669B2 (ja) | 2016-05-20 | 2022-01-21 | マジック リープ, インコーポレイテッド | 畳み込み画像変換推定を実行するための方法およびシステム |
US11593654B2 (en) | 2016-05-20 | 2023-02-28 | Magic Leap, Inc. | System for performing convolutional image transformation estimation |
CN111657858A (zh) * | 2019-03-07 | 2020-09-15 | 株式会社日立制作所 | 图像诊断装置、图像处理方法和程序 |
CN111657858B (zh) * | 2019-03-07 | 2023-08-01 | 株式会社日立制作所 | 图像诊断装置、图像处理方法和存储介质 |
CN110070491A (zh) * | 2019-03-16 | 2019-07-30 | 平安城市建设科技(深圳)有限公司 | 银行卡图片矫正方法、装置、设备及存储介质 |
CN110428457A (zh) * | 2019-08-08 | 2019-11-08 | 苏州中科全象智能科技有限公司 | 一种视觉定位中的点集仿射变换算法 |
CN110428457B (zh) * | 2019-08-08 | 2022-02-22 | 苏州中科全象智能科技有限公司 | 一种视觉定位中的点集仿射变换算法 |
CN111461814A (zh) * | 2020-03-11 | 2020-07-28 | 深圳市新镜介网络有限公司 | 虚拟眼镜的试戴方法、终端设备及存储介质 |
CN111461814B (zh) * | 2020-03-11 | 2024-03-26 | 深圳市新镜介网络有限公司 | 虚拟眼镜的试戴方法、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016015037A (ja) | 情報処理装置及びその制御方法、並びに、ビデオカメラ | |
JP5997645B2 (ja) | 画像処理装置及び方法、及び撮像装置 | |
JP4958610B2 (ja) | 画像防振装置、撮像装置及び画像防振方法 | |
JP4839237B2 (ja) | 3次元形状復元方法,3次元形状復元装置,その方法を実装した3次元形状復元プログラム及びそのプログラムを記録した記録媒体 | |
JP6547754B2 (ja) | 三角測量装置、三角測量方法およびそのプログラム | |
TW200937946A (en) | Full-frame video stabilization with a polyline-fitted camcorder path | |
JP6581359B2 (ja) | 情報処理装置及びその制御方法及びプログラム及び記憶媒体、並びに、ビデオカメラ | |
JP6594170B2 (ja) | 画像処理装置、画像処理方法、画像投影システムおよびプログラム | |
WO2012029238A1 (ja) | 画像処理システム、画像処理方法および画像処理プログラム | |
Sadek et al. | A variational model for gradient-based video editing | |
JP6730695B2 (ja) | 特徴追跡及びモデル登録により三次元多視点を再構成するための方法。 | |
KR20220086888A (ko) | 플렌옵틱 영상의 중간시점 영상 생성 시스템 | |
JP2006350562A (ja) | 画像処理装置及び画像処理プログラム | |
JP2019067169A (ja) | 移動ベクトル算出方法、装置、プログラム、及びノイズ除去処理を含む移動ベクトル算出方法 | |
KR101166719B1 (ko) | 평행사변형 기반의 무한 호모그래피 산출 방법과 이를 이용한 건물 구조 복원 방법 | |
JP6632434B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
EP2980752B1 (en) | Image processing device, image processing system, image processing method, and image processing program | |
JP6306952B2 (ja) | 中間視点画像生成装置、中間視点画像生成方法及びコンピュータプログラム | |
JP5937977B2 (ja) | 変換行列推定装置、変換行列推定方法、及びプログラム | |
JP6317180B2 (ja) | 画像生成装置及びプログラム | |
JP6972089B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2017059048A (ja) | 演算装置および演算方法 | |
JP2019517688A (ja) | 二枚の表示画像間の移行を割り出すための方法及び装置、並びに、車両 | |
Aryadarsh et al. | Image completion using Criminisi algorithm | |
JP2018084997A (ja) | 画像処理装置、画像処理方法 |