JPH10302064A - 欠陥データとの線形適合方法、動きから構造への適用方法、強度画像の特徴決定への適用方法および装置 - Google Patents

欠陥データとの線形適合方法、動きから構造への適用方法、強度画像の特徴決定への適用方法および装置

Info

Publication number
JPH10302064A
JPH10302064A JP7580898A JP7580898A JPH10302064A JP H10302064 A JPH10302064 A JP H10302064A JP 7580898 A JP7580898 A JP 7580898A JP 7580898 A JP7580898 A JP 7580898A JP H10302064 A JPH10302064 A JP H10302064A
Authority
JP
Japan
Prior art keywords
matrix
image
column
point
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7580898A
Other languages
English (en)
Inventor
Jacobs David
ジェイコブス デイビット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPH10302064A publication Critical patent/JPH10302064A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 欠陥要素を持つ行列に低階数行列を適合させ
る方法の実現。 【解決手段】 第1段階では、移動カメラを用いて固定
場面の画像のシーケンスを得ることで、動きシーケンス
から点位置からなる第1の行列を構築し、そのシーケン
スから点の素性を確認・追跡し、その素性の座標を用い
て、一部の素性が一部の画像に存在しない一部の欠陥要
素を有する第1の行列を構築する。第2段階では、第1
の行列から列トリプルを選択し、その零空間を第2の行
列とし、第2の行列の3つの最小成分を取ることで、近
似解を得る。第3段階では、その3つの最小成分に反復
アルゴリズムを適用して、第3の行列を構築し、推定を
向上させる。最後に第4段階で、第3の行列を分解し
て、完全な場面構造を求める。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、欠陥データとの線
形適合、動きから構造への適用、および強度画像の特徴
決定への適用に関係する方法および装置に関するもので
ある。
【0002】
【従来の技術】いくつかの映像上の問題は、低次元の線
形表面のデータへの適合の問題に帰することができる。
例えば、トマシら(C.Tomasi et al.(1992) "Shape and
Motion From Image Streams Under Orthography: A Fa
ctorization Method" Int.J.ofComp.Vis. 9(2):137-15
4)は、アフィン作像モデルを仮定して、雑音性画像か
ら構築されるデータ行列に階数3行列を適合させること
によって、2次元画像のシーケンスで追跡される3次元
点集合の構造および動きを求める方法を示している。ベ
ルフメウアらは(Berlhumeur et al.(1996) "What is t
he Set of Imagesof an Object Under All Possible Li
ghting Conditions?" IEEE Conf.of Comp.Vis., and Pa
t.Rec.:270-277)は、やはり雑音性データから構築され
る行列に対して階数3行列を適合させることで、凸面ラ
ンベルト対象が与える強度画像集合の特徴決定方法を示
している。この研究に基づく解法における一つの重大な
問題は、一部欠陥要素を有するデータ行列を扱う方法で
ある。動きから構造への場合、ほとんど不可避で起こる
ことであるが、動きシーケンスを通じて画像で一部の素
性を見ることができない場合、欠陥要素がデータ行列に
生じる。ベルフメウアら(P.Belhumeur et al., 1996)
によって提案された方法に従って強度の複写を構築する
には、一部の場面点の表面法線が一部の画像で光源に対
向しない場合、欠陥行列要素が生じる。それは、平滑な
対象を含む場面について起こるはずであり、ほとんどの
実際の場面で起こる可能性が高い。
【0003】最近、いくつかの重要な映像上の問題が、
それらの問題を、何らかの重要な場面構造を示す低次元
の線形表面もしくはアフィン表面検出の問題に帰するア
フィン作像モデルを用いることで扱われるようになって
いる。例えば、ウルマンら(S.Ullman et al.(1991) "R
ecognition by Linear Combinations of Models" IEEE
Trans. PAMI 13(10):992-1007)およびバスリら(R.Bas
ri et al(1988) "TheAlignment of Objects With Smoot
h Surfaces" Computer Graphics, Vision andImage Pro
cessing: Image Understanding 57(3):331-345)の一次
結合では、各種視点からの3次元構造によって得られる
画像集合が、全ての可能な画像の空間で低次元アフィン
表面と称される。この構造を対象認識に用いる。トマシ
ら(C.Tomasi et al.(1992))は、これに関連する考え
方を用いて、長い動きシーケンスにより動きから構造を
有効に形成している。ノイズのない画像はいずれも低次
元線形表面にあるはずであることから、そのような表面
をデータに適合させて、それを用いて構造と動きを導き
出すことができる。モ−ゼス(Y.Moses (1993) Face re
cognition: generalization to novel images Ph.D.The
sis, Weizmann Institute of Science)およびシャシュ
ア(A.Shashua (1992) Geometry and Photometry in 3D
Visual Recognition MIT TR-1401)は、単一の視点か
らであるが、点光源の位置および強度を変えながらの3
次元ランベルト構造によって得られる強度画像集合も、
可能な画像の空間における3次元線形表面として説明で
きることを示している。これらは、可能な画像の空間に
3次元線形表面を形成する(強度複写)。ベルフメウア
らは(P.Belhumeur et al. (1996))、この結果を用い
て、凸形状対象が与え得る強度画像の集合について説明
し、複数光源と自己付影を可能としている。この研究の
いずれにおいても、妥当な仮定集合を見いだし、それを
線形とすることで、問題はかなり単純化される。
【0004】
【発明が解決しようとする課題】これらの方法はいずれ
も、データ集合に対して低階数rの行列を適合させる必
要がある。この行列によって囲まれる線形空間は場面構
造に相当する。いくつかのアプローチではそれは、ノイ
ズの存在下であっても正確に階数rを有するr×nの行
列を構成する必要がある最小量のデータのみを獲得する
ことで行われる(S.Ullmanら(1991), Y.Moses (1993),
A.Shashua (1992)およびP.Belhumeurら(1996)参照)。
この方法は簡単であるが、ノイズに対して非常に敏感で
あり得る。ウルマンら(Ullman et al.(1991))も、特
異値分解(SVD)を用いて、追加画像を用いて問題を
過度に決定する場合に作られる比較的大きな行列に低階
数行列を適合させる方法を提案している。トマシら(C.
Tomasi et al.(1992))は、長い動きシーケンスを用い
て、大きな行列を作り、次にSVDを用いて最も近い低
階数行列を見いだしている。この方法は、新たな行列に
おける各要素とデータ行列の間の差の2乗の合計を最小
とする低階数行列を見いだすものである。問題を過度に
決定し、そのデータに対する最小二乗適合を見いだすこ
とで、この方法はノイズの影響を低減することができ
る。
【0005】これらの方法で重要となる制限は、それら
が欠陥要素のないデータ行列を必要とすることである。
動きから構造の場合、それは、各点素性があらゆる画像
で見ることができなければならないことを意味してい
る。多くの場合、点は動きシーケンス時に視野から出入
りするか、あるいはシーケンス途中で他の対象によって
視界から遮断されることから、これは厳しい仮定であ
る。ある場面によって得られる強度複写を導く方法は、
各画像における照明が単一の点光源から来る画像集合を
用いるものである。場面の点が光源によって照明されな
い場合、そのデータ行列は欠陥要素を持つことになる。
従ってこれらの方法では、あらゆる目視可能な場面点を
あらゆる画像で照射する必要がある。しかしながら、滑
らかな対象がある場面では、その仮定は、光源の方向が
目視方向と同じ場合に限って満足される。すなわち、1
個の画像が可能である。より一般的には、光源が目視方
向近くにある場合にのみ、ほとんどの可視点が照射され
る。しかしながら、画像が類似の光源方向で得られた場
合は、得られる解は不安定になり得る。
【0006】トマシら(C.Tomasi et al.(1992))は、
欠陥要素を有する行列の簡単な発見的適合方法について
説明している。シュームらは(H.Shum et al.(1995) "P
rincipal Component Analysis With Missing Data and
Its Applications to Polyhedral Object Modeling" IE
EE Trans.PAMI 17(9):854-867)は、ワイバーグによる
反復法(T.Wiberg (1976) "Computation of Principal
Components When DataAre Missing" Proc.Second.Symp.
Computational Statistics:229-236)を関係する動き
から構造問題に適用している。この方法は、適合させた
低階数行列とデータ行列では欠落していない要素との間
の差の2乗の合計を最小とするものである。このアプロ
ーチは、局所的に最適解に収斂するという利点を持って
いる。しかしながら、全体的に最適なものが見いだされ
ることを保証するものではない。この反復法には利点が
あるが、それが良好な開始点を持たない場合は、誤った
答えに収斂する場合が多い。
【0007】ウルマンら(S.Ullman et al (1991))お
よびトマシら(C.Tomasi et al.(1992))によって提案
された方法は、一致した像点のシーケンスが与えられ、
それが、アフィンであるかアフィンの部分集合(例:R.
Basri (1996) "Paraperspective Affine" Int.J. of C
omp.Vis. 19(2):169-179に記載されているような弱い正
射遠近またはparaperspective)であるカメラモデルを
用いて3次元から2次元に投影されたものと仮定するも
のである。多数の点の中心の移動を推定することで、動
きの移動成分が別個に計算されることから、我々は単純
化のために、面内移動がないと仮定する。pi=(xi
i,ziTをi番目の3次元点素性とする。次に、画像
変換に対するモデルは2×3行列Siと書くことができ
る。piによって与えられる像点をqi=(Xi,Yi)で
表すと、以下のようになる。
【0008】
【数16】 正投影の場合、Siは回転行列の最初の2行である。
【0009】そこで我々は、簡単な行列表記で画像シー
ケンス全体を表わすことができる。i番目の列がpiであ
る行列をPとすると、以下のようになる。
【0010】
【数17】 全ての変換Siの全ての行を含む行列をTで表すと、T
の2i−1行がSiの最初の列であり、Tの2i行がその
次の列である。
【0011】
【数18】 最後に、全ての追跡画像点を含む単一の行列を
【0012】
【数19】 で表す。
【0013】
【数20】 の各列には、単一の点の全ての画像座標がある。すなわ
ち、
【0014】
【数21】 は画像iにおけるqjのx座標を与え、
【0015】
【数22】 は画像iにおけるqjのy座標を与える。そして、次のよ
うに書ける。
【0016】
【数23】 式中、
【0017】
【数24】 は、i番目の画像におけるj番目の雑音性像点のX座標
であり、
【0018】
【数25】 も同様に定義される。
【0019】
【数26】 と同じ次元の数列であって、その要素が
【0020】
【数27】 の相当する要素を感知する上で遭遇したノイズを示すも
のをEとする。そうすると、画像シーケンス全体の形成
を次のように簡単に記述することができる。
【0021】
【数28】 さらに、次のように定義する。
【0022】
【数29】 誤差のないデータQに直接アクセスしないが、
【0023】
【数30】 からそれを推定したい。Tは3つの列(以下列トリプル
もしくは端にトリプルという)を持つことから、階数3
のみを持つことができ、結果的にQは階数3のみを持つ
ことができる(すなわち、点群と見なされるQの列また
は行は、Rmの3次元線形部分空間(Rn)以下を占める
に違いない。いずれの列または行も、他の3つの一次独
立列もしくは行の一次結合である。)。
【0024】感知される像点の座標を含む行列
【0025】
【数31】 は、Qの雑音性のものであり、最大階数を有する。しか
しながら、
【0026】
【数32】 に最も近い階数3のQ行列を見いだせば、Qの最優推定
を行うことができる。詳細には、SVDを用いて、
【0027】
【数33】 を最小とするQ行列を見いだすことができる。さらに、
SVDを用いてこのQ行列をTとPに分解して、アフィ
ン変換まで、3次元点の構造および動きの推定を行うこ
とができる(詳細については、C.Tomasi et al.(1992)
参照)。
【0028】一部の画像で一部の点を見ることができな
い場合、
【0029】
【数34】 はそれらの点についての欠落記述項を含むことになる。
さらに、全て見ることができたとしても、誤差のないデ
ータが3階数のQ行列を生じる可能性のあることがわか
っている(さらに、隣接する画像にある点群の中心の移
動を計算することで、データからの隣接する画像間の移
動の効果を排除することができる。そのためには、一部
の点がある画像から次の画像に常に存在すると仮定する
のみでよい。)。従って、現在
【0030】
【数35】 に実際に存在する要素のみとQの相当する要素とを比較
する
【0031】
【数36】 に最も近いQ行列を見いだすことで、誤差を低減するア
フィン構造および動きを見いだすことができる。そこ
で、欠落データの存在下に動きから構造を見いだす上で
の問題は、欠落要素を有するデータ行列に最も近い3階
数行列を見いだすか否かによって決まる。
【0032】シャシュア(A.Shashua, 1992)、モーゼ
ス(Y.Moses, 1993)およびベルフメウアら(P.Belhume
ur et al., 1996)が同様の式を用いて、無限遠の点光
源に露光された3次元ランベルト構造によって形成され
る強度画像集合について説明している。その強度によっ
て計算される光源の方向を3次元ベクトル−hとする。
その場合、qjを画像画素jの強度とする。最後に、こ
の強度が、表面法線njおよびアルベドpjを有する場面
の3次元面状部分によって得られるものであると仮定す
る。そうすると、強度が下記式によって得られる。qj
=h・pjjただしこれは、正の値を提供するものであ
る(すなわち、各表面放線が光源に向かっている)。こ
れらの式から、hやpjの絶対値を知ることはできない
ことから、pjjが単に無制約3次元ベクトルである
と、一般性を失うことなく仮定することができる(すな
わち、反射率が1未満であるという制約は、ほとんど制
限なく、hのスケールに対して影響がない)。次に、視
点が固定されているが、照明の強度および方向が可変で
ある画像集合を考える。j番目の列がpである場
面行列をNとする。i番目の行がi番目の画像についての
hベクトルである照明行列をHとする。さらに、j番目
の列が各画像においてj番目の画素の強度を与えるデー
タ行列を
【0033】
【数37】 とする。そうすると、次の式が成り立つ。
【0034】
【数38】 式中、Eはやはり、感知誤差の行列である。やはりQは
3階数を有する。やはり、我々の雑音性画像は、最大階
数行列
【0035】
【数39】 を提供するものであり、やはり、SVDを用いて
【0036】
【数40】 からQ、HおよびNを推定して、
【0037】
【数41】 に最も近い3階数行列とそれの分解とを求めることがで
きる。既報の研究で、シャシュア(A.Shashua, 1992)
およびベルフメウアら(P.Belhumeur et al., 1996)
は、3つの画像のみを用いる比較的簡単であるが確実性
の低い方法を用いて
【0038】
【数42】 を形成しており、その場合、
【0039】
【数43】 は3階数のみを持ち、Qの最良の推定行列である。シャ
シュア(1992)は、行列Nを用いて、新たな画像がNの
行の一次結合であるか否かを求めることで、その新たな
画像が同じ場面によって形成され得るか否かを確認して
いる。
【0040】この問題では、場面表面の法線が光源に向
かっていない場合に、
【0041】
【数44】 は欠陥要素を持つ。h・pjjが負の場合、その場面点
は自己付影され、我々はゼロ強度とノイズを知覚し、負
の強度は知覚しない。場面点が暗いことから、それが光
源に向いていないと言うことができるが、その方向性に
ついてのそれ以上のデータは得られない。ベルフメウア
ら(1996)はNを用いて、場面が作り出すことができ
て、その自己付影効果を可能とする画像集合について説
明するより複雑な照明円錐形を求めているが、自己付影
のない画像を用いてNをやはり構築しなければならな
い。しかしながら、自己付影を持たない多くの画像を得
ることができれば、欠陥要素を持った
【0042】
【数45】 行列を構築することができる。やはり、対象の量を推定
する上での重要な問題は、欠陥要素を有する行列に対す
る最適な3階数近似を見いだすということである。
【0043】トマシら(1992)は、欠落データを有する
行列に対する最適な3階数近似を見いだす方法を提案し
ている。その方法では最初に、欠落データを持たない行
列の直交する部分集合の位置を決定する。SVDを用い
て、この小行列に対する最適な3階数近似を見いだす。
次に、別の列(または行)の非欠陥要素に最も良く適合
する小行列の列(または行)についての基底の一次結合
を見いだすことで、その列(または行)の欠陥要素を満
たす。このようにして、その解は、同時に一つの列(ま
たは行)に反復して拡張される。次に、最急降下最小化
を用いて得られた解を最適化して、
【0044】
【数46】 行列に存在する全てのデータに最も近い3階数行列を見
いだす。
【0045】過剰制限データを用いて欠陥データを満た
していることから、この解法はかなり発見的であるよう
に思われ、トマシら(1992)は、2つの動きシーケンス
に対するその有効性を示している。しかしながら、欠陥
行列要素を最初に満たす提案の方法はいくつかの欠点を
有する可能性がある。第1に、欠陥要素を有する行列の
最大の完全小行列を見いだす上での問題はNP完全問題
であることから(最大クリークは容易にこの問題に帰す
ることができる)、発見的手法を用いて開始点を見いだ
さなければならない。第2に、データが対称に使用され
ない。データの小さい部分集合を用いて、最初の欠陥要
素を計算する場合があり、それによってこれらの要素に
おいてかなりの不正確さが生じる可能性がある。その不
正確さが別の欠陥要素の計算にどのように拡大するかに
ついては明らかではない。第3に、m×n行列の場合、
その方法はSVDのO(最大(m,n))適用を必要と
する。最後に、最急降下の最終適用により、その方法が
全体的に最適な解に収束するか否かは不明である。
【0046】シュムら(H.Shum et al.(1995))も最
近、欠落データ問題に関係する研究を行っている。彼ら
は、有意性を加重することができる3次元データに基づ
いて構造および動きを誘導する方法の問題を検討し、低
階数行列をデータ行列に適合する上での加重最小自乗問
題に到達している。この問題について彼らは、ワイベル
グ(T.Wiberg, 1976)の報告に記載の知見による反復法
の使用を提案している。この反復法は明らかに、この論
文で検討されている欠陥データ問題にも適用することが
できる。この方法は、最急降下アプローチより良好な収
束性を持つように思われ、我々の実験ではそれを用いて
いる。この方法については、シュムらの報告(H.Shum e
t al., 1995)に詳細に記載されている。しかしなが
ら、我々の実験ではこの方法を用いることから、完全を
期すため、その記載についてここで概要を説明する。こ
こではその方法は、最小自乗問題の双線形最適化として
公式化し、次に一つの変数集合を一定としながら他の変
数を最適化する方法を反復して、各最適化を線形とする
方法として説明する。
【0047】詳細には、最初に、欠陥要素を持たない雑
音性
【0048】
【数47】 行列からQ=TPを計算したいとする。その式中、Qは
階数rのm×n行列であり、Tはm×rであり、Pはr
×nである。TおよびPの推定値を帰納的に改訂し、T
iおよびPiを各値についての我々のi番目の推定値と称
する。最初に、ある種の初期推定を用いて、Tiを固定
する。次に、最小自乗法の意味でTii
【0049】
【数48】 に最も近くなるようなPiを求めたい。これこそが、過
剰制限線形予測問題であり、それは以下のようにして解
決することができる。
【0050】
【数49】 式中、Ti はTiの擬逆行列である。次にPiを固定し
て、次の計算を行う。
【0051】
【数50】 明らかに、これによって一連の推定値Q、TおよびPが
得られ、その場合の
【0052】
【数51】 の大きさは増加しない。
【0053】わずかに変更を加えることで、
【0054】
【数52】 が欠陥要素を持つ場合に、その同じアルゴリズムを適用
することができる。それを行うため、Q=TPを以下の
ように書き換えることができる。
【0055】
【数53】 式中、QおよびPはベクトルとして記載されており、T
は大きいブロック対角行列として記載されており、Tは
n回繰り返されている。やはり、Tを固定し、それのブ
ロック対角行列の擬逆行列に
【0056】
【数54】 から構築されるベクトルを掛けることで、同じ方法を適
用することができる。それによって、Pの新しい推定値
が得られる。その反復法の第2の部分は、Tを簡単にベ
クトルとして書き、Pの同様のブロック対角行列を構築
することで行うことができる。
【0057】そこで、
【0058】
【数55】 が欠陥要素を持つ場合に、この方法を容易に修正するこ
とができる。
【0059】
【数56】 の欠陥要素に相当するベクトルおよびブロック対角行列
の全ての行を削除し、その方法を前述のように行う。各
ブロックの擬逆関数は別個に得ることができることか
ら、そのブロック対角行列の擬逆行列を得ることはあま
り経費を要しないことは留意すべき点である。
【0060】従って本発明の目的は、その問題の幾何学
的構造に対する新たな洞察に基づいて、欠陥要素を持つ
行列に対して低階数行列を適合させる新規な方法を提供
することにある。我々の方法は、いくつかの望ましい性
質を有する。ノイズがない場合には、我々の方法は正確
な答えを正しく与えるか、あるいは悪化している場合は
それによって回答が得られないことを示すことができ
る。さらに、それは、完全に占有された行列の部分集合
に依存するのではなく、全てのデータを利用できる。我
々は実験的に、我々の方法がノイズの存在下に良好な結
果を与えることを示している。これらの結果は、直接使
用することができるか、あるいは反復方法の優れた開始
点として役立ち得るものである。同時に我々は、良好な
開始点なしで、反復方法で極小が追求される場合が多い
ことを示している。
【0061】従って、いくつかの欠陥要素を有するデー
タ行列に低階数行列を適合させることで、より信頼性が
高く一般的な解を得ることができる。それにより、動き
から構造のアルゴリズムで、一部の画像で見ることがで
きない追跡場面点を用いることができ、場面が部分的に
しか照明されていない多くの画像から場面の強度を構築
することができる。
【0062】
【課題を解決するための手段】我々は、欠陥要素を有す
る行列に低階数行列を適合させる新規な方法を提供し、
それを動きから構造問題と強度画像説明の問題の両方に
適用する方法を示す。我々の方法は、異なっているが関
係の深い関数型の最小化の問題に対する直接の解法に基
づいたものである。
【0063】この方法は、いくつかの望ましい性質を持
っている。第1に我々は、ノイズがない場合、我々の方
法は正確な答えを正しく与えるか、あるいは悪化してい
る場合はそれによって回答が得られないことを示すこと
ができる。すなわち、適合行列が全ての非欠陥要素にお
いてデータ行列と完全に一致する場合、我々が最小化を
行う誤差関数型もゼロである。第2に、我々の方法は反
復法ではない。第3に、それは、完全に占有された行列
の部分集合に依存せずに、全てのデータを利用すること
ができる。我々は実験的に、我々の方法がノイズの存在
下に正確な結果を与えることを示している。これらの結
果は、直接使用することができるか、あるいは反復解法
の優れた開始点として役立ち得るものである。
【0064】従って、欠陥データを有する行列に低階数
行列を適合させる新たなアルゴリズムが提供される。行
列間の差の2乗の合計を最適化するための反復法に代え
て、我々は、線形代数の標準的な手段、特にはSVDを
直接用いて最適化することができる新たなコスト関数を
示すものである。その新たなコスト関数は発見的である
が、それが行列の差の2乗の合計と密接な関係を持つこ
とを我々は示す。我々の説明は3つの部分からなる。第
1に我々は、誤差のない場合のみを考えて、そのアルゴ
リズムの背景となる幾何学的直観について説明する。次
に我々は、感知誤差を考慮した基本的アルゴリズムにつ
いて説明する。最後に我々は、今後の改良についての提
言とともに、さらにそのアルゴリズムを強固なものとす
る多くの発見的改良について説明する。
【0065】さらに、不完全なデータを提供するビデオ
シーケンスから完全な場面構造を得る方法も提供され
る。
【0066】その方法の第1段階では、移動カメラを用
いて固定場面の画像のシーケンスを得ることで、動きシ
ーケンスから点位置からなる第1の行列を構築し、その
シーケンスから点の素性を確認・追跡し、その素性の座
標を用いて、一部の素性が一部の画像に存在しない一部
の欠陥要素を有する第1の行列を構築する。第2段階で
は、第1の行列から列のトリプルを選択し、その零空間
を第2の行列とし、第2の行列の3つの最小成分を取る
ことで、近似解を得る。第3段階では、その3つの最小
成分に反復アルゴリズムを適用して、第3の行列を構築
し、推定を向上させる。最後に第4段階で、第3の行列
を分解して、完全な場面構造を求める。
【0067】別の実施態様では、不完全データを提供す
るビデオシーケンスから完全な場面構造を得る方法が提
供される。その方法の第1段階では、それぞれ異なった
点光源を用いて固定場面の一連の画像を得て、付影また
は反射のために信頼性のないデータを与える各画像中の
点を確認し、データの信頼性がない欠陥要素を有する強
度値の第1の行列を構築することで、複数画像からの強
度値からなる第1の行列を構築する。第2段階では、第
1の行列から列のトリプルを選択し、その零空間を第2
の行列とし、第2の行列の3つの最小成分を取ることで
近似解を得る。第3段階では、その3つの最小成分に反
復アルゴリズムを適用して、第3の行列を構築し、推定
を向上させる。最後に第4段階で、第3の行列を分解し
て、完全な場面構造を求める。
【0068】本発明の別の態様は、不完全なデータを与
えるビデオシーケンスから完全な場面構造を与える装置
である。その装置は、固定場面の画像シーケンスを得る
ためのカメラと、そのシーケンスから点素性を確認、追
跡する手段と、動きシーケンスから点位置からなる第1
の行列を構築し、一部の素性が一部の画像で存在しない
素性の座標を用いて一部の欠陥要素を有する第1の行列
を構築し、1)第1の行列から列のトリプルを選択する
段階、2)その零空間から第2の行列を得る段階、3)
第2の行列の3つの最小の成分を得る段階、4)その3
つの最小成分に反復アルゴリズムを適用して第3の行列
の構築および推定の向上を行う段階、5)第3の行列を
分解して完全な場面構造を求める段階を有する近似解の
構築を行う計算手段を有してなる。好ましい実施態様で
は、計算手段はパーソナルコンピュータである。
【0069】別の実施態様では、不完全データを提供す
るビデオシーケンスから完全な場面構造を得る装置が提
供される。その装置は、固定場面の一連の画像を得るた
めの複数の異なる点光源と、ならびに複数の画像からの
強度値からなる第1の行列を構築し、付影または反射の
ために信頼性のないデータを提供する各画像中の点を確
認し、データの信頼性がない欠陥データを有する強度値
の第1の行列を構築し、1)第1の行列から列トリプル
を選択する段階、2)その零空間から第2の行列を得る
段階、3)第2の行列の3つの最小の成分を得る段階、
4)その3つの最小成分に反復アルゴリズムを適用して
第3の行列の構築および推定の向上を行う段階、5)第
3の行列を分解して完全な場面構造を求める段階を有す
る近似解の構築を行う計算手段を有してなる。好ましい
実施態様では、計算手段はパーソナルコンピュータであ
る。
【0070】
【発明の実施の形態】本発明の装置および方法について
のこれらおよび他の特徴、態様および利点に関しては、
以下の説明、添付の特許請求の範囲、ならびに添付の図
面を参照することで理解を深めることができる。
【0071】図1には、実際の動きシーケンスの1フレ
ームを示してある。
【0072】図2(a),(b)には、2つの比較法に
よる、5つの解法の平均誤差を示してある。各点は、1
00回の試験で平均した、データと3階数適合との間の
誤差の2乗の合計を示してある。平均誤差を、ある点が
入っているフレームの平均部分fに対してプロットして
ある。適合と比較するデータが相対的に少ないことか
ら、誤差を(1−f)で割ることで、誤差低減の合計を
補正する。図2(a)のプロットの対数目盛のプロット
には、4つの解法を示してある。図2(b)では、誤差
がかなり少ない均等目盛法でプロットしている。比較の
ため、両方のプロットでGT−ITを示している。
【0073】図3は、最適な利用可能解に収斂する反復
法の回数の割合を示している。
【0074】図4は、100回の平均での、欠陥データ
を有する強度画像に3階数行列に適合させる実験で得ら
れた平均残留誤差を示したものである。
【0075】図5は、反復法が強度画像についての最適
利用可能解に収斂する頻度を示したものである。
【0076】図6(a),(b)のそれぞれは、図2
(a),(b)に示したような実際の動きシーケンスに
ついての平均誤差を示したものである。
【0077】図7は、最適な利用可能解に収斂する反復
法の回数の割合を示している。
【0078】図8は、本発明の方法を実行する装置を示
したものである。
【0079】図9は、本発明の別の方法を実行する別の
装置を示したものである。
【0080】我々の問題の幾何学的直観を得るには、
【0081】
【数57】 の各列を、m次元空間における点の座標を与えるものと
見ることが役立つ。この考え方で、この行列が欠陥要素
を持たない場合に、トマシら(C.Tomasi et al.,1992)
またはウルマンら(S.Ullman et al, 1991)がSVDを
用いて、
【0082】
【数58】 におけるm次元点に「最も近い」3次元線形副空間Lを
見いだしている。Lは、それがこれらの点に対する距離
の2乗の合計を最小とするという点で、これらの点に最
も近い。同時にSVDは、
【0083】
【数59】 で相当する点に最も近いLにおける各点を見いだすこと
で、Qの列を構築する。
【0084】
【数60】 が欠陥要素を有する場合、これらの要素を満たして、モ
デルとデータの間の適合を改善することができる。欠陥
要素を有する
【0085】
【数61】 の列は、一部未知の座標を有する点である。すなわちそ
れは、m次元空間におけるアフィン副空間である(そし
て、この空間の軸に対して平行である。)。この場合の
我々の問題は、互いの距離の2乗の合計によって求めら
れる、これらアフィン空間に最も近い3次元線形副空間
Lを見いだすことである。Qおよび
【0086】
【数62】 の欠陥要素は、Qの各列を
【0087】
【数63】 の相当する列によって表されるアフィン空間に最も近い
Lでの点に割り付けることで見いだすことができ、Qの
この列の欠陥要素は、Lに最も近いこのアフィン副空間
でその点を取ることで満たすことができる。
【0088】ここで我々は、感知誤差がない場合(例:
【0089】
【数64】 が、欠陥要素以外はQと同一である場合)に適切なアル
ゴリズムを構築する方法を示し、次に、そのアルゴリズ
ムに変更を加えて、誤差を考慮する方法について説明す
る。ノイズがない場合、Lは
【0090】
【数65】 の列によって記述されるアフィン空間全てと交差する。
交差しないこれらのアフィン副空間の3つをA1、A2
3と称する。空間が交差しないというこの仮定は実際
には意味がないことに留意すべきである。アフィン空間
は座標軸に対して平行であることから、2つの空間は、
全ての行についてそれらが同じ値を持つか、あるいは一
方が欠陥値を持つ場合にのみ交差する。そのようなトリ
プルは、上述のアルゴリズムでは容易に捨てられる。L
はそれらのアフィン空間それぞれと共通の原点以外の特
有の点を有することから、Lはこれら3つの空間におけ
る点によって囲まれた空間内にあるに違いない。従っ
て、
【0091】
【数66】 の列の各トリプルは、LをRmの何らかの線形副空間に
制限する。この制限の意義は、これら列における欠陥要
素の数によって決まる。列が欠陥要素を持たない場合、
それらは正確にLを規定するものである。別法として、
列が多くの欠陥要素を有する場合、それらが生じるアフ
ィン空間は、高次元のものであり、非常に高次元の空間
を囲むと考えられる。この場合、Lがその空間にあると
いう制限は弱い制限である。
【0092】トリプルから生じる線形空間の交差部を取
ることで、
【0093】
【数67】 の列の多くの異なるトリプルに由来する制限を組み合わ
せることができる。具体的には、
【0094】
【数68】 の列に相当するアフィン空間の何らかのトリプル集合を
Tとし、アフィン空間A 1、A2、A3における点によっ
て囲まれる線形空間をスパン(span)(A1、A2
3)とすると、次のようになる。
【0095】
【数69】 この場合部分集合を得ているのであって、同等の関係で
はないことに留意する。それはすなわち、
【0096】
【数70】 が3次元である場合に、Lは正確にわかるが、その交差
部がそれより高次元である場合、正確にはわからないと
いうことである。さらに、Qの階数が不明確である場合
には、
【0097】
【数71】 はその階数のより上の界を与えるものである。実際に
は、我々のシミュレーションは、誤差のない場合に、か
なりの量の欠陥データについて、
【0098】
【数72】 の列の可能なトリプルの小さい部分集合のみのサンプリ
ングを行うことで、Qを個別的かつ正確に決定すること
ができる。
【0099】実際のアルゴリズムでは、感知誤差の可能
性を考慮しなければならない。誤差があると、各列に関
連するアフィン空間を横切ることで、我々のデータと完
全に一致し得る線形副空間がないことから、
【0100】
【数73】 は直ちに空となる。そこでその場合、この交差部にでき
るだけ近くなる線形副空間を計算する。
【0101】最初に、
【0102】
【数74】 の列のlトリプルを選択する。この時点では、単にこれ
らを無作為に選択している。列のi番目のトリプルによ
って囲まれる線形空間をSiとする。これらの空間の交
差部を取る簡便な方法は、その補空間のスパンの余集合
を取るものである。Siの零空間をNiと称する。次に、
誤差のない場合に、
【0103】
【数75】 を得る。下記の行列の零空間を取ることで、
【0104】
【数76】 を計算することができる。
【0105】N=[N12…Nl] 感知誤差の存在下に、行列Nは最大階数を有するのが普
通であり、その零空間は空である。その場合、その零空
間に近い3次元線形空間、すなわち少量のノイズを考慮
することで、零空間に最も容易に形成される空間を見い
だしたい。それは、NのSVDを取り、その4つの最下
位成分を見いだすことが行われる。それにより、Nによ
って囲まれる空間に対して最も直交に近い3次元線形副
空間としてLの推定を行うことができる。
【0106】NのSVDの3つの最下位成分は、Lを囲
む3つの正規直交列としてLを表すものである。次に、
それらを用いてQを制限する。
【0107】
【数77】 の各列について、欠落していない要素と最も適合するL
を表す列の一次結合を見いだす。具体的には、Lを3つ
の正規直交性列によって表し、
【0108】
【数78】 の列を
【0109】
【数79】 で表し、
【0110】
【数80】 の非欠陥要素の指数をpとし、
【0111】
【数81】 の非欠陥要素のみを取ることで得られる列を
【0112】
【数82】 とし、同様にpの指数を有する行からなるLの小行列を
pとする。そうすると、次のように計算される。
【0113】
【数83】 式中、(Lp+はLpの擬逆行列である。
【0114】ここで、このアルゴリズムを実行する上で
重要ないくつかの詳細について説明する。第1に、3つ
のアフィン空間によって囲まれる空間の零空間を計算す
る方法について説明する。3つのアフィン空間Ai
j、Akを生じる
【0115】
【数84】 の列トリプルをCi、Cj、Ckとする。Ci、Cjまたは
kのいずれの行が一つの要素を欠落している場合、そ
の行はスパン(Ai、Aj、Ak)の零空間の全ての要素
について零値を持つことに注目する。従って、その零空
間を計算するには、完全に占有されて、零空間の残りの
行に全て零が入った[Cijk]の小行列の零空間を
見いだす必要があるのみである。
【0116】第2に、スパン(Ai、Aj、Ak)の零空
間は、数値的不安定さのために、Lに対する正確な制限
ではない。簡単な例として、Ai、Aj、Akが、その原
点とともに、ほとんど何らかの2次元平面Pにある3つ
の点であると仮定する。そうすると、そのスパンは3次
元であり、感知誤差がない場合には、Lを正確に規定す
ると考えられる。しかしながら実際には、Pを含む3次
元線形副空間は、3点全ての近くにあり、ノイズが加わ
ると、そのスパンは、Pを含むかなり任意の3次元線形
副空間である。従って、Lがそのスパンにあると間違っ
て予想されるものと考えられる。しかしながらこの状況
は、容易に検出される。我々は、完全に占有された[C
ijk]の小行列に対してSVDを適用することで、
零空間を計算する。この小行列が最大階数でないかある
いはほとんど最大階数でない場合、それに由来する制限
が信頼性のないものであることがわかっている。
【0117】第3に、我々はNを計算するのに用いた列
トリプルの数にlという閾値を設定しているが、これら
3つのそれぞれがどれだけの数の列を与えるかは事前に
はわからない。従って、必要なNの列数に対して最大値
も設定し、l個のトリプルをチェックしていなかったと
しても、その値に達した時に、列トリプルの形成を停止
する。
【0118】第4に、式2は部分集合の関係に過ぎない
ことから、得られた列トリプルが、正確にLを決定でき
るだけそれを制限しない可能性が常にある。Lは、その
3つの最小特異値に基づいて、Nの3つの最下位成分を
取ることで計算されることに再度留意する。Nの第4の
最小特異値も非常に小さい場合、Lについての計算が信
頼性のないものであることがわかっている。その場合は
単に、アルゴリズムによって答えが得られなかったと報
告される。ただし、lについてのさらに大きい値または
列トリプルの別の無作為選抜によって、より多くのデー
タが得られる可能性を期待して、計算を再度行う場合も
考えられる。
【0119】第5に、
【0120】
【数85】 の全ての列および行を求めることができるだけのデータ
をNが直接含まない可能性がある。例えば、選択される
列の全てのトリプルがNのある行において1以上の欠陥
要素を有している場合、その行は全て零からなる。その
場合、計算している零空間におけるその行の値について
のデータを集めたことになる。さらに、前述のように、
(Lp)が最大階数を持たず、その擬逆行列を得ること
ができないことから、LによってQiを推定することは
できない可能性がある。それらの状況のいずれにおいて
も、単純に、データを持っているQの最大亜矩形(subr
ectangle)を計算し、その亜矩形を拡大して、完全矩形
の最小自乗計算を行う。
【0121】図8について説明すると、参照符号800
によって表される本発明の装置を図示してある。図8
は、不完全なデータを提供するビデオシーケンスから完
全な場面構造を形成する装置800が図示してあり、図
中、装置800は固定場面810の画像シーケンスを得
るためのカメラ820を有している。さらに、シーケン
スを介して点素性を確認・追跡する確認・追跡手段83
0が提供されている。好ましくは、確認・追跡手段83
0は、トマシら(C.Tomasi and T.Kanabe, "Detection
and Tracking of Point Features," Carbegie-Mellon T
ech.Report CMU-CS-91-132, 1991)およびコックスら
(I.Cox and S.Hingorani, "An Efficient Implementat
ion of Reid's Multiple Hypothesis Tracking Algorit
hm and its Evaluation for the Purpose of Visual Tr
acking," IEEE Trans on PAMI, vol.18, no.2, pp.138-
150, Feb.1996)の報告に記載の方法などの当業界で公
知のアルゴリズムである。
【0122】装置800にはさらに、動きシーケンスか
ら点位置からなる第1の行列を構築し、一部の素性が一
部の画像で存在しない素性の座標を用いて一部の欠陥要
素を有する第1の行列を構築し、1)第1の行列から列
のトリプルを選択する段階、2)その零空間から第2の
行列を得る段階、3)第2の行列の3つの最小の成分を
得る段階、4)その3つの最小成分に反復アルゴリズム
を適用して第3の行列の構築および推定の向上を行う段
階、5)第3の行列を分解して完全な場面構造を求める
段階を有してなる近似解の構築を行う計算手段が与えら
れている。計算手段840は好ましくは、パーソナルコ
ンピュータである。
【0123】図9について説明すると、参照符号900
で表される本発明の別の装置が図示してある。図9は、
不完全なデータを提供するビデオシーケンスから完全な
場面構造を形成する装置900が図示してある。この装
置900は、固定場面810の一連の画像を得るための
独立の複数の点光源910を有してなる。
【0124】装置900にはさらに、複数の画像からの
強度値からなる第1の行列を構築し、付影または反射の
ために信頼性のないデータを提供する各画像中の点を確
認し、データの信頼性がない欠陥データを有する強度値
の第1の行列を構築し、1)第1の行列から列トリプル
を選択する段階、2)その零空間から第2の行列を得る
段階、3)第2の行列の3つの最小の成分を得る段階、
4)その3つの最小成分に反復アルゴリズムを適用して
第3の行列の構築および推定の向上を行う段階、5)第
3の行列を分解して完全な場面構造を求める段階を有し
てなる近似解の構築を行う計算手段がある。計算手段は
好ましくは、パーソナルコンピュータである。
【0125】
【実施例】この項では、本発明の方法の正確さを調べる
ための実験について説明する。本発明の方法および従来
の方法は、データ行列に存在する要素と新たな3階数行
列の相当する要素の間の差の2乗の合計を最小化すると
いう同じ問題処方を検討するものである。従って、方法
によって階数3行列を見いだして、その誤差測定を低減
することにどの程度奏功するかに基づいて、それらの方
法を評価する。独立のガウス雑音がデータの信頼性を低
下させる場合に、この誤差測定は最適であり、欠陥要素
の値について事前にデータが得られないことは留意すべ
き点である。
【0126】次のように標識した7つの異なる方法で実
験を行う。すなわち、それ自体で本発明の方法を使用す
る「NEW」。反復開放の開始点として使用する「NE
W−IT」。これを、無作為開始点による反復開放と比
較する。良好な開始点を持つことの重要性を明らかにす
るため、その反復法を1つの無作為開始点(RAN
1)、3つの異なる無作為開始点(RAN3)、あるい
は5つの異なる無作為開始点(RAN5)で行う場合に
認められる最良の解を得る。我々はこれらの結果を(G
T)グラウンドトルースの推定値、および(GT−I
T)反復法の開始点として(GT)での解を用いること
で認められる全体的に最適な解(誤差が最も小さいも
の)の推定値とを比較する。シミュレーションしたデー
タを用いる時には、グラウンドトルースが使用できる。
実際の動きシーケンスでは、(GT)についての全ての
データに基づいた解を用いる。
【0127】これらの実験では、多くの特定の閾値を設
定しなければならない。100回の反復で、あるいはそ
れが10桁の精度で収斂するまでその反復法を行う。本
発明のアルゴリズムでは、元の行列の10倍の列または
行を零空間(N)が占有するまで、列の3つを選択する
(列の3つが1000個という上限があるが、実際には
それに到達することはほとんどない)。列の3つそれぞ
れに対する零空間を計算する場合、零および0.1未満
の特異値を得る。NのSVDの3つの最下位成分を取る
ことでLを計算する。第4の最小特異値が0.001未
満である場合、その行列に対する明瞭な3次元零空間が
ないことから、結果に信頼性がないことを求めている。
【0128】2つの設定で合成データを得る。第1に、
合成動きシーケンスで点を得る。各シーケンスで、立方
体内で無作為に20点を選択する。次に、対象をz軸に
ついて90°回転させ(面内回転)、その平面で無作為
に選択される軸について90°回転させながら、均等の
間隔で20のフレームを得る。これによって、動きアル
ゴリズムからの構造が共通に適用されるシーケンスの種
類の簡単な例を提供するものである。次に、各点がシー
ケンスのある部分に閉塞されると仮定する。この部分
は、均等分布から各点について無作為に選ばれる。閉塞
長さの予想値を変化させて、我々の実験における欠陥要
素の数を変える。各点についての閉塞フレームは、シー
ケンスの始め、シーケンスの終わり、または始めと終わ
りの間で分割されるかのいずれかに無作為に割り付けら
れる。これら3つの条件のそれぞれが、等しい確率で起
こる。次に、要素の最大範囲の.25%の標準偏差によ
り、ガウス雑音を加える。500×500画素の画像の
場合、それは1.25画素の標準偏差に相当すると考え
られる。
【0129】次に、無作為強度画像を得る。最初に、1
00個の点を有する場面を得て、そのうちの全ての場面
点の表面法線を、正のz成分を有する単位半球での均等
な分布で選択する。0〜1の均等な分布から各点の反射
率を選択する。次に、単位強度の光源を選択し、場面表
面法線と同じ分布から引き出される方向を選択する。各
光源をその場面と組み合わせて、−1〜1の範囲の強度
で強度画像を得る。次に、標準偏差.01でガウス雑音
を加えた。最後に、零未満の強度を欠陥値と見なした。
【0130】最後に、ソーニーらの報告(H.Sawhney et
al. (1990) "Description and Reconstruction from I
mage Trajectories and Rotational Motion" Int. Con
f. onComp. Vis: 494-498)に記載の実際の動きシーケ
ンスから得られたデータについて、我々のアルゴリズム
を行った。このシーケンスは、8個の画像にわたって追
跡された40の点を含んでいた。このシーケンスでは、
無作為動きシーケンスについて説明したものと全く同じ
人工的閉塞が生じた。次に、隣接するフレームに存在す
る多数の点の中心の移動を測定し、その移動を除去する
ことで、移動の効果を補償した。次に、その行列のスケ
ールを決定することで、合成動きシーケンスの場合と同
じ次数とすることで、同じパラメータを全て適切に使用
できるようにした。これにより、全ての方法で、感知誤
差および移動を求める上での不正確さによる誤差を含ん
だ同じ行列で作業が行われるようにした。
【0131】図2、3、4、5、6および7では、結果
をグラフ表示している。第1の注目点は、我々の方法を
反復解法の開始点として用いた場合に最良の結果が得ら
れているという点である。動き実験においてこの方法
は、無作為開始点を用いて反復解法を1回、3回または
5回繰り返した場合よりかなり良好な結果を与える。詳
細には、閉塞されるデータが40%または50%で、問
題がより困難になるに連れて、我々の方法の成績の低下
は、複数の無作為開始点を用いる反復解法の場合よりか
なり遅い。強度画像への線形表面の適合においては、そ
の問題は無作為開始点を用いた場合にはかなり困難であ
ると考えられるものであるにも関わらず、我々の方法は
ほぼ完全な結果を与える。
【0132】第2に、反復による向上を行わずに、我々
の基本的方法によって良好な結果が得られる場合がある
ことがわかる。動きの場合、点の20〜30%が閉塞さ
れている場合、我々の方法は、グラウンドトルースにお
ける誤差の約2倍の誤差で解を与える。強度実験の場
合、我々の方法は、グラウンドトルースの場合よりわず
か30%高い平均誤差で解を与える。これらの数字は、
我々の方法が、反復による向上を行わずに、良好な近似
解を与え得ることを示している。しかしながら、動きに
おける閉塞量が増えると、我々の解の質はかなり低下し
得ることは留意すべき点である。
【0133】第3に、かなりの量のデータ欠陥がある場
合、動き問題は非常に困難なものとなり得ることがわか
る。我々の方法であっても、データの半分が欠落してい
る場合の90%よりわずかに高い最良解を与えるのみで
ある。動き問題の困難さは、欠陥データの数だけでな
く、特定の閉塞パターンや動きの大きさおよびフレーム
の数によっても決まるものである。しかしながら、我々
の実験は妥当な流れに基づいたものであると考えられ、
動きがさらに少なく閉塞がさらに大きいというさらに困
難な動き状況は興味深いものと考えられる。従って我々
のシミュレーションは、予備的なものではあるが、非常
に高い確率で最適解が望まれる場合、対象とする現実の
問題は、既存のアルゴリズムに対して困難な問題を提示
するものであることを示している。
【0134】欠陥要素を有するデータ行列の線形適合
が、最近のいくつかのアルゴリズムの中心的問題であ
る。我々は、反復解法の開始点として特に有用な、この
問題を解決する新規な方法を提供するものである。さら
に我々の実験では、一部の現実の設定では、この問題は
容易ではなく、反復解法が良好な開始点を持たずに不正
確な結果を与える場合が非常に多いことが示されてい
る。
【0135】以上、本発明の好ましい実施態様および実
施例と考えられるものについて説明したが、当然のこと
ながら、形式や詳細において各種の修正および変更を本
発明の精神から逸脱することなく容易に行うことができ
ることは明らかである。従って本発明は、以上説明した
通りの形のものに限定されるものではなく、添付の特許
請求の範囲内にあると考えられる全ての変更を含む構成
のものであるべきである。
【0136】
【発明の効果】本発明は以上説明したように構成されて
いるので、以下に記載するような効果を奏する。
【0137】欠陥要素を持つ行列に対して低階数行列を
適合させることができノイズがない場合には、正確な答
えを正しく与えるか、あるいは悪化している場合はそれ
によって回答が得られないことを示すことができる。
【0138】従って、いくつかの欠陥要素を有するデー
タ行列に低階数行列を適合させることで、より信頼性が
高く一般的な解を得ることができ、動きから構造のアル
ゴリズムで、一部の画像で見ることができない追跡場面
点を用いることができ、場面が部分的にしか照明されて
いない多くの画像から場面の強度を構築することができ
る効果がある。
【図面の簡単な説明】
【図1】実際の動きシーケンスの1フレームを示してあ
る。
【図2】(a),(b)は、2つの比較法による、5つ
の解法の平均誤差を示してある。各点は、100回の試
験で平均した、データと3階数適合との間の誤差の2乗
の合計を示してある。平均誤差を、ある点が入っている
フレームの平均部分fに対してプロットしてある。適合
と比較するデータが相対的に少ないことから、誤差を
(1−f)で割ることで、誤差低減の合計を補正する。
(a)のプロットの対数目盛のプロットには、4つの解
法を示してある。(b)では、誤差がかなり少ない均等
目盛法でプロットしている。比較のため、両方のプロッ
トでGT−ITを示している。
【図3】最適な利用可能解に収斂する反復法の回数の割
合を示している。
【図4】100回の平均での、欠陥データを有する強度
画像に3階数行列に適合させる実験で得られた平均残留
誤差を示したものである。
【図5】反復法が強度画像についての最適利用可能解に
収斂する頻度を示したものである。
【図6】(a),(b)のそれぞれは図2(a),
(b)に示したような実際の動きシーケンスについての
平均誤差を示したものである。
【図7】最適な利用可能解に収斂する反復法の回数の割
合を示している。
【図8】本発明の方法を実行する装置を示したものであ
る。
【図9】本発明の別の方法を実行する別の装置を示した
ものである。
【符号の説明】
800 装置 810 固定場面 820 カメラ 830 確認・追跡手段 840 計算手段 900 装置 910 点光源

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 不完全なデータを提供するビデオシーケ
    ンスから完全な場面構造を形成する方法において、 (a) (i)移動するカメラを用いて固定場面の画像シーケン
    スを得て、 (ii)そのシーケンスから点素性を確認・追跡し、 (iii)該点素性の座標を用いて、一部の素性が一部の
    画像で存在しない一部の欠陥要素を有する第1の行列を
    構築して、ビデオシーケンスから点位置からなる第1の
    行列を構築する段階と、 (b) (i)第1の行列から列トリプルを選択し、 (ii)その零空間から第2の行列を得て、 (iii)第2の行列の3つの最小の成分を得て、近似解
    を構築する段階と、 (c)その3つの最小成分に反復アルゴリズムを適用し
    て第3の行列の構築および推定の向上を行う段階と、 (d)第3の行列を分解して完全な場面構造を求める段
    階と、を有してなる方法。
  2. 【請求項2】 前記第1の行列が下記式で与えられる請
    求項1記載の方法。 【数1】 [式中、 【数2】 は全ての追跡画像点を含む単一の行列であり、 【数3】 の各列には、単一の点の全ての画像座標がある。Xi,j
    は、i番目の画像におけるj番目の雑音性像点のX座標
    であり、Yi,jはi番目の画像におけるj番目の画像点の
    Y座標である。]
  3. 【請求項3】 列トリプルが無作為に選択される請求項
    1記載の方法。
  4. 【請求項4】 第2の行列が下記式で与えられる請求項
    1記載の方法。 N=[N12…Nl] [式中、Siは列のi番目のトリプルによって囲まれる線
    形空間であり、NiはSiの零空間を表しており、従って
    iの各列は、空間Siに対して直交するベクトルを表
    す。]
  5. 【請求項5】 反復アルゴリズムが下記式で与えられる
    請求項1記載の方法。 【数4】 [式中、Tiは、カメラの動きを表す行列Tの反復iでの
    推定値であり、Piは、場面構造を表す行列の反復iでの
    推定値であり、Pi +はPiの擬逆行列であり、 【数5】 は全ての追跡画像点を含む単一の行列であり、 【数6】 の各列には、単一の点の全ての画像座標がある。Xi,j
    は、i番目の画像におけるj番目の雑音性像点のX座標
    であり、Yi,jはi番目の画像におけるj番目の画像点の
    Y座標であって、 【数7】 、TおよびPについての一連の推定値が得られ、 【数8】 −Qの大きさは非増加的である。]
  6. 【請求項6】 近似解を構築する段階が、 (a)列の完全に占有された亜矩形の零空間を計算し
    て、列トリプルの零空間を与え、その亜矩形が実質的に
    縮重している場合に零空間を無視する小段階と、 (b)何らかの所定の一定因数だけ、第1の行列より零
    空間が大きくなるまで列トリプルを選択し、第2の行列
    が所定の閾値より小さい第4の最小特異値を持つ場合に
    は全ての結果を信頼性のないものと判定する小段階と、 (c)データの部分集合について正確な推定値が得られ
    る場合には、反復最小自乗法によって第2の行列を発見
    的に拡張する小段階と、を有してなる請求項1記載の方
    法。
  7. 【請求項7】 不完全なデータを提供するビデオシーケ
    ンスから完全な場面構造を形成する方法において、 (a) (i)独立の複数の点光源で、固定場面の一連の画像を
    得て、 (ii)付影または反射のために信頼性のないデータを提
    供する各画像の点を確認し、 (iii)データの信頼性のない欠陥要素を用いて、強度
    値の第1の行列を構築して、複数の画像から強度値から
    なる第1の行列を構築する段階と、 (b) (i)第1の行列から列トリプルを選択し、 (ii)その零空間から第2の行列を得て、 (iii)第2の行列の3つの最小の成分を得て、 近似解を構築する段階と、 (c)その3つの最小成分に反復アルゴリズムを適用し
    て第3の行列の構築および推定の向上を行う段階と、 (d)第3の行列を分解して完全な場面構造を求める段
    階と、を有してなる方法。
  8. 【請求項8】 第1の行列が下記式で表される請求項7
    記載の方法。 【数9】 [式中、 【数10】 はj番目の列が各画像のj番目の画素の強度を与えるデ
    ータ行列であり、Eは感知誤差の行列であり、Hはi番
    目の行がi番目の画像のhベクトルである照明行列であ
    り、hはその強度によってスケールを決定される点光源
    の3次元ベクトルであり、Nはj番目の列がpjjであ
    る場面行列であって、pjは表面アルベドであり、nj
    3次元面状部分の表面法線である。]
  9. 【請求項9】 列トリプルが無作為に選択される請求項
    7記載の方法。
  10. 【請求項10】 第2の行列が下記式で与えられる請求
    項7記載の方法。 N=[N…N] [式中、Siは列のi番目のトリプルによって囲まれる線
    形空間であり、NiはSiの零空間を表しており、従って
    iの各列は、空間Siに対して直交するベクトルを表
    す。]
  11. 【請求項11】 反復アルゴリズムが下記式で与えられ
    る請求項7記載の方法。 【数11】 [式中、Tiは、照明を表す行列Tの反復iでの推定値で
    あり、Piは、場面点での表面法線を表す行列の反復iで
    の推定値であり、Pi +はPiの擬逆行列であり、 【数12】 は全ての追跡画像点を含む単一の行列であり、 【数13】 の各列には、単一の点の全ての画像座標がある。Xi,j
    は、i番目の画像におけるj番目の雑音性像点のX座標
    であり、Yi,jはi番目の画像におけるj番目の画像点の
    Y座標であって、 【数14】 、TおよびPについての一連の推定値が得られ、 【数15】 −Qの大きさは非増加的である。]
  12. 【請求項12】 近似解を構築する段階が、 (a)列の完全に占有された亜矩形の零空間を計算し
    て、列トリプルの零空間を与え、その亜矩形が実質的に
    縮重している場合に零空間を無視する小段階と、 (b)何らかの所定の一定因数だけ、第1の行列より零
    空間が大きくなるまで列トリプルを選択し、第2の行列
    が所定の閾値より小さい第4の最小特異値を持つ場合に
    は全ての結果を信頼性のないものと判定する小段階と、 (c)データの部分集合について正確な推定値が得られ
    る場合には、反復最小自乗法によって第2の行列を発見
    的に拡張する小段階と、を有してなる請求項7記載の方
    法。
  13. 【請求項13】 不完全なデータを与えるビデオシーケ
    ンスから完全な場面構造を与える装置において、 固定場面の画像シーケンスを得るためのカメラと、 そのシーケンスから点素性を確認・追跡する手段と、 動きシーケンスから点位置からなる第1の行列を構築
    し、一部の素性が一部の画像で存在しない素性の座標を
    用いて一部の欠陥要素を有する第1の行列を構築し、
    1)第1の行列から列トリプルを選択する段階、2)そ
    の零空間から第2の行列を得る段階、3)第2の行列の
    3つの最小の成分を得る段階、4)その3つの最小成分
    に反復アルゴリズムを適用して第3の行列の構築および
    推定の向上を行う段階、5)第3の行列を分解して完全
    な場面構造を求める段階を有する近似解の構築を行う計
    算手段を有する装置。
  14. 【請求項14】 計算手段がパーソナルコンピュータで
    ある請求項13記載の装置。
  15. 【請求項15】 不完全データを提供するビデオシーケ
    ンスから完全な場面構造を得る装置において、 固定場面の一連の画像を得るための複数の異なる点光源
    と、ならびに複数の画像からの強度値からなる第1の行
    列を構築し、付影または反射のために信頼性のないデー
    タを提供する各画像中の点を確認し、データの信頼性が
    ない欠陥データを有する強度値の第1の行列を構築し、
    1)第1の行列から列トリプルを選択する段階、2)そ
    の零空間から第2の行列を得る段階、3)第2の行列の
    3つの最小の成分を得る段階、4)その3つの最小成分
    に反復アルゴリズムを適用して第3の行列の構築および
    推定の向上を行う段階、5)第3の行列を分解して完全
    な場面構造を求める段階を有する近似解の構築を行う計
    算手段と、を有してなる装置。
  16. 【請求項16】 計算手段がパーソナルコンピュータで
    ある請求項15記載の装置。
JP7580898A 1997-03-25 1998-03-24 欠陥データとの線形適合方法、動きから構造への適用方法、強度画像の特徴決定への適用方法および装置 Pending JPH10302064A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US4169597P 1997-03-25 1997-03-25
US4354097P 1997-04-14 1997-04-14
US60/043540 1997-04-14
US60/041695 1997-04-14

Publications (1)

Publication Number Publication Date
JPH10302064A true JPH10302064A (ja) 1998-11-13

Family

ID=26718421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7580898A Pending JPH10302064A (ja) 1997-03-25 1998-03-24 欠陥データとの線形適合方法、動きから構造への適用方法、強度画像の特徴決定への適用方法および装置

Country Status (1)

Country Link
JP (1) JPH10302064A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7227973B2 (en) 2000-04-03 2007-06-05 Nec Corporation Device, method and record medium for image comparison

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7227973B2 (en) 2000-04-03 2007-06-05 Nec Corporation Device, method and record medium for image comparison

Similar Documents

Publication Publication Date Title
US10553026B2 (en) Dense visual SLAM with probabilistic surfel map
US8447099B2 (en) Forming 3D models using two images
US8452081B2 (en) Forming 3D models using multiple images
Sim et al. Recovering camera motion using l\infty minimization
WO2022001236A1 (zh) 三维模型生成方法、装置、计算机设备及存储介质
CN110458939A (zh) 基于视角生成的室内场景建模方法
US20150286893A1 (en) System And Method For Extracting Dominant Orientations From A Scene
Muratov et al. 3DCapture: 3D Reconstruction for a Smartphone
Jaegle et al. Fast, robust, continuous monocular egomotion computation
CN114152217B (zh) 基于监督学习的双目相位展开方法
da Silveira et al. Dense 3d scene reconstruction from multiple spherical images for 3-dof+ vr applications
Lensch et al. Planned sampling of spatially varying BRDFs
Kroemer et al. Point cloud completion using extrusions
US20140168204A1 (en) Model based video projection
Peretroukhin et al. PROBE-GK: Predictive robust estimation using generalized kernels
CN114494589A (zh) 三维重建方法、装置、电子设备和计算机可读存储介质
Gadasin et al. Reconstruction of a Three-Dimensional Scene from its Projections in Computer Vision Systems
US6009437A (en) Linear fitting with missing data: applications to structure-from-motion and to characterizing intensity images
Jeon et al. Struct-MDC: Mesh-refined unsupervised depth completion leveraging structural regularities from visual SLAM
Aravkin et al. Student's t robust bundle adjustment algorithm
CN117726747A (zh) 补全弱纹理场景的三维重建方法、装置、存储介质和设备
Rozumnyi et al. Learned semantic multi-sensor depth map fusion
JPH10302064A (ja) 欠陥データとの線形適合方法、動きから構造への適用方法、強度画像の特徴決定への適用方法および装置
Lehmann et al. Correspondence-free determination of the affine fundamental matrix
Concha et al. Map point optimization in keyframe-based SLAM using covisibility graph and information fusion