JP2001512252A - モザイク画像を構成するためのローカル/グローバルマルチフレームアライメントを実行する方法および装置 - Google Patents

モザイク画像を構成するためのローカル/グローバルマルチフレームアライメントを実行する方法および装置

Info

Publication number
JP2001512252A
JP2001512252A JP2000505596A JP2000505596A JP2001512252A JP 2001512252 A JP2001512252 A JP 2001512252A JP 2000505596 A JP2000505596 A JP 2000505596A JP 2000505596 A JP2000505596 A JP 2000505596A JP 2001512252 A JP2001512252 A JP 2001512252A
Authority
JP
Japan
Prior art keywords
images
image
mosaic
positioning
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000505596A
Other languages
English (en)
Inventor
ステファン, チャールズ シュー,
ラケシュ クマール,
ハープリート, シング ソウニー,
ジェイムズ, アール. バーゲン,
ダウ ディクソン,
ギャリー ゲンデル,
ヴィンス パラガノ,
Original Assignee
サーノフ コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サーノフ コーポレイション filed Critical サーノフ コーポレイション
Priority claimed from PCT/US1998/015879 external-priority patent/WO1999006943A1/en
Publication of JP2001512252A publication Critical patent/JP2001512252A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Studio Circuits (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

(57)【要約】 一連の画像のトポロジーを決定し、次に各画像の隣接する画像に関する画像を全体的に整列する方法および装置。この装置は、トポロジー決定モジュール(302)と、ローカル粗位置決めモジュール(304)と、ローカル精位置決めモジュール(306)と、グローバル整合性モジュール(308)と、色合わせ/色混合モジュール(310)とを含んでいる。一連の画像からモザイク画像を正確にレンダリングするために、トポロジー決定およびグローバルアライメントの処理は正確に整列された画像を徐々に生成するように反復される。この装置は、画像取得の順序とは無関係に複数のソース画像を効率的におよび正確に結合し、任意の広い空間および角度の範囲のシーンの継ぎ目なしのパノラマモザイクにする。

Description

【発明の詳細な説明】
【0001】 本出願は、参照してここに組み込まれる1997年8月1日に出願された米国
仮出願第60/054,588号の利益を請求する。
【0002】 本発明は、画像およびビデオ情報を処理するシステム、より詳細には、複数静
止画像および/またはビデオフレームを結合し、拡張シーンのパノラマ表示を形
成するシステムに関する。
【0003】 開示の背景 多数の画像処理システムでは、複数の個別の画像あるいは一連のビデオフレー
ムからパノラマ画像を形成することが望ましい。パノラマ画像を形成するために
、シーンの画像は、それから除去される冗長情報を有するシーンの包括的なパノ
ラマ画像を形成するために互いに整列され、マージ(ステッチ)されねばならな
い。モザイク画像は、一般的に、静止画像のセットからの情報および複数の異な
る時間瞬間で同じ物理的シーンを個別に観察するビデオシーン(まとめて“画像
”)、観察地点、視野、分解能等のフレームを結合するデータ構造である。いろ
いろな画像は、幾何学的に整列され、色彩計で測って整合され、それから単一の
コヒーレント画像としてシーンのパノラマ画像を形成するために一緒にマージさ
れる。
【0004】 ここで使用されるようなフレーズ画像処理は、ビデオ信号のイメージ(フレー
ム)、すなわち一連の一時的関連イメージと同様に一時非関連イメージを含むイ
メージ全ての形式の処理を含むことを意図としている。
【0005】 正確な画像アライメントは複数画像のモザイクを形成する処理の基礎である。
画像のアライメント(位置決めとしても知られている)は、まず画像間のオフセ
ットを示す変位フィールドを決定することから開始し、それから画像を互いに曲
げオフセットを除去あるいは最少にする。
【0006】 モザイクがコヒーレントであるために、モザイクの点は、シーンの点と1対1
の対応関係でなければならない。したがって、ソース画像が曲げられ、結合され
る面に基準座標系を与えるとき、基準座標系の点と各画像のピクセルとの間の正
確な空間マッピングを決定することが必要である。
【0007】 ソース画像からモザイクを手動であるいは自動で生成する方法は当該技術分野
で公知である。自動モザイク生成システムの1つの例は、参照してここに組み込
まれる1997年7月15日に発行された米国特許番号第5,649,032号
に開示されている。この特許では、一時的に隣接するビデオフレームは、互いに
位置決めされ、一連の画像対画像マッピングを生じ、ついで、この一連の画像/
画像マッピングは全ての基準/画像マッピングを推測するように反復的に構成す
る。その代わりに、各々の新しいフレームは、前のフレームから反復的に構成さ
れ、所望の基準/画像マッピングを直接生じるモザイクに位置決めされる。′0
32特許は、フレーム/フレーム位置決めあるいはフレーム/モザイク位置決め
の両方を使用し、画像を正確に整列する技術を記載している。
【0008】 これらの公知の方法はいくつかの欠点を有する。先ず第一に、フレーム/フレ
ーム位置決めのいずれかが正確に推測できないならば、チェーンが砕かれ、次の
フレームは同じ基準座標系に関して計算できない。第二に、カメラの視野がずっ
と前に最初に観察されたシーンの一部に重なる場合、これらの方法は、新しい画
像がこれらの古い画像と位置決めされることを保証しない。例えば、図1は、画
像が画像101〜104に対してカメラを左から右へパン(矢印109によって
示され)し、画像105〜108に対してカメラを右から左へパン(矢印110
によって示され)することによって形成される画像101〜108の時間順序シ
ーケンスを示している。画像101〜104の最下部領域は画像105〜108
の最上部領域に重なる。図1の空間構造の画像がまず画像101から始まり、画
像108まで続く時間順序で生じ、各画像がそれ以前の画像に位置決めされるな
らば、画像101および108が曲げられる場合モザイク基準座標系に整列して
いるという保証はない。そのこと自体、第1の画像(例えば、画像101)は、
これらの画像の重なり部分に沿って後で発生された画像(例えば、画像108)
と適切に整列しなくてもよい。したがって、従来の技術を使用して発生されたパ
ノラマモザイクは著しく歪められてもよい。
【0009】 従来技術の方法では、モザイクのフレームは不整合されるべきであるばかりで
なく、シーンの全構造はまた不正確に表示されてもよい。例えば、いくつかのシ
ーン部分は2回表示されてもよいしあるいは隣接されるべき(べきでない)部分
は互いからはるかに離れて(互いに接近して)表示される。画像が大きな閉ルー
プを形成するならば、閉包がモザイクで表示されなくてもよい。これらのエラー
は、画像間の近傍関係の全トポロジーが完全に認識されない場合に生じる。
【0010】 既存のモザイク生成技術の他の制限は、これらの技術が両方向に約140°以
上の角度に対するパノラマに適切な表示でない円筒状基準面あるいは平面基準面
上に画像を結合するだけに適する空間マッピングを推定するということである。
【0011】 したがって、画像シーケンスのトポロジーを決定し、トポロジーに従って画像
を全体的に整列することによってパノラマモザイクを形成する画像処理技術に対
する要求は当技術分野において存在する。
【0012】 発明の概要 本発明は、一連の画像のトポロジーを決定し、それからこの画像を各画像の隣
接画像に対して全体的に整列させる方法および装置を提供することによって従来
技術の欠点を解決する。本発明は、トポロジー決定モジュールと、ローカル粗位
置決めモジュールと、ローカル精位置決めモジュールと、グローバル整合性モジ
ュールと、色合わせ/色混合モジュールとを含む。モザイク画像を一連の画像か
ら正確にレンダリングするために、トポロジー決定処理および画像位置決め処理
は、正確に整列された画像を徐々に発生するように反復される。本発明は、画像
取得の順序に関係なく、複数のソース画像を効率的および正確に結合し、任意の
幅広い空間および角度の大きさのシーンの継ぎ目なしのパノラマモザイク表示に
する(連続フレームが互いに重なる限りでは)。さらに、本発明は、カメラの校
正を要しなくて、空間におけるカメラの動きを厳密に制限しない。
【0013】 より詳細には、トポロジー決定モジュールは、空間的に互いに重なり、“近傍
”と呼ばれる画像の対を識別する。ローカル粗位置決めは近傍間の低複雑性の近
似空間マッチングを推定する。精ローカル位置決めは、近傍間あるいはモザイク
の画像と現推定値間のより高い複雑性のマッピングを推定する。グローバル整合
性モジュールは、マッピングが最大限に全てのローカル位置決め情報と整合し、
選択された基準面形状、すなわち平面あるいは球面と整合するように全てのマッ
ピングを同時に最適化することによって全ての基準/画像マッピングを推論する
。効率のために、この推論は、ソース画像ピクセルをアクセスしないでローカル
位置決めの結果に専ら基づいている。多数のローカルアライメント対策のいずれ
かが最大効率のために使用できるが、ローカルエラー関数は予め計算できるので
、グローバル整合性はソース画像ピクセルにアクセスする必要がない。一旦画像
が整列されると、色合わせ/色混合モジュールは画像を結合し、モザイクを形成
する。
【0014】
【発明の実施の形態】
本発明の教示は添付図面とともに詳細な説明を考察することによって容易に理
解できる。
【0015】 理解を容易にするために、同一参照番号が、可能な場合、図に共通である同一
要素を示すために使用される。
【0016】 図2は、少なくとも1つのイメージセンサ(他のセンサが使用されてもよいが
、例えばカメラ202)およびイメージプロセッサ204を含むイメージ処理シ
ステム200のブロック図を示す。カメラ202は、複数のデジタル静止画像あ
るいはデジタルビデオフレーム、すなわちピクセル値の二次元アレイを生成する
と思われる。しかしながら、カメラは、アナログ信号を生成するアナログセンサ
であってもよく、付加回路はアナログ信号を処理するためのデジタル画像に変換
するために使用されてもよい。デジタル画像を処理するために、画像プロセッサ
204は、中央処理装置(CPU)208と、メモリ装置210と、従来のCP
U支援回路212とを備えている。イメージプロセッサ206は、キーボード、
マウスおよびディスプレイのような従来の入出力(I/O)周辺装置208に結
合されている。CPU208は、メモリが呼び出される特定のルーチンを実行す
る場合、専用コンピュータ、例えばイメージプロセッサになる汎用コンピュータ
である。このCPUは、インテル社製のPENTIUM IIプロセッサあるい
はモトローラ社製のPOWER PCプロセッサのようないかなるプロセッサで
あってもよい。メモリ210は、ランダムアクセスメモリ(RAM)、読み出し
専用メモリ(ROM)、ハードディスクドライブ、フロッピーディスクドライブ
あるいはその任意の組み合わせであってもよい。支援回路212は、フレームグ
ラッバー回路、アナログ/デジタル(A/D)回路、クロック回路、キャッシュ
、電源、I/Oドライバ等のようないろいろな従来の回路を含む。I/O周辺装
置208は、一般にキーボード、マウスおよびディスプレイを含むが、ビデオテ
ープレコーダ、ビデオディスクプレーヤー等を含んでもよい。イメージプロセッ
サ204によって処理された画像は、センサ(カメラ202)から直接供給され
なくてもよく、ビデオテープレコーダ、コンピュータディスクあるいは他の記憶
装置によって供給されるような予め記録された画像ならびに通信システムを介す
る遠隔センサあるいはレコーダからも供給されてもよい。
【0017】 本発明は、CPU208によって実行される場合、一連の画像の各画像がその
空間的に隣接する画像の全てに位置決めされるように画像を任意の2次元面(多
様体)に全体的に位置決めする2次元モザイク作成方法および装置を提供する実
行可能イメージ処理ルーチン214で具体化される。本発明の実施形態はソフト
ウェアインプリメンテーションとして記載されているけれども、当業者は、本発
明がハードウェアあるいはハードウェアおよびソフトウェアの組み合わせで実行
できる。したがって、ルーチンの機能態様の各々は1つあるいはそれ以上の装置
で全部あるいは部分的に実行できる。
【0018】 図3は、本発明の2次元モザイク作成システム200を実行するためにプロセ
ッサによって実行されるルーチン214の機能ブロック図を示している。このシ
ステム200は、トポロジー決定モジュール302と、ローカル粗位置決めモジ
ュール304と、ローカル精位置決めモジュール306と、グローバル整合性モ
ジュール308と、色合わせ/色混合モジュール310とを含んでいる。このシ
ステムは、複数のソース画像312を効率的および正確に結合し、画像取得の順
序に関係なく、任意の幅広い空間および角度の大きさにおけるシーンの継ぎ目な
しのパノラマモザイク表示にする(モザイク314)。さらに、この方法は、カ
メラの校正を要しなく、空間におけるカメラの動きを厳密に制限しない。
【0019】 通常、本発明は、絵、白板のような平面画像のモザイクならびに3次元シーン
のモザイクが比較的小さい視角を使用して撮像されるように映像を平面に位置決
めする。しかしながら、シーンが、それ自体の上で閉じるかあるいは固定観察地
点の周りの全球面あるいは球面の重要な部分を覆う一連のパノラマ画像によって
捕獲される場合、平面はシーンの継ぎ目なし表示に適当でない。したがって本発
明は、画像を位置決めする円錐面、円筒面あるいは球面を使用する。この面は面
タイプのメニューから手動で選択されてもよい。しかしながら、好ましい実施形
態では、この面は画像の位置決めパラメータおよびトポロジーを検査することに
よって選択される。
【0020】 2次元多様体、例えば、平面あるいは球面は平面画像を多様体上に表示するた
めに明示的に使用されてもよい。一方、画像(フレーム)間の点をマッピングす
るために使用される特定変換は、入力フレームを多様体上に表示するために暗黙
のうちに使用されてもよい。どちらの場合においても、トポロジー決定モジュー
ル302は、シーケンスのどのフレームが重なり、したがって適切な多様体上の
近傍であることを決定する。トポロジー決定処理は、フレームが互いに対して粗
く位置決めされ、全ての重なる画像の特定の変換が計算できた後実行される反復
処理である。
【0021】 このシステム200は、画像位置決めおよびトポロジーの精度が各反復で改善
されるように反復技術で画像を処理する。トポロジー決定モジュール302は、
以後“近傍”と呼ばれるどの画像対が現推定モザイク/フレーム位置決めパラメ
ータによって示唆されるレイアウトに基づいて互いに空間的に重なるかを仮定す
る。(最初のパス上で、このような推定は全然存在しないので、トポロジーモジ
ュール302は、連続番号のフレームは近傍であると単に推定する。)ローカル
粗精位置決めモジュール304および306は、仮定を確認するかあるいは反駁
するために近傍の間の空間マッピングを推定する。良質の位置決めは、パス31
6あるいは317を介してトポロジーモジュール302に戻され、トポロジーを
更新し、モジュール308にも送られる。グローバル整合性モジュール308は
、このマッピングが全ローカル位置決め情報および選択された基準面形状、例え
ば平面あるいは球面と最大限に矛盾しないようにマッピングを同時に最適化する
ことによって全基準対画像マッピングを推論する。グローバル整合性は、モザイ
クが表示される2次元多様体に対応する純パノラマアライメントのために解決す
ることによって負わされる。さらに、グローバルモデルから逸脱によるミスアラ
イメントは、重なりの領域間の準パラメータアライメントあるいは区分的パラメ
ータアライメントによって処理される。
【0022】 グローバル整合性によって生成されたモザイクに関する画像位置の改良された
推定は、エラーを訂正し、シーントポロジーの未知隣接関係に書き入れるために
役立ち得る。したがって、フィードバックパス318は、位置パラメータをトポ
ロジーモジュール302に送り返すので、このトポロジーモジュール302は以
前は明らかでない任意の近傍を識別できる。したがって本発明のルーチンは、所
定のレベルのトポロジーおよびアライメント精度が生成されるまで、トポロジー
決定モジュール302、ローカル粗位置決めモジュール304、精ローカル位置
決めモジュール306およびグローバル整合性モジュール308を通して反復す
る。
【0023】 前述の段階はソース画像の幾何学的アライメントを行っているが、色合わせ/
色混合モジュール310は整列画像間の色および輝度の不一致を調整する。これ
は、モザイクの際立った継ぎ目を避けるように実行される重要な処理である。混
合技術の詳細な説明は、1997年11月10日に出願され、参照してここに組
み込まれる共通に譲渡された米国特許第08/966,766号に開示されてい
る。色合わせ/色混合モジュール310の出力はシーンの所望のモザイク表示3
14である。
【0024】 さらに、本発明のシステムはレンズ歪み補正処理から利益を得ることができる
。このような処理は、1997年11月10日に出願され、参照してここに組み
込まれる共通に譲渡されている米国特許第08/966,766号に詳細に記載
されている。レンズ補正処理は、位置決めモジュール304、306のいずれか
のグローバル整合性モジュール308に組み込まれ、カメラのレンズによって引
き起こされたモザイクのいかなる歪みも補正するために使用できる。
【0025】 図4は、本発明のモジュール302、304、および306および308の動
作(ルーチン400)を示す流れ図を示す。この処理は、ステップ402で始ま
り、粗位置決めが一時の近傍である隣接画像対に対するアライメントパラメータ
を生成するように実行されるステップ404に進む。ステップ406で、トポロ
ジー決定モジュール302は、粗い位置決めのために現在重なっていると思われ
ている近傍の各々に対する重ね合わせ隣接仮説を作り出す。ステップ408では
、ルーチン400は、いかなる近傍も近傍であるかどうかを調べるために少しの
近傍もまだ検査されなかったかどうかを質問する。問い合わせが肯定回答される
場合、ルーチン400は、粗い位置決めおよび/または細かい位置決めが近傍で
あると仮定される画像対間で実行されるステップ416に進む。現アライメント
の精度に応じて、粗い位置決めあるいは細かい位置決めのいずれかが実行される
。ステップ418で、ルーチン400は、位置決めの質が“良好”であるかどう
かを質問する。質が十分であるならば、ルーチンは、画像のアライメントパラメ
ータが記憶され、トポロジーグラフが2つの新しく位置決めされた隣接画像を接
続する付加弧で更新されるステップ420に進む。次に、このルーチンは、ステ
ップ408に戻り、他の画像対を処理する。ステップ418の質問が否定回答さ
れる場合、このルーチンはステップ408に戻り、ステップ408および416
を使用して画像の対をさらに位置決めする。ステップ408の質問が否定回答さ
れる場合、ルーチンはステップ410に進む。ステップ410では、ルーチンは
、全隣接画像が現在処理され、位置決めパラメータが重なる隣接画像の各対に対
して得られたことを確実にするためにトポロジーが十分に集束したかどうかを質
問する。ステップ410の質問が肯定回答される場合、ルーチンはステップ41
4で中止する。しかしながら、ステップ410の質問が否定回答される場合、ル
ーチンは、ステップ412に進み、モジュール308のグローバル整合性を実行
する。一旦グローバル整合性が実行されると、このルーチンは重なる隣接画像の
他の仮説がトポロジー決定モジュール302およびルーチン処理によって作り出
され、いかなる新しく識別された隣接画像も処理するステップ406に戻る。
【0026】 より詳細には、モジュール302、304、および306によって実行される
幾何学的アライメントの目的は、基準対画像マッピングの最適セットu=Pi( x)、(ここで、xは基準面上の点を示し、uはソース画像上の点である)を計
算することにある。一般に、基準面およびソース画面の形状は平面および球面の
ような3次元で示される任意の2次元多様体であり得る。2次元モザイク作成の
場合、各Piは、透視投影あるいはアフィン回転あるいは3次元回転のようなマ ッピングのパラメータ系に制限される。
【0027】 空間変更輝度/色関数M(x)によって構成されるモザイク画像およびソース
画像をIi(u)によって示す。各xに対して、画像i毎の点Pi(x)が物理的
シーンの同じ点に対応するようにPiを決定することが望ましい。この条件は、 結合ピクセル{Ii(Pi(x)),∀i}によって構成されたモザイク画像が空
間的なコヒーレントモザイクを生じることを保証する。ここで、各点xはシーン
の点と1対1の対応関係にある。
【0028】 全ての近傍に対する画像のアライメントを実行するために、グローバル整合性
モジュール308は、画像フレーム間のミスアライメントならびに情報の冗長性
を評価する関数を最適化する。この関数、すなわち最少記述長(MDL)コスト
関数は下記の式として示される。
【0029】
【数1】
【0030】 ここで、 σはスケールファクタ、および vari{.}は各xにマッピングする異なるフレームからの ピクセルの分散を示す。
【0031】 MDLコスト関数は、モザイク+モザイクに関するフレームの残余の形のフレ
ームの集合を示すコンパクトさを判断する。分散が直接に輝度で厳密に判断でき
なくて、その代わりに画像輝度のフィルタリングされた表示あるいは点位置P’
(x)で直接に判断できることに注意されたい。
【0032】 式1のMDLコスト関数を最適化するために、本発明はグローバルに最適アラ
インメントパラメータを見つけることによりモザイク座標システム上の整列され
たフレーム間で重なりを最適化する。本発明の技術は、入力フレームの2次元ト
ポロジーが適切な2次元多様体上で既知であり、ローカルアライメントパラメー
タ(あるいは他の対応関係)が隣接フレーム間で利用可能である場合、グローバ
ルバンドルブロック調整は正確なPiに対する値を求めるために使用することが できる。一方、Piの近似情報が利用可能である場合、フレーム間に新しい関係 をさらに生じさせることができる隣接関係を推論できる。本発明は、グローバル
最適解に達するようにトポロジー決定およびパラメータ推定の2つの工程を反復
的な方法で切り替える。トポロジー決定モジュール302はローカル隣接関係を
仮定し、グローバル整合性モジュール308はローカル制約を使用し、アライメ
ントパラメータを決定する。これらの2つのモジュール間において、本発明は、
ローカル精位置決めモジュール306を使用して、隣接フレーム間の対応関係を
生じさせ、これらを品質対策で検証する。全アライメント処理はローカル粗およ
び精のアライメントの両方を使用して行われる。
【0033】 ソース画像集合が閉包効果あるいは重要な視差効果を示さない場合、3次元シ
ーンは、滑らかな2次元多様体として処理でき、したがって画像間の1対1の対
応関係の概念は明確に定義される。この1対1対応関係の仮定は、カメラだけが
固定中心の周りに回転する限り、さもないと観察されたシーンが実際均質である
場合、維持される。1対1の対応関係を有しない、より一般的なケースが次に検
討される。
【0034】 P’iが推論されねばならない情報の主要源は生画像ピクセル値Ii(u)であ
る。より詳細には、本発明では、画像は画像対間の相対マッピングu′=Qij
u)を推定するために使用される。これは、本発明の最初の3つの工程、すなわ
ちトポロジー決定、粗いローカル位置決めおよび細かいローカル位置決めによっ
て実行される。最後に、ローカル相対マッピングは、グローバル整合性工程で使
用され、全てのPiを同時に推定し、最適グローバルアライメントを実行する。
【0035】 ローカル粗位置決めの先触れとして、どの画像対i,jが“近傍”である、す
なわち、このような対だけがQijの推定を可能にするために、十分な空間的重な
りを有する視野を有することを知る必要がある。どれくらいの重なりで十分であ
るかは画像特徴の分布および画像を整列するために使用されるローカル位置決め
技術で決まる。全ての画像対のセットは隣接画像Gのグラフを構成する。
【0036】 直観的な空間あるいは時間の関係がない画像のランダム集合が与えられると、
隣接を自動的に識別する画像処理システムを有することは任意に困難な問題であ
るかもしれない。トポロジー決定モジュール302を使用すると、連続番号の画
像が空間的に重なる限り、本発明は、全自動トポロジー決定を実行する。画像集
合が正常ビデオシーケンスの時間順フレームからなる場合あるいはユーザがラン
ダム画像集合を空間的に順序付けられたシーケンスに対話式に構成される場合、
この条件は一般的には満たされる。この仮定の下では、最初のトポロジーが連続
番号の画像の線形連鎖をデフォルトすることは合理的である。
【0037】 画像を整列するために使用される最初の反復の開始で、一般的には少しも画像
アライメントパラメータ(Pi)の情報がない、したがって、ビデオシーケンス の連続フレームが重なっているという合理的な仮定の下では、最初のトポロジー
は一時近傍の線形連鎖にデフォルトする。このような近傍のローカルアライメン
トおよびグローバル整合性‐動きモデルの自明な連結はPの第1の推定を生じる
。隣接関係は、その節点がフレームを示し、その弧が隣接関係を示すグラフとし
て示される。
【0038】 後で、位置決めモジュール302あるいは306の1つあるいはそれ以上がP i の予備推定を生じた後、トポロジーは再計算することができる。すなわち、い くつかの近傍は追加されてもよいのに対して、他の近傍は抜かされてもよい。こ
のようなフィードバックによるトポロジーの変化はローカルおよびグローバル位
置決めの推定の修正をもたらしてもよい。例えば、図1の場合、まず第一に、近
傍が時間的に隣接する画像101‐102、102‐103、....107‐
108であると仮定される。位置決めを実行することによってだけ空間構成が明
らかになり、画像101‐108、102‐107、および103‐106は近
傍であると分かるべきである。したがって、これらの新しい画像対はローカル精
位置決めモジュール306でローカルに位置決めされる。
【0039】 より詳細には、次の繰り返しにおいて、トポロジー決定は非自明になってもよ
い。ループを閉じるSパターンあるいは対の隣接走査あるいは螺旋走査のフレー
ムのような非連続フレームは近傍であることが分かりうる。カメラの動きの方向
が変わる場合、これらのパターンをいかなる形状の基準面上にも形成することが
できる。球面のような閉じられた形状の場合、さらに、ループは、360°パノ
ラマを走査することによって代表されるような一定なカメラの動きによってさえ
形成できる。トポロジーはPiの近似情報だけから推論されるため、および面形 状の選択はグローバル整合性の過程中変更されてもよいために(例えば、平面か
ら球面に)、全部の適切な近傍は第2の繰り返し中に全然見出されないことはあ
りうる。すなわち多数の繰り返しは、トポロジーとパラメータ推定との間の一致
に集中することが要求されてもよい。
【0040】 したがって、イメージプロセッサは新しい近傍に対する仮定を作り出すことに
よって各反復の開始にトポロジーを更新する。この仮定はローカル位置決めによ
って立証あるいは反論され、隣接関係グラフGの弧(結合トレース)のような立
証近傍だけを追加する。シーンの蛇行走査によって捕獲される一連の画像に対す
る典型的な隣接関係グラフ500は図5(a)および図5(b)に示される。図
5(a)において、弧504は時間的に重なる画像502n(ここで、nはシー ケンスにおける画像番号である)を相互に接続し、システムは最初の線形トポロ
ジーが識別されるように1つの処理パスを形成した。図5(b)は、隣接関係の
更新仮説を示す弧506を追加する次のトポロジー(例えば、第2の繰り返し)
を示す。新しい対象近傍は、画像の次のグローバル推定および近接への影響を含
むいろいろな判定基準を使用して選択されてもよい。
【0041】 1.既存のトポロジーは、新しい弧を追加がグローバルパラメータ推定の精度
に最大の影響を及ぼす場合を左右する。ループを閉じるかあるいは2つのワイプ
を一緒に結合する第1の弧は重要であるが、多数の他の近くの弧を平行にするも
のではない。正確なグローバルアライメントに対するトポロジーのあらゆる可能
な重なり対を含むことは重要でなくまた計算上有効でない。したがって、いかな
るローカル領域内の弧の密度をも制限することが望ましい。
【0042】 2.現トポロジーおよびグローバルパラメータ推定のセットPiは、考察中の 任意のフレーム対に対する相対空間位置および不確定を決定する。最も重なる可
能性がある対を選択し、ローカルアライメントが大きな範囲を探す必要がないよ
うに最も少ない位置不確定を有することが望ましい。
【0043】 高いペイオフ(影響)の弧は高いリスク(位置不確定)を有する非常にしばし
ば画像対であるので、2つのぜひとも望ましいものは通常直接対立している。本
発明は、最大影響よりもむしろ最大重ね合わせによって対象弧を優先させ、さら
に既存の弧にあまりにも接近している弧をスキップする。繰り返しが進むにつれ
て、グローバルパラメータ推定は精度を増加させ、適度な重なりおよび不確定を
有するまで高いてこ力対をより接近して引き出し、グラフGに位置決めされ、追
加されるようになることが予測される。
【0044】 特に、トポロジー決定モジュール304内で、対象近傍は、パス長Dijに関す
るその弧長dijを考察することによって追加される。弧長は、曲げられたフレー
ム“半径”ri,rjによって正規化されたモザイク面上の曲げられた画像中心x i ,xj間の距離によって規定される。
【0045】
【数2】
【0046】 パス長Dijは、既存のグラフの節点i,j間の最少合計パスに沿っての弧長の
合計として規定される。弧を追加するために、dijは、最大限度を超えてはなら
なく、Dijよりも著しく短くなければならなく、画像信頼性の大きさpij(下記
を参照)は高くなければならない。この発見的方法は、両方が良好な重なりを有
する弧を選択する傾向があり、グローバルバンドルブロック調整に非冗長的制約
を加える。
【0047】 各隣接画像対に関しては、画像iの各点uに対して、画像jの点u′=Qij
u)が物理的シーンの同一点に対応するように相対マッピングQijを推定するこ
とが望ましい。絶対ピクセル対シーン校正はめったに予め規定されていないので
、この対応関係はIj(u′)およびIi(u)の様相を一致させることによって
推論されねばならない。この推定を実行する方法は、光学フロー、動きおよびス
テレオ推定のようなさまざまな技術において公知である。米国特許第5,649
,031号を参照。
【0048】 シーンの特徴が非常に予測可能であるかあるいは相関されている場合、ゼロの
重なりあるいは画像対間の間隙さえ有する画像対を位置決めすることができる。
H.Sunら著の「凸面セット上の投影を使用する損傷を受けたブロック変換符
号化画像の隠蔽(Concealment of Damaged Block
Transform Coded Images Using Projec
tions onto Convex Sets)」(IEEE Trans.
Image Process.,4(4):470‐477,Apr.1995
は、このような位置決め問題を解決するのに関連する技術として外挿対策および
サイドマッチ対策を開示している。
【0049】 しばしば、Qijは、投影マッピングあるいは順変換のようなマッピングのパラ
メータ系に限定される。簡単なパラメータモデルは本当のマッピングの近似のみ
であり得るが、より高次のモデルよりも推定するのがより速く、より信頼性があ
る。確かに、マッピングの種類はグローバル整合性の間推定されるマッピングP i と同じである必要さえない。
【0050】 より詳細には、本発明は、ローカルアライメント問題を増加する複雑さのモデ
ルが画像間の対応関係を生じさせる間に推定される工程に分割する。最初に、図
3のローカル粗位置決めモジュール304内で、2次元変換だけの大きな範囲が
調べられ、確固不動の粗い対応関係が生じる。画像は複数のブロックに分割され
、各ブロックは、合致対策のような正規化相関に関する粗/精検索によりその対
応関係を生じさせる。ブロック間の多数の一致が2次元変換を計算するために使
用される。
【0051】 一旦変換の適度な推測が利用可能であると、より正確なアライメントは、複雑
なモデルを徐々に適合させ、ラプラシアンピラミッドにわたって粗/精方法で二
乗和差(SSD)エラーの大きさを最少にすることによってローカル精位置決め
モジュール306を使用して実行される。
【0052】 ピラミッドの各レベルで、未知パラメータは、下記の式によって数値を求めら
れる。
【0053】
【数3】
【0054】 最も粗いレベルの最初の2次元変換パラメータおよびその後に改良された各レ
ベルからのパラメータはIjを曲げるために使用され、パラメータの次の増分は レベンバーグ‐マークワッド(Levenberg‐Marquardt)反復
法を使用して数値を求められる。ローカルアライメントは、アフィン、それから
投影パラメータ使用して徐々に行われ、隣接フレーム間の正確な対応関係を生じ
させる。一般に、重なりが最低10%であってもよい場合さえ、徐々に複雑にな
る技術はフレーム間の適切な対応関係を与える。
【0055】 不正確なQij推定がグローバル整合性工程に過度に悪影響を及ぼすことを防止
するために、信頼性の大きさpijが計算される。この大きさは、アライメントパ
ラメータの不十分な推定を捨てるように閾値化され、グローバル整合性の間重み
係数としても適用される。計算されたQijを使用して、生じる基準画像および曲
げられた画像は、下記の1つによって比較される。すなわち、(i)平均(中間
値)絶対値あるいは二乗ピクセル値エラー、(ii)通常のフロー量、(iii
)pを計算する正規化相関。正規化相関は最も信頼性のあるアライメントの大き
さを示す。
【0056】 トポロジー決定モジュール304および対状ローカルアライメントモジュール
302および306の処理工程はフレーム間のローカル最大重なりをもたらす。
ローカルアライメントパラメータが全体的にも矛盾していない場合、式1のコス
ト関数が自動的に最適化される。しかしながら、一般に、ローカルアライメント
パラメータは隣接フレーム間の適切な対応関係を与えるが、さらにモザイク座標
系に対する各フレームのマッピングのための矛盾しないアライメントパラメータ
を与えなくてもよい。式1のエラー関数を最適化するために、トポロジー決定お
よびローカルアライメントが第2項、すなわち領域項のローカル最少値を実行し
たと仮定される。次に、固定され、ローカルアライメントによって与えられた重
なる領域の対応関係に基づいたフレーム間の重なりに関しては、第1の項はグロ
ーバルアライメントパラメータに関して最少にされる。
【0057】 グローバル整合性モジュール308内で、基準/画像マッピングの共同最適の
セットPiは、2つの係数、すなわち(1)これらのマッピングと相対マッピン グQijとの間の不整合性、および(2)Piについての直観的な情報からの偏差 をトレードオフするグローバル判定基準を最少にすることによって決定できる。
【0058】
【数4】
【0059】 Pi(x)およびPj(x)が全ての基準点xに対する同じシーン点に対応する
条件は、Qij(Pi(x))=Pj(x)である場合、保証することができる。同
様に、指示された逆関数が存在する場合、第iのソース画像の全ての点uに対し
てPj -1(Qij(u))=Pi -1(u)である。いくつかあるいは全ての点にわた
って重み付けられ、合計されたこれらの式(あるいはそのある程度の確固不動に
する非線形関数)のいずれかの二乗エラーはEijを構成する。
【0060】 実際には、点の部分集合だけが選択される。確かに、ローカル位置決め技術は
、まばらな点の集合に対してQijだけを決定し、全部は、画像特徴の効率あるい
は欠如の理由のために画像iとjとの間で重ならない。たとえQijがどの部分も
既知であるとしても、全ての点にわたって合計することは有効でもなくまた必要
ない。点を選択するいくつの可能な判定基準は、 (1)点の周期的あるいは確率的なサンプリング、 (2)大きい画像特徴突起部、例えば、線および角を有する点、 (3)重なる領域の周辺点あるいは角点を含んでいる。
【0061】 点の部分集合あるいは全集合にわたって合計されるエラーEijは、Piおよび Pjの閉形関数として時には示すことができる。一方、エラーは明示和として残 すことができる。どちらの場合でも、エラー関数の数値計算はソース画像ピクセ
ルへのアクセスを必要にしないので、非常に有効である。
【0062】 一方、各隣接対に対する正確なQijを厳密に推定する代わりに、ローカル位置
決めは、確かさ間隔、共分散、確率分布、コスト関数等によって特徴付けられる
ファジーあるいは不確実な推定を行うことができる。これにより、画像特徴の不
足はQijの正確な推定を不可能にし得ることが分かる。一方、QijとPi,Pj
の間の不整合性は、したがってモザイクの可視的一致にあまり不利益でないかも
しれない。したがって、エラー項Eijはこの不確実性情報を十分利用する。
【0063】 さらに進めると、ローカル位置決め工程は画像一致エラー、例えば、下記の式
であるコスト関数を単に供給できた。
【0064】
【数5】
【0065】 この場合、グローバル整合性はEijの数値を求めるようにソース画像ピクセル
にアクセスしなければならない。一方、このマッチングエラーはEijの複雑さを
減少させる関数近似に適当であり得る。
【0066】 エラー項は2進画像比較に限定される必要がない。3つあるいはそれ以上の画
像がある程度の領域で重なる場合、(Pi,Pj,Pk,...,Qij,Qjk,. ..)の中の不整合性を判断する関数が考えられる。一般に、グローバルエラー
関数はΣcCcを含み得る(ここで、Cは相互近傍の小集団の集合である。) 1997年11月10日に出願された共通に譲渡された米国特許出願第08/9
96,776号の開示は単一の小集団の場合と見なすことができる。ここで、E c は画像の間の全マッチングエラーであり、Piは特定のパラメータで表した系に
属する。
【0067】 基準/画像マッピングに対するいかなる種類の直観的な望ましい特性もグロー
バル整合性に含めることができる。例えば、画像が基準座標系の指定原点を囲む
モザイクに置かれることが通常望ましい。同様に、グローバルスケール、回転、
あるいは他の歪みを最少することが望ましいこともある。他の情報源はカメラの
位置および向きの物理的測定であってもよい。全てのこのような判定基準はエラ
ー項Eiを構成するPiの関数として示すことができる。
【0068】 最後に、ある種の応用では、ソース画像が互いに整列するばかりでなく、所与
の基準画像、マップ、あるいは予め構成されたモザイクともまた整列する。1つ
の例は、広い視野画像以外はより低い解像度を有する狭い視野画像を位置決めし
ている。他の例は、航空画像と衛星映像との地球位置決めである。したがって、
エラー項Ei,refはグローバル整合性に加えられる。Piはしばしばマッピングの
パラメータで表した系に限定され、その場合、この最適化問題の領域は有限次元
ベクトルである(これは本発明にとって重要でない)。それにもかかわらず、グ
ローバルエラー判定基準Eは一般的には未知数Piの複雑な関数であり、反復解 だけは可能であるかあるいは実際的である。最適化に対するいろいろな有効なア
ルゴリズムがある。下記の方法の組み合わせを応用してもよい。
【0069】 最も急勾配の降下、対の傾斜、ガウス‐ニュートン、レベンバーグ‐マークワ
ッド等に限定されない以外を含む当該技術で公知の数値最適化アルゴリズムは、
Eを直接最少にするために使用されてもよい。最後に、異常値に敏感である最適
化方法はこの推定を行うために使用されてもよい。
【0070】 この問題の大きさは大きくてもよいので、バッチ方法で全ての未知値にわたっ
てEを同時に最少にすることは計算上高価でおよび/またはゆっくりと集中し得
る。グローバルエラーをより簡単な下位の問題に分解する制御方法は適切である
。すなわち、 1.より低次モデルがより早い繰り返し中に推定される段階的な複雑さ。
【0071】 2.画像(すなわちエラー項)が徐々に全エラーに加えられる反復方法。画像
が生のビデオシーケンスから得られ、Piが各フレームが得られるとき実時間で 更新できる場合、これは当然の方法である。
【0072】 3.トポロジーは既知であるために、画像は近傍のクラスタに分類することが
できる。まず第一に、エラーは、ローカルモザイク/画像マッピングを含む“ロ
ーカルモザイク”座標フレームが構成される各クラスタ内に別々に最適化される
。第二に、グローバル基準/ローカルモザイクマッピングは、クラスタ間で交差
するEij項だけを含むエラー判定基準に関して最適化される。最終結果はなおグ
ローバル基準/画像マッピングPiのセットである。
【0073】 偏微分方程式を解く既知のマルチグリッドアルゴリズムおよび適応メッシュ有
限要素アルゴリズムと同様に、この2つのレベルグルーピング方式は、したがっ
てグルーピングの階層に一般化される。推定は、より大きなクラスタにわたる最
適化の結果を使用して階層を上下に循環でき、内部に含まれるより小さいクラス
タの集束に役立つ、その逆も同様である。
【0074】 最適化は、Piの推定をある程度適度に始めることによって初期設定されるべ きである。示唆された技術は近傍GのグラフのスパンツリーTを選択することに
あり、E=ΣijTijを最適化することによって始める。サブグラフTにはル ープが全然ないので、Tの近傍のあらゆる対に対して正確にPj(x)=Qij( Pi(x))を単に得ることによってこのエラーを最少にすることができる。特
別の場合として、Tが時間的に隣接するフレームの全ての対である場合、これは
フレーム/フレームマッピングの線形連鎖を構成するにすぎない。
【0075】 実施例 この節は、異なるパラメータで表すことが使用される5つの例のシナリオを提
供する。表記:3次元ベクトルX=(X1,X2,X3)に対して、X=X/|X |を規定し、2次元ベクトルu=(u1,u2)に対して、u=(u1,u2,1)
およびu=(u1,u2,u12,1)を規定する。さらに、P2の同綴異議語法 はx=AXとして記述されるが、出力ベクトルがユークリッド形として記述され
る場合、u=AXである。
【0076】 実施例1:平面モザイク 自由に移動するカメラによって得られたビデオシーケンスからの平面の継ぎ目
なしのモザイクを作成するために、基準/画像マッピングならびに相対画像/画
像マッピングは投影マッピングによって十分示されている。
【0077】 ローカル粗位置決めは、効率のために純変換マッピングを使用するのに対して
、ローカル精位置決めは投影マッピングを使用する。トポロジーは一回再計算さ
れ、その変換シフト推定QijがPiの予備推定を示すために単に積分されるロー カル粗位置決めを続ける。
【0078】 グローバル整合性は、形式u=Ai -1xの共同最適基準/画像マッピングを決 定することを試みする。したがって、逆マッピングはx=Aiuである。
【0079】 全エラー関数Eは2種類の項からなる。
【0080】 1.隣接画像の各対に対して、
【0081】
【数6】
【0082】 ここで、ukは、画像間の重なりの角(一般的には4点)である。この項は基 準/画像マッピングとローカル位置決めとの間の不整合性を不利にする。
【0083】 2.各画像に対して、
【0084】
【数7】
【0085】 ここで、α1、α2、β1、β2はソース画像の上側、左側、下側および右側の中
点である。この項は、モザイクに曲げられる場合、画像のスケール、回転および
歪みを不利にする。さらに、項|Ai(0,0,1)|2は、1フレームの変換を
固定するためにEiに追加される。
【0086】 これらの項がない場合、全基準座標系に応用された任意の投影変換はEに影響
を及ぼさないので、Aiに対する解は不十分に決定される。
【0087】 グローバルエラーは下記のように最適化される。まず第一に、Aiは、スパン ツリー内のローカル位置決め投影マッピングを構成することによって初期設定さ
れる。第二に、Ei項だけの和は更新Ai←B0iに関して最少にされる。ここで
、BOは共通投影マッピングである。第三に、全Eは更新Ai←Biiに関して最
少にされる。ここで、Biは毎画像投影マッピングである。最後の2つの工程に 関しては、最適化は、Bの係数に関するEの第1の導関数だけを必要とするガウ
ス‐ニュートン(レベンバーグ‐マークワッド)法を使用して実行される。
【0088】 全トポロジー推論およびローカル/グローバルアライメントフレームワークは
図5(a)および図5(b)に示されている。第1のサイクルは時間的近傍のデ
フォルトトポロジーだけで開始する。ローカル推定器は粗い変換Qijを得て、グ
ローバル推定は単にこれらの変換を基準/フレームパラメータPiに連結する。 第2のサイクルは、非連続空間近傍を検出し、投影モデルのローカル推定を実行
し、それからグローバルパラメータを最適化する。この例では、トポロジーは2
サイクルに集中する。
【0089】 実施例2:球面モザイク 継ぎ目なしのモザイク表示を構成する本発明のフレームワークが一般的である
ことを示すために、この例は固定点の周りに回転するカメラによって得られたビ
デオシーケンスからの任意の3次元シーンの継ぎ目なしのモザイクの作成を示す
。レンズ歪みを含むカメラパラメータは未知である。この場合、基準面に対する
最適形状はモザイク表示の角度範囲に全然制限を与えない球面である。画像/画
像マッピングはなお投影マッピングによって十分示されているが、球面/画像マ
ッピングは示されていない。投影マッピングは3次元回転およびカメラ校正パラ
メータに変換され、球面の2次元トポロジーを推論し、ならびに全体に整合する
回転パラメータおよび校正パラメータの数値を求める。
【0090】 ローカル粗位置決めは回転/変換マッピングを使用するのに対して、ローカル
精位置決めは投影マッピングを使用する。トポロジーは一回再計算され、その変
換シフト推定QijがPiの予備推定を示すために単に積分されるローカル粗位置 決めを続ける。
【0091】 グローバル整合性は、形式u=FRi TXの共同最適基準/画像マッピングを決
定することを試みる。ここで、Fは上部三角カメラ校正マトリックス、Riは正 規直交回転マトリックス、およびXは単位球面基準面上の3D点である。Har
tley著の「回転カメラに関する多重視野からの自己校正(Self‐cal
ibration from Multiple Views With a
Rotating Camera)」(ECCV,pp471‐478,199
4)に開示された方法は全てのQijから共通Fを推定するために使用される。こ
の推定を使用して、逆マッピングはX=Rj-1uとして記述できる。同じFが 各フレームに対して有効であると仮定される。
【0092】 全エラー関数Eは画像対に対する不整合性項からだけなる。
【0093】
【数8】
【0094】 モザイクの中心画像に対して、Roは恒等式として固定される。
【0095】 グローバルエラーは下記のように最適化される。まず第一にRiはスパンツリ ーの各Eijをローカルに最少にすることによって初期設定される。第二に、全E
は更新Ri←Biiに関して最少にされる。ここで、Biはガウスニュートン法を
使用する毎画像マトリックスである。他の方法は、関数Eの非線形最適化の各繰
り返し中共通Fマトリックスおよび個別のRマトリックスの両方を更新すること
にあることに注目すべきである。
【0096】 球面モザイク面に対する全トポロジー推論およびローカル/グローバルアライ
メントフレームワークは図6(a)に示されている。第1および第2のサイクル
(図6(a)および図6(b))は、球面パラメータの表示は第2のサイクルの
グローバル最適化で使用される。この段階で、360°パノラマは閉じていない
。しかしながら、端部は、十分近くにあるので、第3のサイクル中(図6(c)
)、ループ閉包は仮定され、立証され、全体的に整合している推定に組み込まれ
る。この例では、トポロジーは3サイクルに集中する(図6(d))。
【0097】 実施例3:ストリップスキャナモザイク 本発明は、空中パノラマカメラによって得られたストリップからの地上監視シ
ーンの継ぎ目なしのモザイクを作成するために使用されてもよい。このようなカ
メラは、航空機が理想的には一定高度で一直線で飛ぶ間、下方に向いており、両
辺に振動する。各振動は、ストリップ…通常の高さであるが延ばされた幅の連続
画像を形成する。中央の天底観察位置からの離れた所の増加する傾斜のために、
ストリップにわたってカバーされる地上距離は中心から離れて所で増加する、例
えば、画像は“蝶ネクタイ”状である。中心近くのストリップ間の地上カバレッ
ジの重なりはより少なく、時には重なりが全然ない。それにもかかわらず、本発
明の技術は、仕上がったモザイクのギャップを有しているが、なおストリップを
整列させる。
【0098】 この場合、基準面に対する最適の形状は、その軸が飛行経路である円筒である
。円筒からソースストリップへの理論マッピング関数は多少普通ではなく、この
ようなモデルを利用することは校正を必要とし、理想的飛行経路からの逸脱に我
慢できない。したがって、便利な代替物は、各ストリップをより小さい隣接部分
画像の集合に分割し、これらをグローバル整合性の間に追加制約を除いて独立し
て得られた画像と同様に取り扱う。隣接ストリップから隣接部分画像間のマッピ
ング関数はアフィンであり、基準円筒/部分画像マッピングは逆双一次である。
【0099】 トポロジー決定は制御されたカメラの動きにより自明である。ローカル粗位置
決めは効率のために純変換マッピングを使用するのに対して、ローカル精位置決
めはアフィンマッピングを使用する。異なるストリップの近傍だけは、同じスト
リップの部分画像の間のローカル関係が既知であるので、位置決めされる必要が
ある。
【0100】 グローバル整合性は、形式Aiu=xの共同最適基準/画像マッピングを決定 することを試みる。ここで、xは平坦円筒基準面上の2次元点である。 Eに対する完全式は2種類の項からなる。
【0101】 1.隣接画像iおよびjの各対に対して、
【0102】
【数9】
【0103】 2.他の項は、基準に曲げられた場合、部分画像の形状の滑らかさからの逸脱
を不利にする。
【0104】 同じストリップの隣接部分画像i,jの角が同じ基準座標、すなわちAiγk
iδk,k=1,2に対応する厳密な制約を受けるグローバルエラーは最少にさ
れる。ここで、γk,δkは部分画像の上下左右の角である。Eijは未知数の二次
方程式であるので、解は直接得ることができる。
【0105】 実施例4:ID走査 本発明は1次元走査でモザイクを作成するために使用することもできる。従来
技術では、1次元の360°パノラマの作成は公知であるが、パノラマは、カメ
ラが光学軸に垂直であり、カバーされた角度が実際に360°である軸の周りに
正確に回転する制約の下で作成される。本発明を使用すると、このような位置決
め制約および回転制約は緩和され、携帯カメラは光学軸の許容傾斜で1次元走査
を生成するために使用できる。本発明は、パノラマ面の閉包を生じる場合、それ
を自動的に検出することもできる。
【0106】 カメラがある固定軸の周りにほぼ回転している場合、下記は1次元走査の事例
を調べている。光学軸に直角である軸の特定の場合、パノラマは本来円筒上で作
成される(従来技術と同様に)。一般的な場合、光学軸が傾斜されてもよいとき
、多様体は傾斜の角度と同じ頂点角を有する円錐である。従来技術がカメラが傾
斜軸の周りに回転される1次元走査に応用される場合、モザイクは効率的に円錐
上に形成され、円錐が平面上に展開される場合、全モザイクは曲げられる(“ス
マイリー”面効果と見なされる)。
【0107】 曲げられたモザイクの作成および修正は多数の異なる方法で行うことができる
。図7は、円錐上の画像場所の投影の幾何学を示している。本来、各画像の中心
の周りの垂直ストリップが連続画像間の2次元回転パラメータおよび変換パラメ
ータを使用して整列される場合、それはアライメントを実行する前に中央ストリ
ップを円錐上にマッピングすることと等価である。円筒の特別の場合、1次元変
換だけで解を求める必要がある。さらに、2次元回転は、カメラが携帯であると
いう事実のために生じるかもしれない任意の面内回転に注意する。円錐上のモザ
イクが場所上に展開される場合、その幾何学は図8に示されるようである。焦点
距離を大体知ることによって、円錐角θは、tanθ=f/Lによって与えられ
る。ここで、Lは平坦にされたモザイクから決定できる。θを使用すると、画像
はθだけのx軸の周りの回転に対応して曲げることができ、したがって円筒マッ
ピングは使用されてもよい。
【0108】 一方、元のビデオ画像から修正された円筒モザイクへの直接の曲げを作成でき
る。円筒モザイク(図7)の平面マッピングの任意の点(l,y)は、下記の式
のようにマッピングされる。
【0109】
【数10】
【0110】 ここで、α=l/Lおよびl,L,yは図7に示されるようである。
【0111】 さらに、360゜閉包の自動検出は、円錐/円筒モザイク修正と結合でき、標
準パノラマビューアのいずれかを使用して見ることができる継ぎ目なしの1次元
円筒モザイクを形成する。
【0112】 初期並進アライメント後の1次元モザイク生成処理の概要は下記の通りである
【0113】 1.連続フレーム間の2次元回転および並進を計算する。
【0114】 2.品質計量のアライメントおよび評価によってシーケンスの第1のフレーム
と他のフレームとの間の自己閉包を検出する。
【0115】 3.各フレームの中央線を交差することによって図7のLを計算する。
【0116】 4.式3を使用して修正された平面モザイクを適切なビデオフレームにマッピ
ングすることによって各ピクセル[ly]Tを修正された平面モザイクに充填す る。
【0117】 実施例3:3次元表示 前述されるような本発明は、2次元映像からのシーンのモザイクを作成する。
3次元構造の計算およびその表示は、前述の議論で明確に取り扱われていない。
下記は、本発明の範囲を拡げる例示的な処理を示し、3次元シーンを表示する3
次元モザイクの生成を含む。シーンの3次元表示を処理し、利用する従来技術は
、見える地点のローカル集合体からの画像に基づく3次元表示を開示している1
995年7月10日に出願された米国特許出願第08/499,934号に開示
されている。本発明は、これらの技術を拡張するために使用でき、拡大シーンの
3次元球面モザイク表示を作成する。
【0118】 所与の観察地点からのシーンの3次元情報を表示するために、2次元球面モザ
イクは、所与の観察地点から、次にカメラの位置を変えることによって若干以上
の観察地点(一般的には1つ以上であるがより多くてもよい)から作成される。
この処理はシーンの拡大画像の各々を選択されたカメラ位置から作成する。あら
ゆる観察地点から球面モザイク表示を作成する1つの主要な長所は、各々のこの
ような観察地点がこの観察地点からの正当な単一の画像よりも非常に広い視野を
与えるということである。カメラの相対向きと第一フレームに関してシーン深度
を演算することは、一般に視野の制限に起因して不明確である傾向がある。K.
J.Hannaら著「シーン構造の直接推定のためのステレオおよび動きの解析
の結合(Combining Stereo and Motion Anal
ysis for Direct Estimation of Scene
Structure)」(Intl.Conf.Comuter Vision
,Berlin,May 1993,pp353‐365)に記載されている特
定技術は、球面画像に関するシーン深度(あるいは視差)を計算するために使用
できるので、1つの球面観察地点からの全3次元表示を行う。
【0119】 図9は、球面モザイクを使用するシーンの3次元表示を作成する際に必要とさ
れるステップのシーケンスを示す流れ図900を示している。このステップは下
記の通りである。
【0120】 1.ステップ902では、この処理は固定カメラ位置から見られた全ての可能
な位置をカバーする一連のフレームを捕獲する。次に、カメラは、シーケンスの
集合が同じシーンをカバーする多数のカメラ位置を使用して捕獲されるまで、他
の一連のシーケンス等を捕獲するように移動される。異なるカメラ位置は、互い
に近くにあり、3次元情報が映像から計算できるように位置を変えるために3次
元シーンの視差情報を提供する。
【0121】 2.各カメラ位置に対しては、ローカル対応関係情報をグローバルアライメン
トと結合する前述の方法を使用してこの位置の周りの球面上に(ステップ904
で)モザイク表示を作成する。この処理は本来、任意の単一の位置からのシーン
の可能な最も広い視野を作成する。したがって、これらの単一位置表示の多くの
間のカメラ観察地点変換を計算する問題は、非常に安定して、うまく機能されて
いるべきである。
【0122】 3.ステップ906で、多重球面表示の位置の3空間の近似トポロジーを使用
して、ルーチンは、最初に、隣接球面モザイク表示間の対状のエピ極変換をこの
表示にわたる識別可能な点を相関付けることによって計算する。球面対を整列さ
せるこれらの変換は2球面変換と呼ばれる。
【0123】 4.開始点としての2球面変換の場合および全ての球面表示の3空間トポロジ
ーを与えられると、ステップ908で、ルーチンは、2次元モザイク作成のため
に前述のローカル/グローバルアライメント方法の範囲を拡げ、基準球面モザイ
クに関する全て2球面のための3次元回転および並進変換を同時に計算する、す
なわち前述の2次元反復処理は3次元映像を処理するために拡張される。
【0124】 5.計算されたグローバル3次元画像変換の場合、次に、ステップ910で、
ルーチンは、K.J.Hannaら著「シーン構造の直接推定のためのステレオ
および動きの解析の結合(Combining Stereo and Mot
ion Analysis for Direct Estimation o
f Scene Structure)」(Intl.Conf.Comute
r Vision,Berlin,May 1993,pp353‐365)に
記載された方法を使用して基準2球面に関する密集した深度/視差マップを計算
する。
【0125】 6.前述のステップで作成されたパラメータおよびマップを使用して、ステッ
プ912でルーチンは3次元球面モザイクを生成する。
【0126】 上記の方法は、図2および3のシステム内で使用でき、映像を得られた“ステ
レオ球面モザイク”を構成し、2つあるいはそれ以上の球面モザイクを入力とし
て構成する(すなわち、反復処理の2次元処理を使用するよりもむしろ、3次元
処理が処理される)。
【0127】 モザイク作成‐一般化形式 固定(パン/ティルト/ズーム)カメラからのシーンの複数画像を表示する単
一座標系の多数の異なる表示は前述された。これらは、2次元の区分的に平面な
座標系から固定焦点撮像シナリオのための球面表示に対する単一軸のための円筒
/円錐座標系までの範囲に及ぶ。
【0128】 カメラが周囲を通って移動される場合、一般に、カメラは向きを変え(回転す
る)、位置を変える(並進する)。この場合、シーンのモザイクは、投影の1つ
の中心におよび/またはその周りに置かれた座標系によって作成できない。本発
明はいくつかの特定の状況に対してこの問題を解決するために使用できる。
【0129】 カメラの任意の動きによってモザイクを作成するためにここで利用された主要
な考えは、明示的深度再構成は全然必要ないということである。モザイクは、画
像の接近して間隔をあけられた位置決めされたストリップを一緒に集めることに
よって作成される。
【0130】 本発明のこの実施の基本的な考えを記載するために、本発明は最初に、3次元
モザイクの最も簡単な場合に関して記載されている。すなわち、カメラは、一直
線に移動し、動きの方向に直角に向ける。画面はこの場合全て同じ平面にある。
連続画像および連続動きと仮定すると、各画像の中央垂直ラインは、この画像だ
けに、したがってこれらの中央ラインを一緒に積み重ねることによって確認され
、任意の範囲の3次元モザイクが作成できる。
【0131】 このようなモザイクを作成する他の方法は、xyt立方体の画像の各々を積み
重ねることにある。ここで、xyは空間画像座標系、tは時間次元である。連続
場合(密集したサンプリングの場合)、y=yc(ここで、ycは画像の中心のy
座標である)平面に沿ってこの立方体を通るスライスは所要のモザイクを作成す
る。
【0132】 時間フレームの有限サンプリングのより現実的な状況において、任意の2つの
画像間のシーンのいかなる任意の画像も2つの連続画像間のフローベクトルの線
形補間によって作成できることが技術上示された。これは、捕獲されたフレーム
が粗く時間サンプルされた場合さえ、任意の密集した時間サンプリングは画像補
間によって作成できることを意味する。一旦このようなサンプリングが利用可能
であると、モザイクの作成は前述のようにありふれている。密にサンプルされた
全画像フレームは各フレームの中央スリットだけ以外は作成される必要がないこ
とに注目すべきである。
【0133】 各カメラの位置の単一の平面画像の代わりに、円筒モザイクが動きの方向の周
りにカメラ光学軸を回転させることによって捕獲される場合、各点で作成された
パノラマモザイクからの中央円形リング(まさしく直線でない)は、その軸がカ
メラの動きの方向である単一360°円筒モザイクに集めることができる。
【0134】 次世代の前述の平行運動の場合は、またカメラの直線運動の場合であるが、カ
メラにおいて、光学軸は運動方向に直角でない。この場合、全ての画面は平行で
あるが同じ平面にない。最初に、このより一般的な場合は純パノラマ変換により
各画面を総合的に修正することによって同じ平面にある画面の場合に減少される
ので、得られる合成された画像は全て同じ平面にある。修正に対する周知の技術
が存在する。一旦修正画像が連続フレーム間のフローを補間することによって得
られると、画像のいかなる任意の直線もモザイクを作成するように処理できる。
【0135】 特に興味がある事例は前方に向け、前方に移動するカメラの事例である。この
場合、運動の方向および光学軸の方向は同じである。この場合もまた、原則とし
て、これらの画像は大いに曲げられてもよいけれども、シーンの修正された横に
傾いた画像を作成することができる。
【0136】 カメラが任意の経路に沿って移動する場合、カメラ投影中心の全ての軌跡は一
般に直線でない3空間の1次元曲線である。この場合はまた、修正画像はカメラ
が撮影する経路の区分的な線形近似によって作成される。前述の表示を結合する
ことによって、この場合、一般化された円筒はモザイクを作成するために使用で
きる。1次元カメラ経路は一般化された円筒の軸であり、修正された映像の適当
なリング部は一般化された円筒表示を計算するために一緒に縫い閉じられる。
【0137】 本発明の教示を組み込むいろいろな実施形態はここに詳細に示され、記載され
ているが、当業者は、これらの教示をやはり組み込む多数の他の変更された実施
形態を容易に発明できる。
【図面の簡単な説明】
【図1】 カメラが蛇行している(パンおよび走査)パターンで移動するときにカメラに
よって捕獲された一連の重なり画像を示す。
【図2】 本発明を実施するために使用される汎用コンピュータシステムのブロック図を
示す。
【図3】 本発明の機能ブロック図を示す。
【図4】 本発明によって実行される処理工程を示す流れ図である。
【図5】 (a)、(b)は平面に関する画像相互関係の概略図を示す。
【図6】 (a)〜(d)は球面に関する画像相互関係の概略図を示す。
【図7】 本発明の1次元走査実行のために円錐上への画像投影の幾何学的形状を示す。
【図8】 円錐から円筒面へのマッピングされたモザイク画像の概略図を示す。
【図9】 球面モザイクを使用する3次元表示を形成する処理を示す流れ図を示す。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),CA,IL,J P,KR (72)発明者 ソウニー, ハープリート, シング アメリカ合衆国, ニュー ジャージー 州, クランベリー, メルヴィル ロー ド 17 (72)発明者 バーゲン, ジェイムズ, アール. アメリカ合衆国, ニュー ジャージー 州, ホープウェル, イースト プロス ペクト ストリート 57 (72)発明者 ディクソン, ダウ アメリカ合衆国, ニュー ジャージー 州, ホープウェル, センター ストリ ート 13 (72)発明者 ゲンデル, ギャリー アメリカ合衆国, ニュー ジャージー 州, ネシャニック ステーション, ド ッグウッド ドライヴ 17 (72)発明者 パラガノ, ヴィンス アメリカ合衆国, ニュー ジャージー 州, ローレンスヴィル, バンカー ヒ ル ロード 71

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 複数の画像を位置決めする方法であって、 (a)隣接画像として近傍である前記複数の画像における前記画像を識別する
    前記複数の画像のトポロジーを決定するステップと、 (b)前記隣接画像を互いにローカル(局所的)に位置決めし、前記隣接画像
    の関係を互いに規定するパラメータを生成するステップと、 (c)グローバル整合性計算を実行し、基準面に関する前記パラメータを最適
    化するステップと を含むことを特徴とする方法。
  2. 【請求項2】 ステップ(a)およびステップ(b)が前記パラメータを生
    成するために繰り返されることを特徴とする請求項1に記載の方法。
  3. 【請求項3】 ステップ(b)がさらに、 (b′)前記隣接画像を粗く位置決めし、粗いパラメータを発生し、 (b″)前記隣接画像を細かく位置決めし、細かいパラメータを生成すること
    を含むことを特徴とする請求項1に記載の方法。
  4. 【請求項4】 最適化パラメータを使用して前記複数の画像のモザイクをレ
    ンダリングするステップをさらに含むことを特徴とする請求項1に記載の方法。
  5. 【請求項5】 前記基準面が任意の面であることを特徴とする請求項1に記
    載の方法。
  6. 【請求項6】 複数の画像を位置決めする装置であって、 隣接画像として近傍である前記複数の画像における前記画像を識別する前記複
    数の画像のトポロジーを決定するトポロジー決定モジュールと、 前記隣接画像を互いにローカルに位置決めし、前記隣接画像の関係を互いに規
    定するパラメータを生成する位置決めモジュールと、 グローバル整合性計算を実行し、基準面に関する前記パラメータを最適化する
    グローバル整合性モジュールと を含むことを特徴とする装置。
  7. 【請求項7】 前記トポロジー決定モジュールおよび前記位置決めモジュー
    ルが前記パラメータを生成するために繰り返して利用されることを特徴とする請
    求項6に記載の装置。
  8. 【請求項8】 前記位置決めモジュールがさらに、 前記隣接画像を粗く位置決めし、粗いパラメータを発生する粗い位置決めモジ
    ュールと、 前記隣接画像を細かく位置決めし、細かいパラメータを発生する細かい位置決
    めモジュールとを含むことを特徴とする請求項6に記載の装置。
  9. 【請求項9】 最適化パラメータを使用して前記複数の画像のモザイクをレ
    ンダリングする色合わせ/色混合モジュールをさらに含むことを特徴とする請求
    項6に記載の装置。
  10. 【請求項10】 前記基準面が任意の面であることを特徴とする請求項6に
    記載の装置。
JP2000505596A 1997-08-01 1998-07-30 モザイク画像を構成するためのローカル/グローバルマルチフレームアライメントを実行する方法および装置 Pending JP2001512252A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US5455897P 1997-08-01 1997-08-01
US8724298P 1998-05-29 1998-05-29
US60/054,558 1998-05-29
US09/087,242 1998-05-29
PCT/US1998/015879 WO1999006943A1 (en) 1997-08-01 1998-07-30 Method and apparatus for performing local to global multiframe alignment to construct mosaic images

Publications (1)

Publication Number Publication Date
JP2001512252A true JP2001512252A (ja) 2001-08-21

Family

ID=26733178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000505596A Pending JP2001512252A (ja) 1997-08-01 1998-07-30 モザイク画像を構成するためのローカル/グローバルマルチフレームアライメントを実行する方法および装置

Country Status (1)

Country Link
JP (1) JP2001512252A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014014647A (ja) * 2012-07-09 2014-01-30 Toshiba Corp 医用画像処理装置及び医用画像処理プログラム
CN109186618A (zh) * 2018-08-31 2019-01-11 平安科技(深圳)有限公司 地图构建方法、装置、计算机设备及存储介质
JP2019033344A (ja) * 2017-08-07 2019-02-28 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2020518913A (ja) * 2017-04-28 2020-06-25 影石創新科技股▲ふん▼有限公司Arashi Vision Inc. マルチパス画像に基づくパノラマ画像のアライメント方法、装置および携帯端末
CN112767245A (zh) * 2021-01-04 2021-05-07 航天时代飞鸿技术有限公司 基于多无人机实时视频图像的地图拼接构建的系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0514751A (ja) * 1991-06-28 1993-01-22 Nippon Hoso Kyokai <Nhk> パノラマ画像取り込み装置
JPH05342344A (ja) * 1992-06-08 1993-12-24 Canon Inc 画像処理方法及び画像処理システム
JPH06164890A (ja) * 1992-11-19 1994-06-10 Sharp Corp 画像処理装置
JPH0765189A (ja) * 1993-08-25 1995-03-10 Canon Inc 画像処理方法およびその装置
JPH0997326A (ja) * 1995-09-29 1997-04-08 Canon Inc 画像合成装置および方法
JPH09171550A (ja) * 1995-09-13 1997-06-30 Ricoh Co Ltd 画像断片継ぎ合わせ装置、画像断片整列装置、コンピュータ記憶媒体及び画像断片整列方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0514751A (ja) * 1991-06-28 1993-01-22 Nippon Hoso Kyokai <Nhk> パノラマ画像取り込み装置
JPH05342344A (ja) * 1992-06-08 1993-12-24 Canon Inc 画像処理方法及び画像処理システム
JPH06164890A (ja) * 1992-11-19 1994-06-10 Sharp Corp 画像処理装置
JPH0765189A (ja) * 1993-08-25 1995-03-10 Canon Inc 画像処理方法およびその装置
JPH09171550A (ja) * 1995-09-13 1997-06-30 Ricoh Co Ltd 画像断片継ぎ合わせ装置、画像断片整列装置、コンピュータ記憶媒体及び画像断片整列方法
JPH0997326A (ja) * 1995-09-29 1997-04-08 Canon Inc 画像合成装置および方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014014647A (ja) * 2012-07-09 2014-01-30 Toshiba Corp 医用画像処理装置及び医用画像処理プログラム
JP2020518913A (ja) * 2017-04-28 2020-06-25 影石創新科技股▲ふん▼有限公司Arashi Vision Inc. マルチパス画像に基づくパノラマ画像のアライメント方法、装置および携帯端末
JP2019033344A (ja) * 2017-08-07 2019-02-28 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP7030442B2 (ja) 2017-08-07 2022-03-07 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
CN109186618A (zh) * 2018-08-31 2019-01-11 平安科技(深圳)有限公司 地图构建方法、装置、计算机设备及存储介质
CN112767245A (zh) * 2021-01-04 2021-05-07 航天时代飞鸿技术有限公司 基于多无人机实时视频图像的地图拼接构建的系统及方法
CN112767245B (zh) * 2021-01-04 2024-03-29 航天时代飞鸿技术有限公司 基于多无人机实时视频图像的地图拼接构建的系统及方法

Similar Documents

Publication Publication Date Title
US6078701A (en) Method and apparatus for performing local to global multiframe alignment to construct mosaic images
CN105245841B (zh) 一种基于cuda的全景视频监控系统
US5963664A (en) Method and system for image combination using a parallax-based technique
US6870563B1 (en) Self-calibration for a catadioptric camera
JP4851239B2 (ja) 画像処理装置及びその処理方法
US8723953B2 (en) Generation of aerial images
EP1589482A2 (en) Three-dimensional image measuring apparatus and method
CN110390640A (zh) 基于模板的泊松融合图像拼接方法、系统、设备及介质
GB2561329A (en) Method and system for creating images
WO1998021690A1 (en) Multi-view image registration with application to mosaicing and lens distortion correction
CN105005964B (zh) 基于视频序列影像的地理场景全景图快速生成方法
CN113160048A (zh) 一种缝合线引导的图像拼接方法
EP0895189A1 (en) Method for recovering radial distortion parameters from a single camera image
CN112243518A (zh) 获取深度图的方法、装置及计算机存储介质
CN117274514A (zh) 基于地空视角几何变换的遥感图像生成方法及装置
JP4851240B2 (ja) 画像処理装置及びその処理方法
JP2002163647A (ja) レンズ歪み係数算出装置および算出方法、レンズ歪み係数算出プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001512252A (ja) モザイク画像を構成するためのローカル/グローバルマルチフレームアライメントを実行する方法および装置
JP4813263B2 (ja) 画像処理装置及びその処理方法
JP3540696B2 (ja) 画像合成方法、画像合成装置、画像合成プログラムを記録した記録媒体
CN110544203A (zh) 一种运动最小二乘法与线约束相结合的视差图像拼接方法
Sun et al. A novel algorithm to stitch multiple views in image mosaics
JP2004046573A (ja) チルト角算出方法、円筒パノラマ画像合成方法、ならびに円筒パノラマ画像合成処理プログラムを記録したコンピュータ読み取り可能な記録媒体
Cheng et al. Texture mapping 3d planar models of indoor environments with noisy camera poses
Qin et al. Aligning windows of live video from an imprecise pan-tilt-zoom robotic camera into a remote panoramic display

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080409

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080416

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080515

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080522

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080916