JP2014086948A - 撮像装置 - Google Patents

撮像装置 Download PDF

Info

Publication number
JP2014086948A
JP2014086948A JP2012235662A JP2012235662A JP2014086948A JP 2014086948 A JP2014086948 A JP 2014086948A JP 2012235662 A JP2012235662 A JP 2012235662A JP 2012235662 A JP2012235662 A JP 2012235662A JP 2014086948 A JP2014086948 A JP 2014086948A
Authority
JP
Japan
Prior art keywords
image
input
shooting
landmark
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012235662A
Other languages
English (en)
Inventor
Toshiyuki Muraoka
俊幸 村岡
Kazuhiro Kojima
和浩 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xacti Corp
Original Assignee
Xacti Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xacti Corp filed Critical Xacti Corp
Priority to JP2012235662A priority Critical patent/JP2014086948A/ja
Publication of JP2014086948A publication Critical patent/JP2014086948A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereoscopic And Panoramic Photography (AREA)
  • Studio Devices (AREA)

Abstract

【課題】複数の画像の位置合わせの精度を向上させる。
【解決手段】第1及び第2入力画像(310、320)の位置合わせを行う際、各入力画像の撮影地点の近隣に位置するランドマーク(LM)を特定し、当該ランドマーク(ランドマークの画像データ)が第1及び第2入力画像上に存在しているとき、当該ランドマークを基準にして第1及び第2入力画像の位置合わせを行う。例えば、第1及び第2入力画像上のランドマークが重なり合うように、第1及び/又は第2入力画像に幾何学的変換を施す。
【選択図】図12

Description

本発明は、デジタルカメラ等の撮像装置に関する。
視差を有する複数の入力画像をパノラマ合成する方法や、視差を有する複数の入力画像を合成することで三次元画像データを生成する方法が知られている。この種の合成を行うためには、別々に撮影された複数の入力画像の位置合わせが必要である。各入力画像から抽出した特徴量を元に複数の入力画像間で対応点を探索し、その探索結果を用いて位置合わせを実現することができる。より具体的には例えば、或る入力画像から特徴点を抽出して該特徴点に対応する点を他の入力画像の中から探索し、当該特徴点を基準に第1及び第2入力画像の位置合わせを行う。パノラマ合成を行う場合には、互いに対応しあう特徴点同士が重なるように複数の入力画像を位置合わせ(幾何学的変換)し、結合する。画像上のエッジ部分などが特徴点として利用される。
尚、ランドマークの部位毎に撮影した複数のランドマーク画像と各部位の位置情報とをそれぞれ関連付けて蓄積しておいて、撮影によって得られた風景画像と各ランドマーク画像を照合し、照合度が最も高いランドマーク画像に対応する部位の位置情報を表示する方法が提案されている(下記特許文献1参照)。
特開2012−9923号公報
上述の如く、位置合わせは、各入力画像から抽出された特徴量を元に複数の入力画像間で対応点を探索することで実現されるが、特徴量が類似した複数の物体が入力画像に存在していたり、多数の物体が入力画像に入り混じっていたりすると、位置合わせの基準となるべき特徴点に類似する点が1つの入力画像に存在することとなり、結果、対応点の探索を失敗する(対応点を誤検出する)ことがある。対応点の探索が正しく行われなければ、位置合わせを精度良く行えない。パノラマ合成や三次元画像データの生成等を適正に行うためにも位置合わせの精度向上は肝要である。尚、特許文献1の方法は、位置合わせの精度向上に寄与するものではない。
そこで本発明は、複数の画像の位置合わせの精度向上に寄与する撮像装置を提供することを目的とする。
本発明に係る撮像装置は、視差を有する複数回の撮影によって第1及び第2入力画像を含む複数の入力画像を取得する撮像部と、前記複数の入力画像の画像データに基づき前記複数の入力画像の位置合わせを行う画像処理部と、各入力画像の撮影地点を取得する撮影地点取得部と、を備えた撮像装置において、前記画像処理部は、各入力画像の撮影地点に対応した地点に位置する所定の参照物体が各入力画像上に存在しているか否かを検出し、前記第1及び第2入力画像上に前記参照物体が存在している場合、前記参照物体を基準にして前記第1及び第2入力画像の位置合わせを行うことを特徴とする。
各入力画像の撮影地点と何ら関わりを持たない物体(当該物体のエッジ等)を基準として位置合わせを行う場合、当該物体と当該物体に類似する物体が混同されて、位置合わせが正しく行われないことがある。各入力画像の撮影地点に対応した地点に位置する所定の参照物体(例えば予め登録された特徴物体)を基準にして位置合わせを行うことにより、このような混同が回避され、位置合わせの向上が期待される。
本発明によれば、複数の画像の位置合わせの精度向上に寄与する撮像装置を提供することが可能である。
本発明の実施形態に係るカメラの概略全体ブロック図である。 本発明の実施形態に係る撮像部の内部構成図である。 本発明の実施形態に係る特殊動作モードの動作に関与する部位のブロック図である n枚の入力画像を示す図である。 入力画像に関する画像ファイルの構造を示す図(a)と、入力画像の付加情報の内容を示す図(b)である。 過去画像保持部に複数の過去画像が保持されている様子を示す図である。 過去画像の付加情報の内容を示す図である。 ランドマークデータベースに複数のランドマークの画像が保持されている様子を示す図である。 参照過去画像を示す図(a)と、参照過去画像から参照ランドマーク画像が切り出される様子を示す図(b)と、ランドマーク特徴データの内容を示す図(c)である。 カメラ及びランドマーク間に遮蔽物が存在する様子を示す図(a)と、参照過去画像においてランドマークの一部が遮蔽されている様子を示す図(b)である。 ランドマークの画像データを含んだ第1及び第2入力画像を示す図である。 第1及び第2入力画像についての位置合わせ用データの生成方法を説明するための図である。 ランドマークの所在地と各画像の撮影地点及び撮影方位を示す図である。 第1及び第2入力画像と、それらの推定画像が対比される様子を示す図である。 本発明の第4実施例に係るガイド処理部及び地図データベースを示す図である。 ガイド表示処理における表示画面の例を示す図である。 地図上における制限区域を示す図である。 ガイド表示処理における表示画面の他の例を示す図である。
以下、本発明の実施形態の例を、図面を参照して具体的に説明する。参照される各図において、同一の部分には同一の符号を付し、同一の部分に関する重複する説明を原則として省略する。尚、本明細書では、記述の簡略化上、情報、信号、物理量、状態量又は部材等を参照する記号又は符号を記すことによって該記号又は符号に対応する情報、信号、物理量、状態量又は部材等の名称を省略又は略記することがある。
図1は、本発明の実施形態に係るカメラ1の概略全体ブロック図である。撮像装置であるカメラ1は、静止画像及び動画像を撮影及び記録可能なデジタルビデオカメラ、又は、静止画像のみを撮影及び記録可能なデジタルスチルカメラである。また、カメラ1は、携帯電話機などの任意の情報機器に搭載されるものであっても良い。カメラ1は、符号11〜16によって参照される各部位を備える。表示部13は、カメラ1に対して有線又は無線で接続された外部表示装置(即ちカメラ1の外部に設けられた表示装置)であっても良い。
撮像部11は、撮像素子を用いて被写体の撮影を行う。図2は、撮像部11の内部構成図である。撮像部11は、光学系35と、絞り32と、CCD(Charge Coupled Device)又はCMOS(Complementary Metal Oxide Semiconductor)イメージセンサなどから成る撮像素子(固体撮像素子)33と、ドライバ34と、を有している。光学系35は、撮像部11の光軸方向に移動可能な、撮像部11の画角調整用のズームレンズ30及び焦点合わせ用のフォーカスレンズ31を含む。ドライバ34は、主処理/制御部12からの制御信号に基づき、レンズ30及び31の位置並びに絞り32の開度(即ち絞り値)を制御する。撮像素子33は、水平及び垂直方向に複数の受光画素が配列されることによって形成され、各受光画素は、光学系35及び絞り32を介して入射した被写体像(被写体の光学像)を光電変換することで、被写体像の信号を撮像部11の出力信号として出力する。
主処理/制御部12は、信号処理回路、CPU(Central Processing Unit)、ROM(Read Only Memory)及びRAM(Random Access Memory)等にて形成され、撮像部11の出力信号に対して所定の信号処理を施すことで、撮像部11による被写体の撮影画像の画像データを生成する。表示部13は、液晶ディスプレイパネル等の表示画面を有する表示装置であり、主処理/制御部12の制御の下、任意の画像を表示する。記録媒体14は、カード状半導体メモリや磁気ディスク等の不揮発性メモリであり、主処理/制御部12による制御の下、撮影画像の画像データ等を記録する。操作部15は、ユーザからの各種操作を受け付ける。タッチパネルを用いて操作部15が形成されうる。
GPS測位部16は、グローバルポジショニングシステム(GPS)を形成する衛星より送信される信号を受信し、受信信号に基づきカメラ1の現在地(所在地)を求める測位処理を行うことで現在地データを取得する。現在地データは、カメラ1の経度、緯度及び高度を含む。但し、カメラ1の高度は、測位処理によって取得されないこともある。
以下では、撮影部11にて撮影された二次元の静止画像(即ち、撮像素子33の出力信号に基づく静止画像)を入力画像と呼ぶ。
カメラ1は、複数の動作モードの何れかにて動作することができ、以下では、複数の動作モードに含まれる特殊動作モードにおけるカメラ1の動作を説明する。図3は、特殊動作モードの動作に関与する部位のブロック図である。図3に示す画像処理部50及びランドマーク検出部54を主処理/制御部12に設けておくことができる。画像処理部50は、位置合わせ用データ生成部51、位置合わせ処理部52及び合成処理部53を備える。
特殊撮影モードでは、互いに異なる時刻でのn回の撮影によって互いに視差を有するn枚の入力画像I[1]〜I[n]が取得される(図4参照;nは2以上の任意の整数)。即ち、入力画像の撮影時におけるカメラ1の位置又はカメラ1の光軸の向きが入力画像I[1]〜I[n]間で互いに異なる。i及びjを互いに異なる整数とした場合、入力画像の撮影時におけるカメラ1の位置とカメラ1の光軸の向きの双方が、入力画像I[i]及びI[j]間で互いに異なっていても良い。典型的には例えば、所謂スイングパノラマ撮影の如く、カメラ1を水平又は垂直方向に振りながらn枚の入力画像I[1]〜I[n]が撮影される。
カメラ1は、各入力画像の画像データを、対応する画像ファイルに格納して記録媒体14に保存することができる。図5(a)に、入力画像I[i]に対応する、1つの画像ファイルFL[i]の構造を示す。入力画像ごとに画像ファイルを形成及び保存することができる。画像ファイルFL[i]は、入力画像I[i]の画像データと入力画像I[i]の付加情報INFI[i]を格納している。図5(b)に示す如く、入力画像I[i]の付加情報INFI[i]は、入力画像I[i]の撮影地点(即ち、入力画像I[i]の撮影時における現在地データ)を示す撮影地点情報と、入力画像I[i]の撮影方位を示す撮影方位情報と、入力画像I[i]の撮影時におけるカメラ内部パラメータと、を含んでいる。但し、撮影方位情報は付加情報INFI[i]に含まれないこともある。
入力画像I[i]の撮影方位は、入力画像I[i]の撮影時におけるカメラ1の撮影方向の方位(入力画像I[i]の撮影時においてカメラ1の光軸が向いている方位)である。カメラ1は、電子コンパス等を用いて入力画像I[i]の撮影方位を検出することができる。カメラ内部パラメータとは、撮像部11の内部特性を規定するパラメータであり、焦点距離、レンズ歪みパラメータなどを含む。
以下の説明において、特に記述無き限り、入力画像は入力画像I[1]〜I[n]の何れかを指し、n枚の入力画像は入力画像I[1]〜I[n]を指す。
画像処理部50内の各部位は、ランドマーク検出部54からのランドマーク特徴データを用いて特徴的な動作を行うが、まず、画像処理部50の基本的な機能を説明する。位置合わせ用データ生成部51及び位置合わせ処理部52は、互いに協働して、n枚の入力画像の画像データに基づきn枚の入力画像の位置合わせを行う。具体的には、位置合わせの条件を指定する位置合わせ用データが生成部51にて生成され、処理部52にて位置合わせ用データに基づき実際に位置合わせが行われる。合成処理部53は、位置合わせされたn枚の入力画像を合成することで出力画像データを生成する。出力画像データは、例えば、パノラマ合成画像の画像データ、又は、出力三次元画像データである。パノラマ合成画像は、各入力画像よりも広い画角を有する広画角画像である。出力三次元画像データは、複数の入力画像に共通して含まれる物体の3次元情報を含むデータである。
n枚の入力画像の位置合わせは、n枚の入力画像に含まれる第1及び第2入力画像の位置合わせを含む。第1及び第2入力画像は、n枚の入力画像に含まれる任意の2枚の入力画像であり、n枚の入力画像の中で第1及び第2入力画像の組み合わせを変化させて、各組み合わせにおいて第1及び第2入力画像の位置合わせを行えば、n枚の入力画像の位置合わせが実現される。以下では、説明の具体化のため、第1及び第2入力画像に対して特に注目する。n=3の場合には、1枚目及び2枚目の入力画像の組み合わせ、2枚目及び3枚目の入力画像の組み合わせ、3枚目及び1枚目の入力画像の組み合わせの夫々を、第1及び第2入力画像の組み合わせと捉えれば良い。n≧4の場合も同様である。
第1及び第2入力画像の位置合わせ用の処理は、第1入力画像における各点と第2入力画像における各点との対応関係を特定する(換言すれば、第1入力画像における各点を第2入力画像における各点に対応付ける)対応付け処理を含む。対応付け処理では、第1入力画像を形成する画素の夫々を注目点として捉え、第1入力画像の注目点における物体の画像データが第2入力画像のどの点に存在しているのかを検出する。この検出結果を示すデータ(即ち、上記対応関係を示すデータ)を位置合わせ用データと呼ぶ。上記の対応付け処理は、一般的に、対応点探索又はステレオマッチングとも呼ばれる。
第1及び第2入力画像の位置合わせは、位置合わせ用データに基づき、第1及び第2入力画像の少なくとも一方に対して、幾何学的変換を含む画像処理を行うことを含む。例えば、上記幾何学的変換により、個別に撮影された第1及び第2入力画像を共通座標系上に定義することができる。一例として、第1入力画像の各画素を所定の共通座標系上に配置した状態で、上記対応付け処理の結果に応じた幾何学的変換を第2入力画像に施せば、第2入力画像の各画素を共通座標系上に配置することができる。
パノラマ合成画像を生成する場合には、上記共通座標系上において第1及び第2入力画像間の対応点同士が互いに重なり合うように上記幾何学的変換を行えば良く、位置合わせ後の第1及び第2入力画像を公知のイメージモザイキング法によって合成することでパノラマ合成画像を得ることができる。
第1及び第2入力画像に基づく出力三次元画像データは、第1及び第2入力画像内の共通物体(即ち第1及び第2入力画像内に共通して含まれる物体)の3次元情報を含むデータである。出力三次元画像データは、多視点画像データ(MPO形式のデータやMPEG−MVC(Moving Picture Experts Group-Multiview Video Coding)のデータ)であっても良い。多視点画像データは、例えば左眼画像及び右眼画像の画像データを含む。左眼画像及び右眼画像の画像データを専用再生装置(不図示)に供給したとき、専用再生装置の観察者の左眼にのみ左眼画像が見えるように且つ当該観察者の右眼にのみ右眼画像が見えるように、専用再生装置は左眼画像及び右眼画像を表示する。これにより、専用再生装置の観察者は、第1及び第2入力画像内の共通物体を三次元的に観測することができる。専用再生装置としての機能をカメラ1が有していても良い。
出力三次元画像データは、第1及び第2入力画像内の共通物体の三次元形状を示すポリゴンデータ等であっても良い。即ち、OBJファイルフォーマット又は3D-studioフォーマットなどのように、ポリゴンとテクスチャの画像形式で、出力三次元画像データが形成されていてもよい。
図3の過去画像保持部55は、n枚の入力画像の撮影より過去に撮影された画像(以下、過去画像という)を1以上保持している。各過去画像は、カメラ1によって撮影された画像でも良いし、カメラ1以外のカメラによって撮影された画像でも良い。これに関連して、保持部55は、記録媒体14及び外部記録媒体(不図示)の内の少なくとも一方にて形成される。外部記録媒体は、カメラ1の外部に設けられ且つカメラ1と有線又は無線にて接続された機器(例えばネットワーク上のサーバ機器)内の記録媒体である。図6に、保持部55に保持されているm枚の過去画像PI[1]〜PI[m]を示す。ここでは、mは2以上の整数であると考えるが、m=1でありうる。カメラ1内の任意の部位は保持部55の保持内容を自由に参照できる。
過去画像ごとの付加情報も保持部55に保持されている。過去画像PI[i]に対応する付加情報を記号INFPI[i]にて表す。過去画像PI[i]を撮影したカメラがカメラ1であるならば、過去画像PI[i]の画像ファイルに格納された付加情報が付加情報INFPI[i]として機能する(図5(a)及び(b)も参照)。図7に示す如く、付加情報INFPI[i]は、過去画像PI[i]の撮影地点を示す撮影地点情報と、過去画像PI[i]の撮影方位を示す撮影方位情報と、過去画像PI[i]の撮影時におけるカメラ内部パラメータと、を含んでいる。但し、撮影方位情報は付加情報INFPI[i]に含まれないこともある。
過去画像PI[i]を撮影したカメラ(即ちカメラ1又はカメラ1以外のカメラ)を、便宜上、カメラCMと呼ぶと、過去画像PI[i]の撮影地点は、過去画像PI[i]の撮影時におけるカメラCMの存在位置(カメラCMがカメラ1ならば、過去画像PI[i]の撮影時における現在地データ)であり、過去画像PI[i]の撮影方位は、過去画像PI[i]の撮影時におけるカメラCMの撮影方向の方位であり、過去画像PI[i]の撮影時におけるカメラ内部パラメータは、過去画像PI[i]の撮影時におけるカメラCMの内部パラメータ(焦点距離等)である。
図3のランドマークデータベース56は、図8に示す如く、様々なランドマークの画像と各ランドマークの所在地を示す所持地情報を保持している。データベース56は、カメラ1の外部に設けられ且つカメラ1と有線又は無線にて接続された機器(例えばネットワーク上のサーバ機器)内に設けられていても良いし、カメラ1内に設けられていても良い。ランドマークは、データベース56に予め登録され、且つ、実空間上で静止及び固定された、地図上の特徴物体(建造物、遺跡など)である。データベース56には、複数のランドマークについての複数の画像が保持されているが、データベース56に保持されるランドマークの画像は、1つのランドマークの画像でありうる。カメラ1内の任意の部位はデータベース56の保持内容を自由に参照できる。
図3のランドマーク検出部(抽出部)54は、保持部55及びデータベース56に接続され、各ランドマークの所在地情報及び各入力画像の撮影地点情報に基づき、データベース56に画像が保持されている1以上のランドマーク(候補物体)の中から各入力画像の撮影地点に対応する地点に位置するランドマークを参照ランドマーク(参照物体)として抽出する。例えば、n枚の入力画像の撮影地点の何れか又はn枚の入力画像の撮影地点の重心位置から所定距離以下に存在しているランドマークを、各入力画像の撮影地点情報及び各ランドマークの所在地情報に基づき、参照ランドマークとして抽出する。
更に、ランドマーク検出部(抽出部)54は、データベース56から取得される参照ランドマークの画像と各過去画像とのマッチングを行うことにより、過去画像PI[1]〜PI[m]の中に参照ランドマークの撮影データ(参照ランドマークの画像)を含んだ過去画像が存在しているかを検出し、過去画像PI[1]〜PI[m](m枚の候補画像)の中から参照ランドマークの撮影データを含んだ過去画像を参照過去画像として抽出する。この際、各過去画像の撮影地点情報と参照ランドマークの所在地情報とに基づき、マッチングを行う過去画像を限定すると良い(参照ランドマークの所在地に近い撮影地点にて撮影された過去画像に対してのみ上記マッチングを行うと良い)。
図9(a)の画像300は、過去画像PI[1]〜PI[m]から抽出された参照過去画像である。参照過去画像300には、参照ランドマークであるランドマークLMの画像が含まれている。ランドマーク検出部54は、参照過去画像300からランドマークLMの画像部分を切り出すことで参照ランドマーク画像301を生成し(図9(b)参照)、参照ランドマーク画像301を含むランドマーク特徴データを生成及び出力する。図9(c)に示す如く、ランドマーク特徴データは、参照ランドマーク画像301に加えて、参照過去画像300内における参照ランドマーク画像301の位置を示す画像内ランドマーク位置情報302、ランドマークLMの種類を示すランドマーク種類情報303、カメラ/ランドマーク位置関係情報304、及び、ランドマーク隠れ情報305を、更に含んでいる。ランドマーク種類情報303はデータベース56から供給されても良い。
図10(a)に示す如く、参照過去画像の撮影時において、カメラ及びランドマークLM間に何らかの遮蔽物が存在していた場合、図10(b)のような参照過去画像300’が得られることになる。参照過去画像300’では、ランドマークLMの一部が遮蔽物で遮蔽されている結果、ランドマークLMの一部の画像データが欠落している。ランドマーク隠れ情報305は、参照過去画像上でランドマークLMが遮蔽されている部分を特定する。情報304については後述する。
[ランドマーク検出部と連動した画像処理部の動作]
ランドマーク特徴データに応じた画像処理部50の動作について説明する。位置合わせ用データ生成部51は、ランドマーク特徴データを用い、各入力画像上にランドマークLMが存在しているか否か(換言すれば、各入力画像内にランドマークLMの画像データが含まれているか否か)を検出する。具体的には例えば、入力画像ごとに、参照ランドマーク画像301及び入力画像間のマッチングを行うことで入力画像上にランドマークLMが存在しているか否かを検出すれば良い。この際、隠れ情報305を参照すればマッチングの精度が増す。或る入力画像上にランドマークLMが存在していると検出されたとき、当該入力画像上におけるランドマークLMの位置が定まり、その位置は位置合わせ用データに含められる。
今、図11(a)及び(b)の第1入力画像310及び第2入力画像320上にランドマークLMが存在している(換言すれば、入力画像310及び320内にランドマークLMの画像データが含まれている)と検出されたものとする。この場合、データ生成部51は、ランドマーク特徴データ(特に参照ランドマーク画像301の画像データ)並びに入力画像310及び320の画像データに基づき、ランドマークLMを基準にして位置合わせ用データを生成し、位置合わせ処理部52は、その位置合わせ用データを用いて入力画像310及び320の位置合わせを行う。即ち、生成部51及び処理部52は、ランドマークLMを基準にして入力画像310及び320の位置合わせを行う(つまり、入力画像310上のランドマークLMと入力画像320上のランドマークLMが共通物体であると認識した上で対応付け処理を行い、入力画像310及び320の位置合わせを行う)。この際にも、隠れ情報305を参照すれば良く、これによって位置合わせの精度向上が図られる。
複数の入力画像の合成等を行うための位置合わせでは、一般的に、各入力画像から抽出された特徴量を元に複数の入力画像間で対応点探索を行うが、特徴量が類似した複数の物体が入力画像に存在していたり、多数の物体が入力画像に入り混じったりしていると、位置合わせを精度良く行えない場合がある。これに対し、本実施形態では、地図上の特徴物体であるランドマークを基準にして位置合わせを行うため、他の物体の影響を受けにくい高精度の位置合わせが可能であり、結果、当該位置合わせ結果を利用した合成処理により適正な出力画像データ(図3参照)を得ることが可能となる。
尚、n枚の入力画像の内、少なくとも2枚の入力画像に共通のランドマークが写っていれば、当該2枚の入力画像に対し、ランドマークを基準にした位置合わせ及び合成処理が可能であるが、共通のランドマークが写っていない入力画像に対しては、公知の位置合わせが適用される。即ち例えば、第1及び第2入力画像に共通のランドマークが写っているが、第1及び第2入力画像と異なる第3入力画像には当該ランドマークが写っていない場合、画像処理部50は、第1及び第3入力画像の画像データに基づく公知の方法によって第1及び第3入力画像の位置合わせ及び合成を行う、又は、第2及び第3入力画像の画像データに基づく公知の方法によって第2及び第3入力画像の位置合わせ及び合成を行う。
上述の構成及び動作を基本とする、幾つかの実施例を以下に説明する。矛盾無き限り、以下に述べる第1〜第4実施例の内、任意の2以上の実施例を組み合わせることも可能である。
<<第1実施例>>
第1実施例を説明する。生成部51及び処理部52は、参照過去画像300におけるランドマークLMの画像データ(即ち、参照ランドマーク画像301の画像データ)を用い、二次元座標系上で入力画像310及び320間の対応点探索(ステレオマッチング)を行うことにより、入力画像310及び320の位置合わせを行うことができる。図12(a)及び(b)を参照して、より具体的な動作について説明する。
生成部51は、参照ランドマーク画像301及び入力画像310の画像データに基づく画像301及び310間の対応点探索を行う一方で、参照ランドマーク画像301及び入力画像320の画像データに基づく画像301及び320間の対応点探索を行い、それらの対応点探索の結果を用いて、画像301上のランドマークLMと画像310及び320上のランドマークLMとが重なり合うように、共通の二次元座標系上に入力画像310及び320を配置する。この際、画像上のランドマークLMの大きさを画像301、310及び320間で共通にするための幾何学的変換(拡大又は縮小処理)が画像301、310及び320の何れかに実行されうる。この配置の結果、図12(b)に示す如く、共通の二次元座標系上において、入力画像320は、入力画像310を基準として、画像の水平方向(右方向)にp画素だけずれ且つ画像の垂直方向(下方向)にq画素だけずれているものとする。生成部51は、そのずれを示すデータ(p,q)を含んだ位置合わせ用データを生成及び出力する。
処理部52は、位置合わせ用データ(p,q)を用いて、実際に入力画像310及び320の位置合わせを行う。具体的には、当該位置合わせにおいて、データ(p,q)に応じた画像処理(幾何学的変換を含む画像処理)を入力画像310及び320の少なくとも一方に行う。合成処理部53は、位置合わせされた入力画像310及び320を合成することで出力画像データ(例えば、パノラマ合成画像の画像データ、又は、出力三次元画像データ)を生成する。
<<第2実施例>>
第2実施例を説明する。第2実施例では、三次元座標系上で位置合わせ用データを生成する。図13等を参照して具体的に説明する。
図13において、LM(x,y)は、データベース56から取得されるランドマークLMの所在地情報に基づく、ランドマークLMの実空間上の所在地を表している。
R(x,y)及びθRは、夫々、参照過去画像300の付加情報(図7参照)から得られる参照過去画像300の撮影地点及び撮影方位を表している。
A(x,y)及びθAは、夫々、入力画像310の付加情報(図5参照)から得られる入力画像310の撮影地点及び撮影方位を表している。
B(x,y)及びθBは、夫々、入力画像320の付加情報(図5参照)から得られる入力画像320の撮影地点及び撮影方位を表している。
図13では、撮影方位を、北との相違を示す方位角として考えている。方位角θRは、参照過去画像300の撮影方位に応じた0°以上360°未満の角度を持ち、参照過去画像300の撮影方位が北、西、南、東向きであるとき、方位角θRは、夫々、0°、90°、180°、270°である。方位角θA及びθBについても同様である。
生成部51は、ランドマークLMの所在地LM(x,y)と、参照過去画像300(特に参照ランドマーク画像301)の画像データ、撮影地点R(x,y)及び撮影方位θRと、入力画像310の画像データ、撮影地点A(x,y)及び撮影方位θAと、入力画像320の画像データ、撮影地点B(x,y)及び撮影方位θBと、に基づき、位置合わせ用データを生成することができる。実際には、参照過去画像300、入力画像310及び入力画像320の付加情報から得られる参照過去画像300、入力画像310及び入力画像320の撮影時のカメラ内部パラメータをも利用して、位置合わせ用データが生成される。ランドマーク特徴データに含まれるカメラ/ランドマーク位置関係情報304(図9(c))は、ランドマークLMと参照過去画像300の撮影時のカメラCMとの位置関係を規定しており、情報304に、LM(x,y)、R(x,y)及びθRを含めておくことができる。
より具体的には例えば、生成部51は、参照過去画像300(特に参照ランドマーク画像301)の画像データと、LM(x,y)、R(x,y)、A(x,y)、θR及びθAと、参照過去画像300及び入力画像310の撮影時のカメラ内部パラメータとに基づき、推定画像310ESTを生成する。推定画像310EST(図14参照)は、カメラ1が入力画像310の撮影時のカメラ内部パラメータを用い方位角θAの撮影方向にて撮影地点A(x,y)からランドマークLMを撮影したならば得られるであろう入力画像を推定したものである。同様に、生成部51は、参照過去画像300(特に参照ランドマーク画像301)の画像データと、LM(x,y)、R(x,y)、B(x,y)、θR及びθBと、参照過去画像300及び入力画像320の撮影時のカメラ内部パラメータとに基づき、推定画像320ESTを生成する。推定画像320EST(図14参照)は、カメラ1が入力画像320の撮影時のカメラ内部パラメータを用い方位角θBの撮影方向にて撮影地点B(x,y)からランドマークLMを撮影したならば得られるであろう入力画像を推定したものである。
尚、ランドマークLMの所在地LM(x,y)と撮影地点R(x,y)又はA(x,y)との距離にも依存するが、方位角θR及びθA間の差が大きい場合には(例えば、その差が90°である場合には)、二次元画像である参照過去画像300から入力画像310を正しく推定することができない(推定画像310ESTと入力画像310との差が大きくなる)。方位角θR及びθB間の差が大きい場合も同様である。従って例えば、方位角θR及びθA間の差が所定角度以上である場合には、ランドマークLMの三次元形状データをも用いて推定画像310ESTを生成すると良く、方位角θR及びθB間の差が所定角度以上である場合には、ランドマークLMの三次元形状データをも用いて推定画像320ESTを生成すると良い。ランドマークLMの三次元形状データは、ランドマークLMの三次元形状を特定するデータであって、データベース56に保持され且つデータベース56から画像処理部50に供給されうる。ランドマークLMの三次元形状データは、ランドマークLMのポリゴンデータ等であっても良いし、ランドマークLMの三次元形状を特定するに足るランドマークLMについての複数の二次元画像であっても良い。
生成部51は、推定画像310EST及び入力画像310間の対比(マッチング)を行う一方で推定画像320EST及び入力画像320間の対比(マッチング)を行い、それらの対比の結果から、位置合わせ用データを生成することができる。推定画像310ESTは方位角θAの方向に沿ってランドマークLMを撮影地点A(x,y)に投影した像に相当し、推定画像320ESTは方位角θBの方向に沿ってランドマークLMを撮影地点B(x,y)に投影した像に相当するという事実に基づけば、上記の対比の結果から、入力画像310及び320上のランドマークLMの位置を特定できると共に、入力画像310の各点と入力画像320の各点との対応関係を特定できる。
処理部52は、上記の対比結果に基づく位置合わせ用データを用いて、実際に入力画像310及び320の位置合わせを行う。具体的には、当該位置合わせにおいて、位置合わせ用データに応じた画像処理(幾何学的変換を含む画像処理)を入力画像310及び320の少なくとも一方に行う。合成処理部53は、位置合わせされた入力画像310及び320を合成することで出力画像データ(例えば、パノラマ合成画像の画像データ、又は、出力三次元画像データ)を生成する。
尚、参照過去画像300の撮影方位(方位角θR)又は撮影地点R(x,y)が参照過去画像300の付加情報に含まれていない場合、生成部51は、ランドマークLMの三次元形状データ、参照過去画像300の画像データ及び参照過去画像300の撮影時のカメラ内部パラメータに基づく画像解析により、参照過去画像300の撮影方位(方位角θR)又は撮影地点R(x,y)を求めれば良い。
また、上述の記号LM(x,y)における“x”及び“y”は、ランドマークLMの所在地の経度及び緯度に対応している(R(x,y)、A(x,y)及びB(x,y)についても同様)。上述の説明では、説明の簡略化のために、高度情報を無視し、且つ、画像300、310及び320の撮影時におけるカメラCM(カメラ1又はカメラ1以外のカメラ)の光軸が水平であると仮定している。高度情報をも考慮する場合には、ランドマークLMの所在地情報並びに画像300、310及び320の撮影地点に高度情報をも含め、画像300、310及び320の撮影時におけるカメラCMのチルト角(カメラCMの光軸の水平面からの傾き角)をも考慮して、位置合わせ用データの生成及び位置合わせを行うと良い。
<<第3実施例>>
第3実施例を説明する。生成部51は、第1実施例の方法により求めた位置合わせ用データ(以下、2D位置合わせ用データという)と、第2実施例の方法により求めた位置合わせ用データ(以下、3D位置合わせ用データという)を、両方、出力するようにしても良い。この場合、処理部52は、2D位置合わせ用データと3D位置合わせ用データを統合し、統合結果を用いて入力画像310及び320の位置合わせを行うことができる。これにより、2D位置合わせ用データ及び3D位置合わせ用データの何れか一方のみを用いる場合と比べて、位置合わせの精度向上が期待される。第1及び第2実施例でも同様であるが、処理部52は、ランドマーク隠れ情報305を考慮して入力画像310及び320の位置合わせを行うと良い。
<<第4実施例>>
第4実施例を説明する。第4実施例では、カメラ1に設けておくことのできる、図15のガイド処理部60の機能を説明する。ガイド処理部60は、第1入力画像の撮影後であって且つ第2入力画像の撮影前に、表示部13を用いて第2入力画像の撮影推奨地点をユーザに提供する。地図データベース61は、任意の地域における地図データ(地図の情報)を保持している。地図データベース61は、記録媒体14及び上記外部記録媒体(不図示)の内の少なくとも一方にて形成される。尚、特に記述無き限り、表示とは、表示部13における表示を指す。
第1入力画像の撮影後であって且つ第2入力画像の撮影前において、ランドマーク検出部54は、第1入力画像の撮影地点から所定距離以下に存在しているランドマークを、データベース56における各ランドマークの所在地情報を用い、参照ランドマークとして抽出し、データベース56における参照ランドマークの画像と第1入力画像とのマッチングを行うことにより、第1入力画像上に参照ランドマークが存在している否か(換言すれば、第1入力画像内に参照ランドマークの画像データが含まれているか否か)を検出する。
第4実施例でも、参照ランドマークがランドマークLMであるとし、第1入力画像がランドマークLMの画像データを含んだ入力画像310であるとする(図11(a)参照)。そうすると、ガイド処理部60は、第1入力画像310の撮影後であって且つ第2入力画像の撮影前に、入力画像310の画像データ、入力画像310の撮影地点及びランドマークLMの所在地情報に基づき、第2入力画像の撮影推奨地点を決定し、当該撮影推奨地点を表示部13に出力する。撮影推奨地点の決定に当たり、入力画像310の撮影方位を更に考慮しても良い。
より具体的には例えば、ガイド処理部60は、入力画像310の画像データに基づく入力画像310上のランドマークLMの位置及び大きさと入力画像310の撮影地点及びランドマークLMの所在地情報に基づき、所定のアルゴリズムに従って、望ましい出力画像データを得るために第2入力画像をどの地点から撮影すれば良いかを決定し、その決定した地点を第2入力画像の撮影推奨地点とする。例えば、入力画像310と入力画像310の撮影地点が定まれば、基本的に、ランドマークLMの三次元画像データ(左眼及び右眼画像の画像データ等)の生成に適した第2入力画像の撮影地点は自ずと定まる。以下、第2入力画像の撮影推奨地点を単に撮影推奨地点ともいう。
ガイド処理部60は、地図データベース61に保持されているランドマークLM周辺の地図データを用い、ランドマークLM周辺の地図と共に撮影推奨地点を表示部13に出力する(即ち表示部13に表示させる)ガイド表示処理を行う。
図16に、ガイド表示処理の表示内容の例を示す。ガイド表示処理では、ランドマークLM周辺の地図の表示と共に、ランドマークLMの位置400、第1入力画像の撮影地点401及び第2入力画像の撮影推奨地点が当該地図上に重畳表示される。撮影推奨地点の個数は1つでありうるし、2以上でもありうる。図16の例では、撮影推奨地点として2つのエリア402及び403が表示される。エリア402又は403の如く」各々の撮影推奨地点は或る程度の広がりを持っていても良い。このようなガイド表示処理を行うことで、望ましい出力画像データの取得が支援される。
また、地図データベース61は、任意の地域の地図上おいて、特定の権限を有さない人間の立ち入りが制限される区域(私有地等;以下、制限区域という)を認識している。図17に、制限区域の例を示す。ガイド表示処理において、ガイド処理部60は、制限区域に関する情報(地図上における制限区域の位置、大きさ、形状)を地図データベース61から取得し、制限区域を除外して撮影推奨地点を決定すると良い(即ち制限区域を除外した地図上のエリアから撮影推奨地点を決定すると良い)。例えば、エリア403全体が制限区域に内包されている場合には、図18(a)に示す如くエリア402のみが撮影推奨地点として表示される。また例えば、エリア403の一部のみが制限区域に属しているならば、図18(b)に示す如く、制限区域を除外したエリア403aが撮影推奨地点の1つとして表示される。制限区域を除外して撮影推奨地点を決定及び表示することにより、ユーザの利便性が増す(撮影推奨地点に向かったものの、立ち入ることができなかったという好ましくない状況が回避される)。
また、地図データベース61は、任意の地域の地図上おいて、各地点に対応付けられた関連情報も保持している。或る地点の関連情報は、その地点が公共施設内の地点であるのか、何らかの事前準備(例えば事前に所定機関に連絡を入れるという準備)を行ってから当該地点に向かうべきであるのか、などを示す。ガイド表示処理において、撮影推奨地点を表示する際、ガイド処理部60は、撮影推奨地点に対応付けられた関連情報を地図データベース61から取得し、当該関連情報をカメラ1の外部(具体的にはユーザ)に報知すると良い。当該報知は、人間の五感に訴える任意の報知であって良いが、通常は視覚的又は聴覚的な報知である。即ち、ガイド処理部60は、関連情報を表示部13に表示させると良い、或いは、カメラ1に設けられたスピーカ(不図示)から関連情報を音として出力させても良い。関連情報の報知を行うことで、撮影推奨地点に向かう前の事前準備の必要性等をユーザに知らしめることができ、ユーザの利便性が増す。
尚、撮影推奨地点が複数存在する場合において、お勧めの撮影地点情報が存在する場合、お勧めの撮影地点情報に応じて複数の撮影推奨地点に優先順位を付け、優先順位に従って撮影推奨地点の表示を行っても良い(例えば、各撮影推奨地点と共に対応する優先順位を表示する、優先順位が比較的高い撮影推奨地点を強調表示する、又は、優先順位が比較的高い撮影推奨地点しか表示しない)。お勧めの撮影地点情報とは、ランドマークLMの撮影地点として、カメラ1の撮影者以外の人間が推奨している撮影地点の情報であり、地図データベース61又はネットワークを介して任意の装置から得られうる。
<<変形等>>
本発明の実施形態は、特許請求の範囲に示された技術的思想の範囲内において、適宜、種々の変更が可能である。以上の実施形態は、あくまでも、本発明の実施形態の例であって、本発明ないし各構成要件の用語の意義は、以上の実施形態に記載されたものに制限されるものではない。上述の説明文中に示した具体的な数値は、単なる例示であって、当然の如く、それらを様々な数値に変更することができる。上述の実施形態に適用可能な注釈事項として、以下に、注釈1及び注釈2を記す。各注釈に記載した内容は、矛盾なき限り、任意に組み合わせることが可能である。
[注釈1]
カメラ1又は主処理/制御部12である対象装置を、ハードウェア、或いは、ハードウェアとソフトウェアの組み合わせによって構成することができる。対象装置にて実現される機能の全部又は一部である任意の特定の機能をプログラムとして記述して、該プログラムを対象装置に搭載可能なフラッシュメモリに保存しておき、該プログラムをプログラム実行装置(例えば、対象装置に搭載可能なマイクロコンピュータ)上で実行することによって、その特定の機能を実現するようにしてもよい。上記プログラムは任意の記録媒体に記憶及び固定されうる。上記プログラムを記憶及び固定する記録媒体は対象装置と異なる機器(サーバ機器等)に搭載又は接続されても良い。
[注釈2]
例えば、以下のように考えることができる。GPS測位部16は、各入力画像の撮影地点を測定及び取得する撮影地点取得部としての機能を持つ。データベース56に画像が保持される各ランドマークは候補物体の例であり、参照ランドマークは参照物体の例である。保持部55に保持される各過去画像は候補画像の例であり、参照過去画像は参照画像の例である。撮影地点取得部は、各入力画像の撮影地点に応じた位置情報に基づき各入力画像の撮影地点を測定及び取得する。当該位置情報は、上述した衛星からの信号に限られない。例えば、カメラ1が所謂プレイスエンジン(登録商標)を利用する場合、当該位置情報は、カメラ1と通信可能なWi-Fi(登録商標)機器から取得される情報であっても良い。或いは例えば、位置情報は、操作部15を介してユーザが手動入力した情報であっても良い。
1 カメラ
11 撮像部
50 画像処理部
54 ランドマーク検出部
60 ガイド処理部

Claims (8)

  1. 視差を有する複数回の撮影によって第1及び第2入力画像を含む複数の入力画像を取得する撮像部と、
    前記複数の入力画像の画像データに基づき前記複数の入力画像の位置合わせを行う画像処理部と、
    各入力画像の撮影地点を取得する撮影地点取得部と、を備えた撮像装置において、
    前記画像処理部は、各入力画像の撮影地点に対応した地点に位置する所定の参照物体が各入力画像上に存在しているか否かを検出し、前記第1及び第2入力画像上に前記参照物体が存在している場合、前記参照物体を基準にして前記第1及び第2入力画像の位置合わせを行う
    ことを特徴とする撮像装置。
  2. 前記参照物体を含む1以上の候補物体の中から各入力画像の撮影地点に対応する地点に位置する候補物体を前記参照物体として抽出するとともに、前記複数の入力画像の撮影前に撮影された1以上の候補画像の中から前記参照物体の撮影データを含む候補画像を前記参照画像として抽出する抽出部を更に備え、
    前記画像処理部は、前記参照画像を用いて前記参照物体が各入力画像上に存在しているか否かを検出し、前記第1及び第2入力画像上に前記参照物体が存在している場合、前記参照画像、前記第1入力画像及び前記第2入力画像の画像データに基づき、前記第1及び第2入力画像の位置合わせを行う
    ことを特徴とする請求項1に記載の撮像装置。
  3. 前記画像処理部は、前記参照画像における前記参照物体の画像データを用いて前記第1及び第2入力画像間の対応点探索を行うことで前記第1及び第2入力画像の位置合わせを行う
    ことを特徴とする請求項2に記載の撮像装置。
  4. 前記画像処理部は、
    前記参照物体の所在地情報と、
    前記参照画像の画像データ、撮影地点及び撮影方位と、
    前記第1入力画像の画像データ、撮影地点及び撮影方位と、
    前記第2入力画像の画像データ、撮影地点及び撮影方位とに基づき、前記第1及び第2入力画像の位置合わせを行う
    ことを特徴とする請求項2に記載の撮像装置。
  5. 前記第1入力画像の撮影後であって且つ前記第2入力画像の撮影前において、前記第1入力画像の画像データ、前記第1入力画像の撮影地点及び前記参照物体の所在地情報に基づき、前記第2入力画像の撮影推奨地点を決定し、当該撮影推奨地点を表示部に出力するガイド処理部を更に備えた
    ことを特徴とする請求項1乃至請求項4の何れかに記載の撮像装置。
  6. 前記ガイド処理部は、立ち入りが制限される区域に関する情報を取得し、前記区域を除外して前記撮影推奨地点を決定する
    ことを特徴とする請求項5に記載の撮像装置。
  7. 前記ガイド処理部は、前記撮影推奨地点を前記表示部に出力する際、前記撮影推奨地点に対応づけられた関連情報を報知する
    ことを特徴とする請求項5又は請求項6に記載の撮像装置。
  8. 前記画像処理部は、前記複数の入力画像の位置合わせを介して、前記複数の入力画像から、各入力画像の画角よりも広い画角を有する広画角画像の画像データを生成する又は三次元画像データを生成する
    ことを特徴とする請求項1乃至請求項7の何れかに記載の撮像装置。
JP2012235662A 2012-10-25 2012-10-25 撮像装置 Pending JP2014086948A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012235662A JP2014086948A (ja) 2012-10-25 2012-10-25 撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012235662A JP2014086948A (ja) 2012-10-25 2012-10-25 撮像装置

Publications (1)

Publication Number Publication Date
JP2014086948A true JP2014086948A (ja) 2014-05-12

Family

ID=50789617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012235662A Pending JP2014086948A (ja) 2012-10-25 2012-10-25 撮像装置

Country Status (1)

Country Link
JP (1) JP2014086948A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018500778A (ja) * 2014-09-26 2018-01-11 サムスン エレクトロニクス カンパニー リミテッド 3dパノラマイメージ生成のための映像生成装置及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018500778A (ja) * 2014-09-26 2018-01-11 サムスン エレクトロニクス カンパニー リミテッド 3dパノラマイメージ生成のための映像生成装置及び方法
US10559063B2 (en) 2014-09-26 2020-02-11 Samsung Electronics Co., Ltd. Image generating apparatus and method for generation of 3D panorama image

Similar Documents

Publication Publication Date Title
JP6721065B2 (ja) 撮像装置、画像処理装置および方法
KR102013978B1 (ko) 이미지들의 융합을 위한 방법 및 장치
US20170285455A1 (en) Digital 3d/360 degree camera system
EP2328125B1 (en) Image splicing method and device
KR20140000205A (ko) 화상 처리 장치, 촬상 장치 및 화상 처리 방법과 프로그램
JP2012160904A (ja) 情報処理装置、情報処理方法、プログラム、及び撮像装置
CN102111629A (zh) 图像处理装置、图像捕获装置、图像处理方法和程序
JP2002503893A (ja) 仮想現実カメラ
JP2016048856A (ja) 画像表示システム、画像表示装置、画像表示方法、およびプログラム
JP2015156054A (ja) 画像処理装置およびその制御方法
CN102831816B (zh) 一种提供实时场景地图的装置
KR101574636B1 (ko) 면형방식 디지털 항공카메라로 촬영한 시계열 항공사진을 입체시하여 좌표를 연동하고 변화지역을 판독하는 시스템
JP6110780B2 (ja) 付加情報表示システム
JP2020153873A (ja) 診断処理装置、診断システム、診断処理方法、及びプログラム
JP2016504828A (ja) 単一のカメラを用いて3d画像を取り込む方法およびシステム
JP6388532B2 (ja) 画像提供システムおよび画像提供方法
JP2008252493A (ja) ファイル生成方法および装置並びに立体画像の表示制御方法および装置
JP6412400B2 (ja) 画像合成装置および画像合成プログラム
EP4050879A1 (en) Display control device, display control method and recording medium
JP2010231741A (ja) 電子タグ作成表示システム、電子タグ作成表示装置およびそれらの方法
CN114788254A (zh) 辅助对焦方法、装置及系统
US8532432B2 (en) Mobile communication terminal having image conversion function and method
JP2014086948A (ja) 撮像装置
JP2013175821A (ja) 画像処理装置、画像処理方法およびプログラム
JP5969062B2 (ja) 画像処理装置及び画像処理方法