JP7140517B2 - 生成装置、生成装置が行う生成方法、及びプログラム - Google Patents

生成装置、生成装置が行う生成方法、及びプログラム Download PDF

Info

Publication number
JP7140517B2
JP7140517B2 JP2018043459A JP2018043459A JP7140517B2 JP 7140517 B2 JP7140517 B2 JP 7140517B2 JP 2018043459 A JP2018043459 A JP 2018043459A JP 2018043459 A JP2018043459 A JP 2018043459A JP 7140517 B2 JP7140517 B2 JP 7140517B2
Authority
JP
Japan
Prior art keywords
virtual viewpoint
video data
sets
parameter
media file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018043459A
Other languages
English (en)
Other versions
JP2019159594A (ja
JP2019159594A5 (ja
Inventor
博康 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018043459A priority Critical patent/JP7140517B2/ja
Priority to PCT/JP2018/048468 priority patent/WO2019171733A1/ja
Publication of JP2019159594A publication Critical patent/JP2019159594A/ja
Priority to US17/011,579 priority patent/US11451759B2/en
Publication of JP2019159594A5 publication Critical patent/JP2019159594A5/ja
Priority to US17/889,429 priority patent/US20220394230A1/en
Priority to JP2022140511A priority patent/JP7459195B2/ja
Application granted granted Critical
Publication of JP7140517B2 publication Critical patent/JP7140517B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/189Recording image signals; Reproducing recorded image signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2104Intermediate information storage for one or a few pictures
    • H04N1/2112Intermediate information storage for one or a few pictures using still video cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2104Intermediate information storage for one or a few pictures
    • H04N1/2112Intermediate information storage for one or a few pictures using still video cameras
    • H04N1/2125Display of information relating to the still picture recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32128Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • H04N13/178Metadata, e.g. disparity information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/282Image signal generators for generating image signals corresponding to three or more geometrical viewpoints, e.g. multi-view systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/90Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums

Description

本発明は、仮想視点映像に関する。
昨今、複数のカメラを異なる位置に設置して複数視点で同期撮影し、当該撮影により得られた複数視点画像を用いて、任意の仮想カメラ(仮想視点)からの映像(仮想視点映像)を生成する技術が注目されている。このような技術によれば、例えば、サッカーやバスケットボールのハイライトシーンを様々な角度から視聴することが可能となり、通常の映像コンテンツと比較してユーザに高臨場感を与えることが可能となる。
特許文献1には、複数のカメラで同一の範囲を取り囲むように配置して、その同一の範囲を撮影した画像を用いて、仮想視点画像を生成、表示することが開示されている。
特開2014-215828号公報
しかしながら、仮想視点映像の取扱いには種々の課題がある。例えば、複数の仮想視点映像が生成された場合に特定の仮想視点映像を検索することが容易でない恐れがあった。この課題は、特に同一時刻、同一シーンにおいて複数の仮想視点映像が生成された場合に特に顕著である。また別の課題として、例えば、1つのフォルダ(ディレクトリ)内に複数の仮想視点映像ファイルが存在する場合に、ユーザの意図に沿った並び替えが困難となる恐れがあった。また別の課題として、例えば、仮想視点映像の表示中に当該仮想視点映像に関する視点情報を表示させたいというニーズに応えられない恐れがあった。さらに別の課題として、仮想視点映像を視聴するユーザが、その仮想視点を編集したいと考えたとしても、それを実現することが困難である恐れがあった。このように、仮想視点映像の取扱いには種々の課題があった。
本発明は、仮想視点映像の取扱いに関する種々の不都合のうち少なくとも1つを改善するためになされたものであり、その目的は、仮想視点映像に関するユーザビリティを向上させることである。
本発明による生成装置は、複数の撮影装置が撮影することにより取得される画像データに基づく仮想視点映像データの生成に使用される仮想視点パラメータであって、仮想視点の位置と前記仮想視点からの視線方向とを示す仮想視点パラメータを含む複数セットを取得する取得手段と、前記取得手段により取得された前記複数セットと、前記複数セットそれぞれに含まれる仮想視点パラメータに基づいて生成された仮想視点映像データと、を含むメディアファイルを生成する生成手段と、を有し、前記複数セットそれぞれに含まれる仮想視点パラメータは、前記メディアファイルの先頭のヘッダ領域に格納されており、
前記複数セットそれぞれに含まれる仮想視点パラメータは、前記仮想視点映像データに含まれる複数のフレームのうちの何れかのフレームに対応しており、前記複数セットのうちの1つのセットに含まれる仮想視点パラメータには、前記仮想視点映像データに含まれる複数のフレームのうちの1つのフレームを特定するパラメータと、当該1つのフレームに対応する仮想視点の位置を示すパラメータと、当該1つのフレームに対応する仮想視点からの視線方向を示すパラメータと、が含まれることを特徴とする。
本発明によれば、仮想視点映像に関するユーザビリティを向上できる。
第1実施形態における画像処理システムの構成の一例を示すブロック図である。 仮想視点パラメータ付き仮想視点映像データのフォーマットを示す説明図である。 静止画ファイルフォーマットの仮想視点映像データに仮想視点パラメータを付与する方法を説明するための図である。 VVP IFDのタグ情報の構成の一例を示す図である。 第1実施形態における画像処理装置の処理の流れを示すフローチャートである。 動画ファイルフォーマットの仮想視点映像データに仮想視点パラメータを付与する方法を説明するための図である。 Ogg VorbisのVorbisに仮想視点パラメータを付与する方法を説明するための図である。 仮想視点パラメータが付与された仮想視点映像データの表示例を示す図である。
以下、本発明の実施の形態について詳細に説明する。なお、以下の実施の形態に記載されている構成要素は、本発明の例としての形態を示すものであり、本発明の範囲をそれらのみに限定するものではない。
[第1実施形態]
まず、第1実施形態の画像処理システムの構成を説明する。図1は、第1実施形態における画像処理システムの構成の一例を示すブロック図である。本実施形態における画像処理システムは、仮想視点映像データを生成する画像処理装置(生成装置ともいう)100と、ユーザが仮想視点を操作するための仮想視点操作部110とを備える。画像処理装置100は、複数視点画像データ120を入力する。また、画像処理装置100は、仮想視点パラメータ付き仮想視点映像データ(以下、第二の仮想視点映像データと呼ぶ)130を出力する。複数視点画像データ120は、複数のカメラを異なる位置に設置して複数視点で同期撮影して得られる画像データである。複数視点画像データ120には、それぞれの視点で撮影された画像を表現するデータに加えて、撮影時刻やカメラに関する情報等が含まれていても良い。
画像処理装置100は、図1に示すように、撮影時刻指定部101、仮想視点パラメータ指定部102、画像データ取得部103、仮想視点映像生成部104、及び仮想視点パラメータ付与部105を有する。画像処理装置100は、例えば、PC(Personal Computer)、WS(Work Station)、各種サーバなどのコンピュータである。なお、画像処理装置100は、汎用コンピュータではなく、CPU、ROM、RAM、不揮発メモリ等を備えた専用コンピュータであっても構わない。また、上記各構成要素を別のコンピュータで機能させ、これらをネットワーク等で接続しても構わない。また、上記各構成要素のそれぞれが専用のハードウェアで構成されていても構わない。その場合、各ハードウェアのそれぞれはメモリ等に格納されたプログラムを起動することで処理を実行する。
撮影時刻指定部101は、撮影時刻を画像データ取得部103に指定する。撮影時刻は、絶対時刻でも良いし、撮影開始時刻を0とした相対時刻であっても良い。なお、相対時刻の表現形式として一般的な規格であるタイムコード、またはそれに類するものであってもよい。
仮想視点パラメータ指定部102は、仮想視点パラメータを仮想視点映像生成部104に指定する。本実施形態では、仮想視点パラメータに、仮想視点の姿勢、位置、画角情報のうち1つ以上のパラメータが含まれるものとする。
画像データ取得部103は、複数視点画像データ120の中から、撮影時刻指定部101によって指定された撮影時刻の画像データを取得する。ここで、複数視点画像データ120は、複数のカメラ(図示せず)が直接生成する画像データでも構わないし、コンピュータ(図示せず)に蓄えられた画像データでも構わない。
仮想視点映像生成部104は、画像データ取得部103が取得した画像データを用いて、仮想視点パラメータ指定部102から指定された仮想視点パラメータに従って、仮想視点映像データを生成する。仮想視点映像データの生成方法については特に限定されない。例えば、被写体(オブジェクト)の3次元モデルを構築して画像データをマッピングする方法を用いてもよい。
仮想視点パラメータ付与部105は、仮想視点映像生成部104が生成した仮想視点映像データに、仮想視点パラメータ指定部102から指定された仮想視点パラメータを付与して、第二の仮想視点映像データ130を生成して出力する。第二の仮想視点映像データ130は、1フレームからなる静止画であってもよいし、1フレーム以上の静止画の画像データであってもよいし、動画の画像データであってもよい。
また、本実施形態では、仮想視点映像データの生成時に使用する撮影時刻情報と仮想視点パラメータとを、画像処理装置100の外部の仮想視点操作部110から取得している。しかし、仮想視点映像データの生成時に使用する撮影時刻情報と仮想視点パラメータとのどちらか一方または両方を、画像処理装置100内に予め保持しておいてもよいし、それらの情報を自動生成するようにしても良い。なお、仮想視点操作部110の一例としては、各種の3Dシミュレータや3Dゲームで行われているように、対象となる仮想空間上にユーザが存在するものとして該ユーザが見ている方向をユーザインタフェース画面に表示する装置などが想定される。そのような形態によれば、ユーザは、ジョイスティックなどを操作して、仮想空間上を自由に移動したり、仮想空間上で見たい方向を向いたりすることで、所望の仮想視点を仮想視点操作部110に対して入力することができる。また、画像処理装置100と仮想視点操作部110は、外部インタフェースを介して接続されている。なお、本実施形態では、画像処理装置100と仮想視点操作部110とを接続するインタフェースとしてEthernet(登録商標)を用いることとするが、USB等、その他のインタフェースを用いてもよい。また、画像処理装置100と仮想視点操作部110は、同じ筐体内に格納されていてもよい。その場合、画像処理装置100と仮想視点操作部110は、コンピュータ内の内部バスによって接続されるものとする。
次に、第二の仮想視点映像データ130のデータ構造の概略を説明する。図2は、第二の仮想視点映像データのフォーマットを示す説明図である。図2に示すように、仮想視点映像データ202には、メタデータ201が付与されていて、メタデータ201は、仮想視点パラメータ211と、映像付属情報212とを含む。映像付属情報212は、例えば、撮影時刻情報や映像の解像度や色空間といった、映像に一般的に付与されるメタデータである。なお、この撮影時刻情報は、対象となる仮想視点映像データの元となる複数視点画像データ120の撮影時刻であるとし、絶対時刻であっても良いし、撮影開始時刻を0とした相対時刻であっても良い。なお、相対時刻の表現形式は上述したとおり、一般的な規格であるタイムコード、またはそれに類するものであってもよい。また、本実施形態では、画像データ取得部103に入力される複数視点画像データ120に映像付属情報212が付与されているものとする。
仮想視点パラメータ211は、姿勢パラメータ221、位置パラメータ222、及び画角パラメータ223のうち1つ以上のパラメータを含む。ここで、仮想視点パラメータ211について説明する。仮想視点パラメータ211の姿勢パラメータ221は、仮想カメラの姿勢を示すパラメータである。本実施形態では、仮想カメラの姿勢をクォータニオンで表現するものとする。クォータニオンは、以下の式(1)で表現される。
Figure 0007140517000001
式(1)において、セミコロンの左側は実数部を表現していて、x,y,zは虚数部を表現している。クォータニオン表現を用いることによって、任意の方向を軸とする任意の回転を容易に表現することが可能となる。具体的には、以下の手順となる。
まず、回転させたい点Pを以下の式(2)と置く。
Figure 0007140517000002
次に、回転軸の方向を表すベクトルをv=(xv,yv,zv)と表し、回転させたい角度をθと表し、以下の式(3)(4)を用いてこのベクトルvから2つのクォータニオンQ,Rを求める。なお、ベクトルvは正規化されていることとする。
Figure 0007140517000003
Figure 0007140517000004
最後に、以下の式(5)に示すような演算を実行する。
Figure 0007140517000005
この結果、ベクトルvを向いた軸まわりに点Pをθ回転させた点が、座標(x,y,z)として得られる。なお、姿勢パラメータ221の表現方法はこれに限定されず、例えば回転行列表現でもよい。
位置パラメータ222は、仮想カメラの位置を示すパラメータである。世界座標上の原点を(0,0,0)とした3次元座標(x,y,z)であるとする。このように、本実施形態では、位置パラメータ222を3次元ベクトルで表現する。
画角パラメータ223は、仮想視点の水平画角であるとする。なお、水平画角の表現方法については限定されない。例えば、0度~180度の範囲の角度表現でもよいし、35mmフィルムカメラで標準を50mmとした場合の焦点距離で表現してもよい。また、水平画角の値は、整数や浮動小数点で表すようにしてもよい。また、画面のアスペクト比を画角パラメータとしてもよい。その場合、アスペクト比を値として表現してもよいし、4:3や16:9など決まったアスペクト比については符号を割り当てて該符号として表現してもよい。
図3は、「カメラ映像機器工業会規格 DC-008-2012 デジタルスチルカメラ用画像ファイルフォーマット規格 Exif2.3」(以下、Exif規格)に、仮想視点パラメータを付与した場合の例である。
図3(a)には、Exif規格で定義されるメタデータの領域に新たにIFD領域(VVP IFD302)を定義して、VVP IFD302に仮想視点パラメータを格納する例が示されている。なお、VVP IFDは、Virtual Viewpoint Parameter Image File Directoryの略である。0th IFD内のVVP IFD Pointer301は、VVP IFD302を指し示すポインタである。図4は、VVP IFDのタグ情報の構成の一例を示す図である。図4(a)に示すように、VVP IFDには、「バージョン」タグ、「姿勢パラメータ」タグ、「位置パラメータ」タグ、及び「画角パラメータ」タグが含まれる。図中における「Filed Name」は各タグの名称を示し、「タイプ」は各タグのデータ型を示し、「カウント」は各タグのデータ個数を示す。図4(b)には、姿勢パラメータ、位置パラメータ、及び画角パラメータに設定される値の一例が示されている。姿勢パラメータの左端の値は、クォータニオンの実数部の値であり、右側3つの値は、クォータニオンの虚数部の値である。位置パラメータの各値は、3次元座標値である。画角パラメータの値は、水平画角である。
図3(b)には、Exif規格では定義されていないが、ベンダーあるいは業界団体が任意に利用することができる未定義のAPPnマーカセグメントであるAPP3(図中の領域311)を利用して、該領域に仮想視点パラメータを格納する例が示されている。
以上のように、既存の静止画ファイルフォーマット(以下、単に静止画フォーマットと呼ぶ)であるExif規格に、仮想視点パラメータ211を格納するための領域を追加定義することで、第二の仮想視点映像データを生成することが可能となる。なお、上記の例では、静止画フォーマットとしてExif規格を例に説明したが、フォーマットはこれに限るものではなく、他の規格であってもよいし、独自のフォーマットであってもよい。また、それぞれのパラメータの値や、表現はこれに限定されない。
ここで、図5を用いて、画像処理装置100の処理を説明する。図5は、第1実施形態における画像処理装置100の処理の流れを示すフローチャートである。図5に示すフローチャートの一連の処理は、例えば、画像処理装置100のCPU(不図示)がROM(不図示)に記憶されているプログラムコードをRAM(不図示)に展開し実行することにより行われる。また例えば、図5におけるステップの一部または全部をASICや電子回路等のハードウェアで実現してもよい。図5に示すフローは、例えば、ユーザによる開始操作に応じて実行される。
S501において、撮影時刻指定部101は、撮影時刻を画像データ取得部103に指定する。より具体的には、撮影時刻指定部101は、仮想視点操作部110から入力された撮影時刻情報(以下、単に時刻情報と記す)を画像データ取得部103に渡す。S502において、仮想視点パラメータ指定部102は、仮想視点パラメータを仮想視点映像生成部104に指定する。より具体的には、仮想視点パラメータ指定部102は、仮想視点操作部110から入力された仮想視点パラメータを仮想視点映像生成部104に渡す。S503において、画像データ取得部103は、複数視点画像データ120の中から、撮影時刻指定部101によって指定された撮影時刻を示す撮影時刻情報を有する画像データを取得する。S504において、仮想視点映像生成部104は、画像データ取得部103が取得した画像データをもとにして、仮想視点パラメータ指定部102が指定した仮想視点パラメータに従って仮想視点映像データを生成する。S505において、仮想視点パラメータ付与部105は、仮想視点映像生成部104が生成した仮想視点映像データに、仮想視点パラメータ指定部102が指定した仮想視点パラメータを付与して、第二の仮想視点映像データを生成する。S506において、仮想視点パラメータ付与部105は、生成した第二の仮想視点映像データを出力する。
なお、上記の説明では、仮想視点パラメータを、静止画フォーマットの仮想視点映像データに付与する場合を例にした。しかし、例えばS501~S506の処理を、生成したい仮想視点映像データのフレーム数分繰り返すことで、仮想視点パラメータを動画ファイルフォーマット(以下、単に動画フォーマットと呼ぶ)の仮想視点映像データに付与することも可能である。以下では、仮想視点パラメータを動画フォーマットの仮想視点映像データに付与する場合について説明する。
図6は、仮想視点パラメータを付与した動画フォーマットの一例を示す図である。ここでは、n+1個のフレーム(フレームm~m+n)からなる動画データを例にして説明する。
図6(a)には、各フレームの仮想視点映像データ606~609それぞれに対応する仮想視点パラメータ602~605を、ファイル先頭のヘッダ領域にまとめて格納するフォーマットが示されている。図6(a)に示すフォーマットは、例えば、ファイル化された動画に適している。図6(b)には、仮想視点映像データ606~609それぞれのデータの直前に、対応する仮想視点パラメータ602~605を格納するフォーマットが示されている。図6(b)に示すフォーマットは、例えば、ストリーム系の動画に適している。なお、図6(b)に示す例では、各仮想視点映像データの直前に、対応する仮想視点パラメータを格納する例が示されていが、図6(b)に示される格納方法に限定されない。例えば、各仮想視点映像データの直後に、対応する仮想視点パラメータを格納するようにしてもよい。また、図6(b)に示す例では、各仮想視点映像データと、該各仮想視点映像データに対応する各仮想視点パラメータとをフレームの時系列順に格納する例が示されているが、必ずしもフレームの時系列順でなくてもよい。
図7は、Ogg VorbisのVorbisに仮想視点パラメータを付与する方法を説明するための図である。Ogg Vorbis(http://www.vorbis.com/)は、動画フォーマットの一つである。図7には、VorbisCommentとして仮想視点パラメータ(仮想視点映像データのフレーム0~nに対応する仮想視点パラメータ)を付与する場合の例が示されている。図7において、<div class=“rotation_quaternion”>セクションの値tはクォータニオンの実数部を表し、x,y,zは虚数部を表している。また、<div class=“transiation_vector”>セクションの値x,y,zは3次元座標値を表し、<div class=“horizontal_angle”>セクションの値xは水平画角を表している。なお、各フレームの仮想視点パラメータの表現方法については、図7に示す例に限定されない。すなわち、その他の表現が用いられてもよい。また、上記の例では、動画フォーマットとしてVorbisを例に説明したが、フォーマットはこれに限るものではなく、他のフォーマットであってもよいし、独自のフォーマットであってもよい。例えば、ISO/IEC 14496-12(いわゆるISOBMFF(ベースメディアファイルフォーマット))やISO/IEC 14496-14(いわゆるMP4ファイル)やISO/IEC 14496-15等の動画フォーマットを採用してもよい。そのような場合には、例えば、User Data Box(udta)やFree Space Box(free,skip)などのフリー記述用の領域(Box)に仮想視点パラメータを記述するようにしてもよい。また例えば、ムービーボックス(moov)内に仮想視点パラメータを記述するようにしてもよい。また、将来的にファイルフォーマットにおいて、仮想視点映像のパラメータやそれを格納するための領域(Box)が定義される可能性もある。そのような場合には、ムービーボックス内のmvhd(ムービーヘッダーボックス)や、同じくムービーボックス内のtrak(トラックボックス)などの中に仮想視点パラメータを記述するようにすればよい。
さらには、静止画フォーマット、動画フォーマットだけでなく、例えばISO/IEC 23008-12(いわゆるHEIF)といったイメージシーケンスを格納することができるフォーマットにも適用可能である。
図8は、仮想視点パラメータが付与された仮想視点映像データの表示例を示す図である。
図8には、仮想視点の軌跡(図中の破線の矢印線801)を仮想視点映像に重ねて表示した場合の表示例が示されている。例えば、仮想視点パラメータ付与部105が、第二の仮想視点映像データ130、すなわち仮想視点パラメータが付与された仮想視点映像データを、不図示の表示装置に出力する。そして、不図示の表示装置が、仮想視点映像データによって示される仮想視点映像を表示する際に、該仮想視点映像データに付与された仮想視点パラメータに基づき、仮想視点の軌跡801を仮想視点映像に重ねて表示する。それにより、図8に示されるような仮想視点映像の表示を行うことが可能となる。
以上のように、本実施形態における画像処理装置100は、生成した仮想視点映像データに仮想視点パラメータを付与して、第二の仮想視点映像データを生成する。これにより、仮想視点画像データから仮想視点に関する情報を簡便に取得することが可能となる。よって、本実施形態によれば、複数の仮想視点画像データから所望の仮想視点画像データを容易に特定することが可能となる。また、図8に示すように、仮想視点画像データから取得される仮想視点に関する情報を基に、該仮想視点映像データの生成時に使用された仮想視点パラメータを可視化することが可能となる。また、第二の仮想視点映像データに付与された仮想視点パラメータの一部を修正して、新たな第二の仮想視点映像データを生成することが可能となる。つまり、仮想視点映像における仮想視点を後から編集することが可能となる。さらに、仮想視点パラメータを付した状態で仮想視点映像データを記憶装置等に保存させておくことで、記憶装置等に記憶された仮想視点映像データ群の中から、所望の仮想視点映像データを抽出することが可能となる。例えば、各仮想視点映像データに付与された仮想視点パラメータを参照して、所望の仮想視点パラメータを有する仮想視点映像データを検索することが可能となる。また例えば、各仮想視点映像データに付与された仮想視点パラメータを参照して、同じような仮想視点の仮想視点映像をグループ化することが可能となる。
また、本実施形態では、仮想視点の位置、姿勢、画角を示す情報を仮想視点パラメータとして格納する場合を例にした。しかし、上述のパラメータに代えて、又は、上述のパラメータに加えて、その他の情報が仮想視点パラメータとして格納されるようにしてもよい。例えば、仮想視点を設定したユーザの識別情報(ユーザ名など)や、仮想視点を設定した日時や、仮想視点映像データの生成日時などを格納するようにしてもよい。また例えば、仮想視点映像データのコーデックに関する情報や、仮想視点の移動距離に関する情報や、仮想視点映像データの再生時間に関する情報を格納するようにしてもよい。また例えば、仮想視点映像データの再生の制限に関する情報(再生可能ユーザの識別情報、再生可能回数に関する情報等)を格納するようにしてもよい。
また、仮想視点パラメータの用途は、上述の方法に限られない。すなわち、仮想視点パラメータの可視化、仮想視点映像データの検索、及び、仮想視点映像データのグループ化に限られない。例えば、おすすめコンテンツの選定、コンテンツリストの並べ替え、個別ファイルの確認(例えば、いつ仮想視点を設定したかを思い出したいときにプロパティから参照する)することも想定される。
また、本実施形態では、1つのデータまたはファイル内に仮想視点パラメータを含めて記述したが、これに限定されない。例えば、それぞれの仮想視点映像データの仮想視点パラメータを、それぞれの仮想視点映像データに関連付けられた別々のファイルで管理を行っても構わない。
さらに、本実施形態では、仮想視点映像データを生成する際に仮想視点パラメータを付与する装置を例にした。しかし、仮想視点映像データを生成した後に別途仮想視点パラメータを付与するようにしても構わない。例えば、仮想視点映像データの生成時にユーザが操作した仮想カメラの位置や姿勢の記録から仮想視点パラメータを生成して、仮想視点映像データに付与するような制御を行うことも可能である。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
102 仮想視点パラメータ指定部
104 仮想視点映像生成部
105 仮想視点パラメータ付与部

Claims (16)

  1. 複数の撮影装置が撮影することにより取得される画像データに基づく仮想視点映像データの生成に使用される仮想視点パラメータであって、仮想視点の位置と前記仮想視点からの視線方向とを示す仮想視点パラメータを含む複数セットを取得する取得手段と、
    前記取得手段により取得された前記複数セットと、前記複数セットそれぞれに含まれる仮想視点パラメータに基づいて生成された仮想視点映像データと、を含むメディアファイルを生成する生成手段と、を有し、
    前記複数セットそれぞれに含まれる仮想視点パラメータは、前記メディアファイルの先頭のヘッダ領域に格納されており、
    前記複数セットそれぞれに含まれる仮想視点パラメータは、前記仮想視点映像データに含まれる複数のフレームのうちの何れかのフレームに対応しており、
    前記複数セットのうちの1つのセットに含まれる仮想視点パラメータには、前記仮想視点映像データに含まれる複数のフレームのうちの1つのフレームを特定するパラメータと、当該1つのフレームに対応する仮想視点の位置を示すパラメータと、当該1つのフレームに対応する仮想視点からの視線方向を示すパラメータと、が含まれる
    ことを特徴とする生成装置。
  2. 前記メディアファイルは、静止画フォーマットのファイルであり、
    前記生成手段は、
    前記取得手段により取得された前記複数セットそれぞれに含まれる仮想視点パラメータを、前記メディアファイルのメタデータの領域に格納する
    ことを特徴とする請求項に記載の生成装置。
  3. 前記静止画フォーマットは、Exifであり、
    前記取得手段により取得された前記複数セットそれぞれに含まれる仮想視点パラメータは、前記メディアファイルのメタデータの領域のうち、Exif規格で定義されるIFD領域に格納される
    ことを特徴とする請求項に記載の生成装置。
  4. 前記静止画フォーマットは、Exifであり、
    前記取得手段により取得された前記複数セットそれぞれに含まれる仮想視点パラメータは、前記メディアファイルのメタデータの領域のうち、Exif規格で定義されていないAPPnマーカセグメントに格納される
    ことを特徴とする請求項に記載の生成装置。
  5. 前記メディアファイルは、動画フォーマットのファイルであり、
    前記生成手段は、
    記仮想視点映像データ及び前記複数セットそれぞれに含まれる仮想視点パラメータを、フレームの時系列順に前記メディアファイルに格納する
    ことを特徴とする請求項1から4のいずれか1項に記載の生成装置。
  6. 前記メディアファイルは、動画フォーマットのファイルであり、
    前記動画フォーマットは、Ogg Vorbisである
    ことを特徴とする請求項1から5のいずれか1項に記載の生成装置。
  7. 前記1つのセットに含まれる仮想視点パラメータは、前記仮想視点の画角を表すパラメータがさらに含まれる
    ことを特徴とする請求項1から請求項のうちのいずれか1項に記載の生成装置。
  8. 前記取得手段は、ユーザ操作に基づいて指定される複数セットそれぞれに含まれる仮想視点パラメータを取得する
    ことを特徴とする請求項1から請求項のうちのいずれか1項に記載の生成装置。
  9. 前記仮想視点の位置は、三次元座標により表される
    ことを特徴とする請求項1から請求項のうちのいずれか1項に記載の生成装置。
  10. 前記仮想視点からの視線方向は、三次元ベクトルにより表される
    ことを特徴とする請求項1から請求項のうちのいずれか1項に記載の生成装置。
  11. 前記生成手段により生成されるメディアファイルは、前記仮想視点を指定したユーザの識別情報、前記仮想視点が設定された日時に関する情報、及び、前記仮想視点映像データの生成日時に関する情報のうち少なくともいずれかをさらに含む
    ことを特徴とする請求項1から請求項10のうちのいずれか1項に記載の生成装置。
  12. 前記生成手段により生成されるメディアファイルは、前記仮想視点映像データを再生可能なユーザを特定するための情報、及び、前記仮想視点映像データを再生可能な回数に関する情報のうち少なくともいずれかをさらに含む
    ことを特徴とする請求項1から請求項11のうちのいずれか1項に記載の生成装置。
  13. 前記仮想視点映像データに含まれる複数のフレームのうちの前記1つのフレームを特定する前記パラメータは、当該1つのフレームのフレーム番号である
    ことを特徴とする請求項1から請求項12のうちのいずれか1項に記載の生成装置。
  14. 前記仮想視点映像データに含まれる複数のフレームのうちの前記1つのフレームを特定する前記パラメータは、当該1つのフレームのタイムコードである
    ことを特徴とする請求項1から請求項12のうちのいずれか1項に記載の生成装置。
  15. 複数の撮影装置が撮影することにより取得される画像データに基づく仮想視点映像データの生成に使用される仮想視点パラメータであって、仮想視点の位置と前記仮想視点からの視線方向とを示す仮想視点パラメータを含む複数セット生成装置が取得する取得ステップと、
    前記取得された前記複数セットと、前記複数セットそれぞれに含まれる仮想視点パラメータに基づいて生成された仮想視点映像データと、を含むメディアファイルを前記生成装置が生成する生成ステップと、を含み、
    前記複数セットそれぞれに含まれる仮想視点パラメータは、前記メディアファイルの先頭のヘッダ領域に格納されており、
    前記複数セットそれぞれに含まれる仮想視点パラメータは、前記仮想視点映像データに含まれる複数のフレームのうちの何れかのフレームに対応しており、
    前記複数セットのうちの1つのセットに含まれる仮想視点パラメータには、前記仮想視点映像データに含まれる複数のフレームのうちの1つのフレームを特定するパラメータと、当該1つのフレームに対応する仮想視点の位置を示すパラメータと、当該1つのフレームに対応する仮想視点からの視線方向を示すパラメータと、が含まれる
    ことを特徴とする生成装置が行う生成方法
  16. コンピュータを、請求項1から請求項14のうちのいずれか1項に記載の生成装置として機能させるためのプログラム。
JP2018043459A 2018-03-09 2018-03-09 生成装置、生成装置が行う生成方法、及びプログラム Active JP7140517B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2018043459A JP7140517B2 (ja) 2018-03-09 2018-03-09 生成装置、生成装置が行う生成方法、及びプログラム
PCT/JP2018/048468 WO2019171733A1 (ja) 2018-03-09 2018-12-28 生成装置、生成方法、及びプログラム
US17/011,579 US11451759B2 (en) 2018-03-09 2020-09-03 Generation apparatus, generation method, and storage medium
US17/889,429 US20220394230A1 (en) 2018-03-09 2022-08-17 Generation apparatus, generation method, and storage medium
JP2022140511A JP7459195B2 (ja) 2018-03-09 2022-09-05 生成装置、生成方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018043459A JP7140517B2 (ja) 2018-03-09 2018-03-09 生成装置、生成装置が行う生成方法、及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022140511A Division JP7459195B2 (ja) 2018-03-09 2022-09-05 生成装置、生成方法、及びプログラム

Publications (3)

Publication Number Publication Date
JP2019159594A JP2019159594A (ja) 2019-09-19
JP2019159594A5 JP2019159594A5 (ja) 2021-04-22
JP7140517B2 true JP7140517B2 (ja) 2022-09-21

Family

ID=67846029

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018043459A Active JP7140517B2 (ja) 2018-03-09 2018-03-09 生成装置、生成装置が行う生成方法、及びプログラム
JP2022140511A Active JP7459195B2 (ja) 2018-03-09 2022-09-05 生成装置、生成方法、及びプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022140511A Active JP7459195B2 (ja) 2018-03-09 2022-09-05 生成装置、生成方法、及びプログラム

Country Status (3)

Country Link
US (2) US11451759B2 (ja)
JP (2) JP7140517B2 (ja)
WO (1) WO2019171733A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022090786A (ja) 2020-12-08 2022-06-20 キヤノン株式会社 情報処理装置、画像生成装置、画像処理システム、情報処理方法、画像生成方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003242043A (ja) 2002-02-15 2003-08-29 Oki Electric Ind Co Ltd 再生装置およびデータ管理システムにおけるコンテンツ管理方法
WO2011136191A1 (ja) 2010-04-28 2011-11-03 富士フイルム株式会社 立体画像再生装置及び方法、立体撮像装置、立体ディスプレイ装置
WO2012105121A1 (ja) 2011-02-03 2012-08-09 富士フイルム株式会社 立体動画再生装置、立体動画再生プログラムならびにその記録媒体、立体ディスプレイ装置、立体撮像装置及び立体動画再生方法
JP2013172456A (ja) 2012-02-17 2013-09-02 Samsung Electronics Co Ltd マルチメディアコンテンツのフレーム検索方法及び装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2003092304A1 (ja) * 2002-04-25 2005-09-08 シャープ株式会社 画像データ生成装置、画像データ再生装置、および画像データ記録媒体
US7538774B2 (en) * 2003-06-20 2009-05-26 Nippon Telegraph And Telephone Corporation Virtual visual point image generating method and 3-d image display method and device
JP2007150747A (ja) * 2005-11-28 2007-06-14 Matsushita Electric Ind Co Ltd 受信装置及び本線映像配信装置
EP2212771A4 (en) * 2007-10-05 2011-06-01 Aharon Mizrahi SYSTEM AND METHOD FOR ENABLING A CONTENT SEARCH
US8786596B2 (en) * 2008-07-23 2014-07-22 Disney Enterprises, Inc. View point representation for 3-D scenes
JP4737573B2 (ja) 2009-02-05 2011-08-03 富士フイルム株式会社 3次元画像出力装置及び方法
KR101926477B1 (ko) * 2011-07-18 2018-12-11 삼성전자 주식회사 콘텐츠 재생 방법 및 장치
JP2014215828A (ja) 2013-04-25 2014-11-17 シャープ株式会社 画像データ再生装置、および視点情報生成装置
WO2016167160A1 (ja) 2015-04-17 2016-10-20 シャープ株式会社 データ生成装置および再生装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003242043A (ja) 2002-02-15 2003-08-29 Oki Electric Ind Co Ltd 再生装置およびデータ管理システムにおけるコンテンツ管理方法
WO2011136191A1 (ja) 2010-04-28 2011-11-03 富士フイルム株式会社 立体画像再生装置及び方法、立体撮像装置、立体ディスプレイ装置
WO2012105121A1 (ja) 2011-02-03 2012-08-09 富士フイルム株式会社 立体動画再生装置、立体動画再生プログラムならびにその記録媒体、立体ディスプレイ装置、立体撮像装置及び立体動画再生方法
JP2013172456A (ja) 2012-02-17 2013-09-02 Samsung Electronics Co Ltd マルチメディアコンテンツのフレーム検索方法及び装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
平松達雄ほか,JPEG+Exif互換形式を容器として利用する健康モニター機器のデータ取り扱い形式,第32回医療情報学連合大会論文集 (第13回日本医療情報学会学術大会) 医療情報学 第32回 Suppl. ,日本,一般社団法人 日本医療情報学会,2012年11月14日,Vol. 32, Supplement,1490~1493ページ

Also Published As

Publication number Publication date
US20220394230A1 (en) 2022-12-08
JP2019159594A (ja) 2019-09-19
JP7459195B2 (ja) 2024-04-01
WO2019171733A1 (ja) 2019-09-12
US11451759B2 (en) 2022-09-20
JP2022171739A (ja) 2022-11-11
US20200404240A1 (en) 2020-12-24

Similar Documents

Publication Publication Date Title
US10964108B2 (en) Augmentation of captured 3D scenes with contextual information
JP6950013B2 (ja) 画像処理装置、画像処理方法及びプログラム
KR20170122725A (ko) 파라미터를 갖는 마커를 사용한 증강 현실의 장면 수정
US20120008003A1 (en) Apparatus and method for providing augmented reality through generation of a virtual marker
US10074216B2 (en) Information processing to display information based on position of the real object in the image
CN108668050B (zh) 基于虚拟现实的视频拍摄方法和装置
US11044398B2 (en) Panoramic light field capture, processing, and display
JP7353782B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US20210266511A1 (en) Information processing system, information processing method, and storage medium
JP2016071900A (ja) 情報処理システム、その制御方法、及びプログラム
JP7459195B2 (ja) 生成装置、生成方法、及びプログラム
JP7102173B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP6011567B2 (ja) 情報処理装置、その制御方法、及びプログラム
KR20070010306A (ko) 촬영장치 및 깊이정보를 포함하는 영상의 생성방법
US10902554B2 (en) Method and system for providing at least a portion of content having six degrees of freedom motion
JP2013214158A (ja) 表示画像検索装置、表示制御システム、表示制御方法、およびプログラム
KR20120035321A (ko) 증강 현실 컨텐츠 재생 시스템 및 방법
WO2022230718A1 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP7378960B2 (ja) 画像処理装置、画像処理システム、画像生成方法、および、プログラム
WO2022230715A1 (ja) 情報処理装置、情報処理方法、及び、プログラム
CN110914871A (zh) 获取三维场景的方法与装置
JP4070057B2 (ja) 図書情報検索空間構築・検索装置および図書情報検索空間構築・検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2017130008A (ja) 三次元被写体形状推定装置
JP2019121158A (ja) データ表示装置、方法、およびプログラム
CN116503483A (zh) 姿态标定方法、装置、设备、存储介质及计算机程序产品

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210309

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220908

R151 Written notification of patent or utility model registration

Ref document number: 7140517

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151