WO2019167761A1

WO2019167761A1 - 生成装置、再生装置、生成方法、制御プログラム、及び記録媒体

Info

Publication number: WO2019167761A1
Application number: PCT/JP2019/006377
Authority: WO
Inventors: 徳毛　靖昭
Original assignee: シャープ株式会社
Priority date: 2018-02-27
Filing date: 2019-02-20
Publication date: 2019-09-06
Also published as: US20210092348A1; CN111771383A

Abstract

再生装置が好適な仮想視点画像を容易に指定し、取得できる構造化データを生成する生成装置を実現する。生成装置（２）は、仮想視点画像生成部（１１）と、構造化データを生成するデータ生成部（１２）とを備え、前記データ生成部（１２）は、前記構造化データに、１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含ませる。

Description

生成装置、再生装置、生成方法、制御プログラム、及び記録媒体

　本発明の一様態は、構造化データの生成装置、仮想視点画像の再生装置、構造化データの生成方法、制御プログラム、及び制御プログラムを記載した記録媒体に関する。

　近年、多視点画像、あるいは全天球画像等、大容量の動画像をストリーミング配信する為の様々な技術が開発されている。一例としては、MPEG（Moving Picture Experts Group）にて標準化作業が進められているDASH（Dynamic Adaptive Streaming over HTTP）が挙げられる。DASHにおいては、MPD（Media Presentation Description）データと呼ばれる記述情報およびSegmentデータのフォーマットが規定されている。

ISO/IEC 23009-1 Second edition 2014-05-15

　しかしながら、上述のような従来技術は、画像再生処理を行う再生装置が、画像生成処理を行う生成装置等から仮想視点画像を取得し、任意の視点位置の画像を合成する場合に、生成装置等から何れの仮想視点画像を取得すればよいかの判断が難しいという問題がある。

　本発明の一態様は、上記の問題に鑑みてなされたものであり、再生装置が好適な仮想視点画像を容易に指定し、取得できる構造化データを生成する生成装置を実現することを目的とする。

　上記の課題を解決するために、本発明の一態様に係る生成装置は、仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成部と、前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成部とを備え、前記データ生成部は、前記構造化データに、前記仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含ませる。

　本発明の一態様によれば、再生装置が好適な仮想視点位置の画像を容易に指定し、取得できる構造化データを生成する生成装置を実現できる。

実施形態１に係る画像再生システムの機能ブロック図である。仮想空間と、仮想視点画像を示すMPDデータとの一例を示す図である。仮想空間上を移動するユーザの一例を示す概略図である。サブ空間を示すサブセットデータを含むMPDデータの一例を示す図である。データ生成部がMPDデータに含ませる、上述したサブセットデータの一例を示す図である。実施形態１に係る処理の流れを示すフローチャートである。１つの仮想視点画像を複数のAdaptationSetに対応させた例を示す概略図である。実施形態１の変形例１において、データ生成部が生成するMPDデータの例を示す図である。データ生成部がMPDデータに含ませる、上述したサブセットデータの一例を示す図である。３次元空間である仮想空間の一例を示す図である。実施形態１の変形例２において、データ生成部が生成するMPDデータの例を示す図である。データ生成部が、MPDデータに含ませるサブセットデータの一例を示す図である。仮想空間上を移動するユーザの一例を示す概略図である。仮想空間内における任意の位置にユーザが位置する様子を示す図である。仮想視点画像を構成するデータそれぞれの取得先を構造化したデータであるMPDデータを示す図である。実施形態２に係るMPDデータに含まれるAdaptationSetの記述例を示す図である。仮想視点画像の配置パターンの一例を示す図である。仮想視点画像を構成するメディアセグメントそれぞれの取得先を構造化したデータであるMPDデータを示す図である。実施形態３に係るMPDデータの記述例を示す図である。仮想視点画像の配置パターンの一例を示す図である。実施形態３の変形例に係るMPDデータの記述例を示す図である。実施形態２に係る処理の流れを示すフローチャートである。実施形態３に係る処理の流れを示すフローチャートである。

　本発明の実施形態について図１～図２１に基づいて説明すれば以下の通りである。

　〔実施形態１〕
　以下、本発明の一実施形態について、図１～図１３に基づいて説明する。

　本実施形態においては、仮想視点空間においてサブ空間を規定する画像再生システムの構成について説明する。なお、本明細書においては、特に断りが無い限り、静止画と動画とを区別せず、共に画像と呼称するものとする。

　〔１．画像再生システム１の構成〕
　図１に基づいて本実施形態に係る画像再生システム１の構成について説明する。図１は、本実施形態に係る画像再生システム１の機能ブロック図である。図１に示す通り、画像再生システム１は生成装置２と、再生装置２０とを備えている。

　生成装置２は、仮想空間上の各仮想視点画像と、当該仮想視点画像を構成する各データ（メディアセグメント）の取得先を示す構造化データであるMPD（Media Presentation Description）データとを生成する装置である。なお、仮想視点画像とは、仮想空間上のある視点位置における視点画像を意味する。また、MPDデータの詳細については後述する。

　生成装置２は、制御部３、記憶部４、及び通信部５を備えている。制御部３は、生成装置２全体を統括する制御装置であって、仮想視点画像生成部１１、データ生成部１２、及び通信制御部１３を備えている。

　仮想視点画像生成部１１は、仮想空間上の仮想視点位置における仮想視点画像を生成する。データ生成部１２は、上述したMPDデータを生成する。通信制御部１３は、通信部５による通信処理に係る制御を行う。

　記憶部４は、各種データを格納する記憶装置である。通信部５は、ネットワークを介して外部の装置との通信処理を行う。

　再生装置２０は、上述したMPDデータを参照して仮想視点画像を構成する各データを取得し、仮想視点画像を再生する装置である。再生装置２０は、制御部２１、記憶部２２、表示部２３、及び通信部２４を備えている。

　制御部２１は、再生装置２０全体を統括する制御装置であって、再生処理部３１、データ取得部３２、位置取得部３３、表示制御部３４、及び通信制御部３５を備えている。

　再生処理部３１は、メディアセグメントから仮想視点画像を合成する処理を行う。データ取得部３２は、MPDデータ及びメディアセグメントの取得を行う。位置取得部３３は、仮想空間上におけるユーザの位置及び姿勢（向き）を取得する。表示取得部は、表示部２３による画面表示処理に係る制御を行う。通信制御部３５は、通信部２４による通信処理に係る制御を行う。

　記憶部２２は、各種データを格納する記憶装置である。表示部２３は、動画又は静止画の表示処理を行う表示パネルである。通信部２４は、ネットワークを介して外部の装置との通信処理を行う。

　〔２．MPDデータについて〕
　本実施形態において生成装置２が生成する仮想視点画像及びMPDデータについて、図２～図５に基づいて説明する。

　図２は、仮想空間と、仮想視点画像を示すMPDデータとの一例を示す図である。図２の（ａ）は、仮想空間上における任意の位置にユーザが位置する様子を示す図である。P00等、各格子点に存在する円形の図は、当該視点位置における仮想視点画像を表す。ここで、当該仮想視点画像は、全天球画像又は全天球画像に準ずる画像である。また、生成装置２が生成する仮想視点画像の視点位置は、必ずしも仮想空間上の座標系における格子点の位置に限定されない。

　仮想視点画像生成部１１は、図２の（ａ）に示すように、仮想空間上の任意の区間ごとに仮想視点画像を生成し、各仮想視点画像を構成するデータであるメディアセグメントを、後述するMPDデータによって参照可能となるように記憶部４又は図１には図示しない記憶装置に格納する。

　図２の（ｂ）は、当該仮想視点画像を構成するデータそれぞれの取得先を構造化したデータであるMPDデータを示す図である。MPDデータは、（ｂ）に示すように、上位から順にMPD要素、Period要素、AdaptationSet要素、Representation要素、SegmentList要素、及びSegmentURL要素という階層構造になっている。また、（ｂ）においては、Segment１からSegment nを含む各SegmentList要素及びSegmentURL要素は省略されている。

　ここで、図２の（ａ）に含まれるような仮想視点画像１つが、図２の（ｂ）に示すようなMPDデータにおけるAdaptatonSet１つに対応する。例えば、（ｂ）のAdaptationSet P00に含まれるSengment 1からSegment nは、（ａ）の仮想視点画像P00を構成するn個（nは１以上の整数）のメディアセグメントの取得先を示すSegmentURL要素である。

　画像再生システム１においては、仮想空間上において、１又は複数の仮想視点位置を含む所定の範囲をサブ空間として規定する。

　図３は、仮想空間上を移動するユーザの一例を示す概略図である。図３に示す例において、ユーザは、仮想空間上に規定されたサブ空間Ｓ１に含まれる仮想視点位置Ｕ１から、サブ空間Ｓ２に含まれる仮想視点位置Ｕ２へ移動している。なお、隣接するサブ空間には、１又は複数の共通する仮想視点位置が含まれる。

　図４は、サブ空間を示すサブセットデータを含むMPDデータの一例を示す図である。

　データ生成部１２は、図４のSubset S1、及びSubset S2に示すような、仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含むMPDデータを生成する。

　図５は、データ生成部１２がMPDデータに含ませる、上述したサブセットデータの一例を示す図である。図５に例示するように、サブセットデータには、含まれる仮想視点位置の識別番号（図５におけるP11及びP21等）、並びにサブ空間の中心位置（center_x及びcenter_y）及び半径（radius）等が含まれていてもよい。

　〔３．処理の流れ〕
　本実施形態における仮想視点画像再生に係る処理の流れについて図１～図６に基づいてステップごとに説明する。図６は、本実施形態に係る処理の流れを示すフローチャートである。以下、一例として、図３に示すように、ユーザが仮想空間内においてサブセットＳ１からサブセットＳ２へ移動する場合を想定して説明する。

　（Ｓ１０１）
　ステップＳ１０１において、再生装置２０は、MPDデータを受信する。生成装置２が備える通信制御部１３は、通信部５を介して、図４に示すような、上述したサブセットデータを含むMPDデータを再生装置２０へ送信する。データ取得部３２は、通信部２４を介して上記MPDデータを取得し、記憶部２２に格納する。

　（Ｓ１０２）
　続いて、ステップＳ１０２において、位置取得部３３は、仮想空間内におけるユーザの位置及び姿勢を取得する。

　（Ｓ１０３）
　続いて、ステップＳ１０３において、制御部２１は、ステップＳ１０１において記憶部２２に格納されたMPDデータと、ステップＳ１０２において位置取得部３３が取得したユーザの位置とを参照し、ユーザが位置するサブセットを選択する。

　（Ｓ１０４）
　続いて、ステップＳ１０４において、制御部２１は、ユーザが位置するサブ空間（サブセット）が変更されたか否かを判定する。ユーザが位置するサブ空間が変更された場合又は本ステップＳ１０４へ初めて遷移する場合は、ステップＳ１０５へ遷移し、ユーザが位置するサブ空間に変更が無い場合は、ステップＳ１０７へ遷移する。

　（Ｓ１０５）
　ステップＳ１０５において、データ取得部３２は、ユーザが位置するサブ空間に含まれる各仮想視点位置に対応するAdaptationSetを参照し、通信部２４を介して各仮想視点画像を構成するメディアセグメントを取得し、記憶部２２に格納する。

　（Ｓ１０６）
　続いて、ステップＳ１０６において、データ取得部３２は、ステップＳ１０３において制御部２１が選択したサブセット以外のサブセットに含まれる仮想視点位置に対応する各AdaptationSetに含まれるメディアセグメントの取得を停止する。

　（Ｓ１０７）
　続いて、ステップＳ１０７において、位置取得部３３は、ユーザが複数のサブ空間の共通範囲、つまりオーバーラップ範囲に位置するか否かの判定を行う。ユーザが、複数のサブ空間の共通範囲に位置する場合は、ステップＳ１０８へ遷移し、位置しない場合は、ステップＳ１０９へ遷移する。

　（Ｓ１０８）
　ステップＳ１０８において、再生処理部３１は、ユーザが位置する、ステップＳ１０７におけるサブ空間の共通範囲に含まれる仮想視点位置に対応する各AdaptationSetに含まれるメディアセグメントから、ユーザの仮想視点位置における仮想視点画像を合成する。また、本ステップにおいて、データ取得部３２は、上述した各AdaptationSet以外のAdaptatonSetに含まれるメディアセグメントの取得を停止しても構わない。本ステップにおける処理を行い、次いでステップＳ１１０へ遷移する。

　（Ｓ１０９）
　ステップＳ１０９において、再生処理部３１は、ユーザが位置するサブ空間に含まれる仮想視点位置に対応する各メディアセグメントから、ユーザの仮想視点位置における仮想視点画像を合成する。

　（Ｓ１１０）
　ステップＳ１１０において、表示制御部３４は、ステップＳ１０８又はステップＳ１０９において再生処理部３１が合成した仮想視点画像と、ステップＳ１０２において位置取得部３３が取得したユーザの位置及び姿勢を参照して、表示部２３に、ユーザの仮想視点位置からの視界に相当する画像を表示させる。

　（Ｓ１１１）
　続いて、ステップＳ１１１において、制御部２１は、本ステップにおいてカウントを開始してから所定の時間が経過したか否かを判定する。所定の時間が経過した場合は、ステップＳ１０２へ遷移し、経過していない場合は、ステップＳ１０７へ遷移する。

　つまり再生装置２０は、ステップＳ１０２において位置取得部３３が、仮想空間内におけるユーザの位置及び姿勢を取得する処理から、ステップＳ１１０において、表示処理部が、表示部２３にユーザの仮想視点位置からの視界に相当する画像を表示させる処理を、ユーザが所定の終了操作を行うまで、又はステップＳ１０１において記憶部２２に格納されたMPDデータが示す動画が終了するまで繰り返す。以上が図６のフローチャートに基づく処理の流れである。

　このように、本実施形態に係る生成装置２は、仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成部１１と、前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成部１２とを備え、前記データ生成部１２は、前記構造化データに、前記仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含ませる。

　上記の構成によれば、再生装置２０が好適な仮想視点位置の画像を容易に指定し、取得できる構造化データを生成する生成装置２を実現できる。

　また、本実施形態に係る再生装置２０は、仮想空間上の任意の区間ごとに生成された仮想視点画像を構成する各データの取得先を示す構造化データであって、前記仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含む構造化データを取得するデータ取得部３２と、仮想空間上におけるユーザの位置を取得する位置取得部３３とを備え、前記データ取得部３２は、前記構造化データと、前記位置取得部３３が取得した前記ユーザの位置とを参照し、ユーザが存在する前記所定の範囲に含まれる仮想視点位置に対応する仮想視点画像を構成する各データを取得する。

　上記の構成によれば、好適な仮想視点位置の画像を容易に指定し、取得できる再生装置２０を実現できる。

　〔変形例１〕
　実施形態１の第１の変形例について、図１、及び図７～図９に基づいて説明する。なお便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、説明を省略する。本変形例においては、１つの仮想視点画像を、複数のAdaptationSetに対応させる構成について説明する。

　図７は、１つの仮想視点画像を複数のAdaptationSetに対応させた例を示す概略図である。ここで、図７の各図は、各AdaptationSetがカバーする仮想視点画像の範囲を上から見た図である。また、図７に示すように、当該範囲の一部が重複していてもよい。

　仮想視点画像生成部１１は、仮想空間上の任意の区間ごとに仮想視点画像を生成し、各仮想視点画像が複数のAdaptationSetによって参照可能となるように、当該仮想視点画像を構成するメディアセグメントを記憶部４又は図１には図示しない記憶装置に格納する。

　図８は、本変形例において、データ生成部１２が生成するMPDデータの例を示す図である。図８に示す例においては、例えば、仮想視点画像生成部１１が生成する仮想視点画像P00は、AdaptationSet P00a～P00d（P00c及びP00dは不図示）に対応する。また、データ生成部１２は、図８のSubset S1a、及びSubset S1bに例示するように、MPDデータに、所定の範囲をカバーする１又は複数の仮想視点画像を規定したサブセットデータを含ませる。

　図９は、データ生成部１２がMPDデータに含ませる、上述したサブセットデータの一例を示す図である。図９に例示するように、当該サブセットデータには、含まれる仮想視点位置の識別番号（図９におけるP11a及びP21a等）、並びに、サブ空間の中心位置（center_x及びcenter_y）及び半径（radius）に加え、当該サブセットに対応する仮想視点画像が、どのような範囲（角度）をカバーするかを示す情報(min_azimuth及びmax_azimuth)等が含まれていてもよい。

　再生装置２０が備えるデータ取得部３２は、生成装置２から図８に示すようなMPDデータを取得し、記憶部２２に格納する。

　本変形例では、実施形態１のステップＳ１０３に相当する処理において、制御部２１は、記憶部２２に格納されたMPDデータ並びに、位置取得部３３が取得した、仮想空間内におけるユーザの位置及び姿勢（向き）を参照して、ユーザが位置するサブセットを選択する。

　上記の構成によれば、データ取得部３２は、ユーザが向いていない方向の仮想視点画像を取得しないので、通信処理量を節減する効果を奏する。

　〔変形例２〕
　実施形態１の第２の変形例について、図１、及び図１０～図１３に基づいて説明する。なお便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、説明を省略する。本変形例においては、ユーザが、仮想的な３次元空間に位置する構成について説明する。

　図１０は、３次元空間である仮想空間の一例を示す図である。本変形例に係る仮想視点画像生成部１１は、図１０に示すように、３次元の仮想空間上の任意の区間ごとに仮想視点画像を生成し、各仮想視点画像を構成するデータであるメディアセグメントを、MPDデータによって参照可能となるように記憶部４又は図１には図示しない記憶装置に格納する。

　図１１は、本変形例において、データ生成部１２が生成するMPDデータの例を示す図である。

　データ生成部１２は、図１１におけるSubset S1に示すような、３次元の仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブ空間を示すサブセットデータを含むMPDデータを生成する。また、本変形例においても隣接するサブ空間には、１又は複数の共通する仮想視点位置が含まれる。

　図１２は、データ生成部１２が、MPDデータに含ませるサブセットデータの一例を示す図である。図１２に例示するように、サブセットデータには、含まれる仮想視点位置の識別番号（図１２におけるP110及びP210等）、並びに３次元空間所上におけるサブ空間の中心位置(center_x、center_y、及びcenter_z)及び半径（radius）等が含まれていてもよい。

　本変形例においても、実施形態１と同様に、再生装置２０が当該MPDデータを参照し、ユーザが位置するサブセットに対応するメディアセグメントを受信し、以降の処理に用いる。

　上記の構成によれば、ユーザが仮想的な３次元空間に位置する場合においても、再生装置２０は、好適な仮想視点位置の画像を容易に指定できる。

　また、図１３は、仮想空間上を移動するユーザの一例を示す概略図である。サブセットを含むMPDデータを用いる上述した構成は、仮想視点画像生成部１１が、１次元の直線上の任意の位置に仮想視点画像を生成し、ユーザが仮想空間上の当該直線上を移動する場合においても適用可能である。

　なお、上述した変形例１及び変形例２は、後述する各実施形態に対しても適宜の適用が可能である。

　〔実施形態２〕
　本発明の第２の実施形態について、図１及び図１４～図１６に基づいて説明する。本実施形態においては、各仮想視点画像に合成レベルを規定する画像再生システム１の構成について説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。

　〔１．画像再生システム１の構成〕
　本実施形態においても図１に示す構成を用いる。ただし、本実施形態に係る仮想視点画像生成部１１は、生成済みの仮想視点画像から再帰的に仮想視点画像を合成する機能を有する。また、データ生成部１２は、MPDデータを生成する場合に、各仮想視点画像に対応するAdaptationSetに対して、当該仮想視点画像が、何れの回数の再帰的な合成を経た画像であるかを示す合成レベルデータを含ませる。

　〔２．MPDデータについて〕
　本実施形態において生成装置が生成する仮想視点画像及びMPDデータについて、図１４～図１６に基づいて説明する。

　図１４は、仮想空間内における任意の位置にユーザが位置する様子を示す図である。ここで、各仮想視点画像は、カメラの撮影画像である０次仮想視点画像（図１４におけるP00、P04、P40、及びP44）、１次仮想視点画像（P20、P02、P22、P42、及びP24）、及び、２次仮想視点画像（P10及びP30等）に大別できる。

　仮想視点画像生成部１１は、複数の０次仮想視点画像から１次仮想視点画像を生成し、複数の０次又は１次仮想視点画像から２次仮想視点画像を生成する。

　図１５は、当該仮想視点画像を構成するデータそれぞれの取得先を構造化したデータであるMPDデータを示す図である。また、図１６は、本実施形態に係るMPDデータに含まれるAdaptationSetの記述例を示す図である。

　図１５における仮想視点合成レベル、及び図１６におけるlevelに例示するように、各仮想視点画像に対応する各AdaptationSetには、当該仮想視点画像が、上述した何れの分類（０次、１次又は２次仮想視点画像）に属する仮想視点画像であるかという情報である合成レベルデータが含まれる。また、図１５における参照仮想視点、及び図１６におけるrefIDに例示するように、各AdaptationSetには、当該AdaptationSetに対応する仮想視点画像が、何れの仮想視点位置に対応する仮想視点画像を参照して合成されたかを示す情報が含まれていてもよい。

　〔３．処理の流れ〕
　本実施形態における仮想視点画像再生に係る処理の流れについて図１及び図１４～図１６、図２２に基づいてステップごとに説明する。図２２は、本実施形態に係る処理の流れを示すフローチャートである。

　（Ｓ２０１）
　ステップＳ２０１において、再生装置２０は、MPDデータを受信する。生成装置２が備える通信制御部１３は、通信部５を介して、図１５に示すような、上述した合成レベルデータを含むMPDデータを再生装置２０へ送信する。データ取得部３２は、通信部２４を介して上記MPDデータを取得し、記憶部２２に格納する。

　（Ｓ２０２）
　続いて、ステップＳ２０２において、位置取得部３３は、仮想空間内におけるユーザの位置及び姿勢を取得する。また、制御部２１は、位置取得部３３が取得したユーザの位置情報を随時参照し、ユーザが仮想空間上を移動する速度を算出する。

　（Ｓ２０３）
　続いて、ステップＳ２０３において、データ取得部３２は、ステップＳ２０１において記憶部２２に格納されたMPDデータ内のAdaptationSetに含まれる合成レベルデータ、並びに、ステップＳ２０２において位置取得部３３が取得したユーザの位置、及び、制御部２１が算出したユーザの速度を参照して、何れの仮想視点画像を取得するかを決定する。例えば、データ取得部３２は、当該ユーザの移動速度が速い場合、ユーザの移動経路上の仮想視点位置に対応する仮想視点画像であっても、当該仮想視点画像が、上述した２次仮想視点画像であれば取得しない構成でもよい。

　あるいは、生成装置２及び再生装置２０間のネットワークにおける通信速度が遅く、再生装置２０側で１次仮想視点画像、２次仮想視点画像、又は双方を生成した方が画像再生システム１における総合的な処理速度が速い場合、データ取得部３２は、１次仮想視点画像、２次仮想視点画像、又は双方を生成装置２から取得しない構成でもよい。

　（Ｓ２０４）
　続いて、ステップＳ２０４において、データ取得部３２は、ステップＳ２０１において記憶部２２に格納されたMPDデータを参照し、ステップＳ２０３において取得することを決定した仮想視点画像を構成するメディアセグメントを取得し、記憶部２２に格納する。

　（Ｓ２０５）
　続いて、ステップＳ２０５において、再生処理部３１は、ステップＳ２０４において記憶部２２に格納された各メディアセグメントから、ユーザの移動経路上の仮想視点位置における仮想視点画像を合成する。

　（Ｓ２０６）
　続いて、ステップＳ２０６において、表示制御部３４は、ステップＳ２０５において再生処理部３１が合成した仮想視点画像と、ステップＳ２０２において位置取得部３３が取得したユーザの位置及び姿勢を参照して、表示部２３に、ユーザの仮想視点位置からの視界に相当する画像を表示させる。以上が本ステップＳ２０６における処理である。

　再生装置２０は、ステップＳ２０２において、位置取得部３３が、仮想空間内におけるユーザの位置及び姿勢を取得する処理から、ステップＳ２０６において、表示処理部が、表示部２３にユーザの仮想視点位置からの視界に相当する画像を表示させる処理を、ユーザが所定の終了操作を行うまで又はステップＳ２０１において記憶部２２に格納されたMPDデータが示す動画が終了するまで繰り返す。

　このように、本実施形態に係る生成装置２は、仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成部１１と、前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成部１２とを備え、前記仮想視点画像生成部１１は、生成済みの仮想視点画像から再帰的に仮想視点画像を合成し、前記データ生成部１２は、前記構造化データの前記仮想視点画像を構成するデータ群ごとに、前記仮想視点画像が何れの回数の再帰的な合成を経た画像であるかを示す合成レベルデータを含ませる。

　上記の構成によれば、生成装置２は、例えば、再生装置２０において、ユーザの仮想空間上の移動速度が速い場合に、視点合成に最低限必要な仮想視点画像だけを取得可能とするMPDデータを生成できる。また、本実施形態に係る再生装置２０は、仮想空間上の任意の区間ごとに生成された仮想視点画像を構成する各データの取得先を示す構造化データであって、仮想視点画像を構成するデータ群ごとに、前記仮想視点画像が何れの回数の再帰的な合成を経た画像であるかを示す合成レベルデータを含む構造化データを取得するデータ取得部３２を備え、前記データ取得部３２は、前記合成レベルデータを参照して、何れの仮想視点画像を取得するかを決定する。

　上記の構成によれば、再生装置２０は、例えばユーザの仮想空間上の移動速度が速い場合に、視点合成に最低限必要な仮想視点画像だけを取得し、画像再生に用いることができ、通信データ量等を節減する効果を奏する。

　〔実施形態３〕
　本発明の第３の実施形態について、図１及び図１７～図１９に基づいて説明する。本実施形態においては、仮想視点画像の配置パターンを、識別番号を用いて規定する画像再生システム１の構成について説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。

　〔１．画像再生システム１の構成〕
　本実施形態においても図１に示す構成を用いる。ただし、本実施形態に係るデータ生成部１２は、MPDデータを生成する場合に、仮想視点画像のそれぞれが何れの仮想視点位置に配置されるかを示す配置パターンデータを含ませる。

　〔２．MPDデータについて〕
　本実施形態において生成装置２が生成する仮想視点画像及びMPDデータについて、図１７～図１９に基づいて説明する。

　図１７は、仮想視点画像の配置パターンの一例を示す図である。図１７の（ａ）及び（ｂ）に例示するように、本実施形態に係る画像再生システム１においては、各仮想視点画像の仮想空間上の位置に対して識別番号が規定される。

　図１８は、当該仮想視点画像を構成するメディアセグメントそれぞれの取得先を構造化したデータであるMPDデータを示す図である。図１８における仮想視点配置パターン１に例示されるように、本実施形態に係るMPDデータには、前記仮想視点画像のそれぞれが何れの仮想視点位置に配置されるかを示す配置パターンデータが含まれる。なお、当該配置パターンデータの値が、どのような仮想視点位置の配置を示すかという情報は、事前に生成装置２及び再生装置２０間で共有されている。

　図１９は、本実施形態に係るMPDデータの記述例を示す図である。図１９に示すMPDデータにおいて、valueの値が仮想視点の配置パターンを示している。図１９に例示するように、仮想視点位置の配置パターンを示すデータは、MPDデータの直下ではなく、Period要素に含まれる構成でもよい。また、MPDデータに含まれるPeriod要素とは、所定の時間に分割した動画に対応する要素である。図１９を用いた以下の説明において、再生装置２０は、id=0であるPeriod 0に対応する動画を再生した後、次いで、id=1であるPeriod 1に対応する動画を再生するものとする。

　〔３．処理の流れ〕
　本実施形態における仮想視点画像再生に係る処理の流れについて図１及び図１７～図１９、図２３に基づいてステップごとに説明する。図２３は、本実施形態に係る処理の流れを示すフローチャートである。

　（Ｓ３０１）
　ステップＳ３０１において、データ取得部３２は、通信部２４を介して生成装置２が生成した本実施形態に係るMPDデータを取得し、記憶部２２に格納する。

　（Ｓ３０２）
　続いて、ステップＳ３０２において、位置取得部３３は、仮想空間内におけるユーザの位置及び姿勢を取得する。

　（Ｓ３０３）
　続いて、ステップＳ３０３において、データ取得部３２は、ステップＳ３０１において記憶部２２に格納されたMPDデータに含まれる配置パターンデータ、並びに、ステップＳ３０２において位置取得部３３が取得したユーザの位置を適宜参照して、Period 0に対応する動画の再生において、何れのAdaptationSetに対応する仮想視点画像を取得するかを決定する。

　（Ｓ３０４）
　続いて、ステップＳ３０４において、データ取得部３２は、ステップＳ３０１において記憶部２２に格納されたMPDデータを参照し、ステップＳ３０３において取得することを決定した仮想視点画像を構成するメディアセグメントを取得し、記憶部２２に格納する。

　（Ｓ３０５）
　続いて、ステップＳ３０５において、再生処理部３１は、ステップＳ３０４において記憶部２２に格納された各メディアセグメントから、ユーザの移動経路上の仮想視点位置における仮想視点画像を合成する。

　（Ｓ３０６）
　続いて、ステップＳ３０６において、表示制御部３４は、ステップＳ３０５において再生処理部３１が合成した仮想視点画像と、ステップＳ３０２において位置取得部３３が取得したユーザの位置及び姿勢を適宜参照して、表示部２３に、例えば、ユーザの仮想視点位置からの視界に相当する画像を表示させる。

　（Ｓ３０７）
　続いて、ステップＳ３０７において、次のPeriodが存在する場合にはステップ３０３以降の処理を繰り返す。図１９に示すMPDデータの例においては、Period 0における仮想視点位置の配置パターンと、Period 1における仮想視点位置の配置パターンとは異なるが、例えばデータ取得部３２は、ステップＳ３０３において決定したAdaptationSetと同じidを有するAdaptationSetに対応する仮想視点画像を取得することを決定してもよい。

　本実施形態に係る生成装置２は、仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成部１１と、前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成部１２とを備え、前記データ生成部１２は、前記仮想視点画像のそれぞれが何れの仮想視点位置に配置されるかを示す配置パターンデータを含む構造化データを生成する。

　上記の構成によれば、配置パターンデータを複数用意してPeriod間で切り替えることによって、ユーザが定位置にいながらPeriod毎に推奨する視点からの映像を再生させることができる生成装置２を実現できる。

　また、本実施形態に係る再生装置２０は、仮想空間上の任意の区間ごとに生成された仮想視点画像を構成する各データの取得先を示す構造化データであって、前記仮想視点画像のそれぞれが何れの仮想視点位置に配置されるかを示す配置パターンデータを含む構造化データを取得するデータ取得部３２を備え、前記データ取得部３２は、前記配置パターンデータを参照して、何れの仮想視点画像を取得するかを決定する。

　上記の構成によれば、ユーザが定位置にいながらPeriod毎に生成装置２側が推奨する視点からの映像を再生する再生装置２０を実現できる。

　〔変形例〕
　実施形態３の変形例について図２０、及び図２１に基づいて説明する。なお便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、説明を省略する。本変形例においては、生成装置２が生成する仮想視点画像が仮想空間上において疎である構成、つまり相対的に少ない構成における実施形態３との相違点について説明する。

　図２０は、仮想視点画像の配置パターンの一例を示す図である。また、図２１は、本変形例に係るMPDデータの記述例を示す図である。図２１のMPDデータに含まれるPeriod 0におけるvalueの値、1が、図２０の（ａ）に示す仮想視点画像の配置パターンに対応し、Period 1におけるvalueの値、4が、図２０の（ｂ）に示す仮想視点画像の配置パターンに対応する。図２０及び図２１に例示するように、生成装置２が生成する仮想視点画像の個数は、各Period間において異なっていてもよい。生成装置２が、一部又は全部のPeriodに対応する画像の再生区間において、再生装置２０での再生に必要の無い仮想視点画像を生成しないことにより、仮想視点画像生成部１１による仮想視点画像生成処理の処理量と、データ生成部１２が生成するMPDデータのデータ量とを軽減する効果を奏する。

　〔ソフトウェアによる実現例〕
　生成装置２の制御ブロック（特にデータ生成部１２）及び再生装置２０の制御ブロック（特に再生処理部３１）は、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ソフトウェアによって実現してもよい。

　後者の場合、生成装置２及び再生装置２０は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも１つのプロセッサ（制御装置）を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも１つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばＣＰＵ（Central Processing Unit）を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ＲＯＭ（Read Only Memory）等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するＲＡＭ（Random Access Memory）などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体（通信ネットワークや放送波等）を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

　〔まとめ〕
　本発明の態様１に係る生成装置２は、仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成部１１と、前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成部１２とを備え、データ生成部１２は、前記構造化データに、前記仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含ませる構成である。

　本発明の態様２に係る生成装置２は、仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成部１１と、前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成部１２とを備え、仮想視点画像生成部１１は、生成済みの仮想視点画像から再帰的に仮想視点画像を合成し、データ生成部１２は、前記構造化データの前記仮想視点画像を構成するデータ群ごとに、前記仮想視点画像が何れの回数の再帰的な合成を経た画像であるかを示す合成レベルデータを含ませる構成である。

　上記の構成によれば、生成装置２は、例えば、再生装置２０において、ユーザの仮想空間上の移動速度が速い場合に、視点合成に最低限必要な仮想視点画像だけを取得可能とするMPDデータを生成できる。

　本発明の態様３に係る生成装置２は、仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成部１１と、前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成部１２とを備え、データ生成部１２は、前記仮想視点画像のそれぞれが何れの仮想視点位置に配置されるかを示す配置パターンデータを含む構造化データを生成する構成である。

　本発明の態様４に係る再生装置２０は、仮想空間上の任意の区間ごとに生成された仮想視点画像を構成する各データの取得先を示す構造化データであって、前記仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含む構造化データを取得するデータ取得部３２と、仮想空間上におけるユーザの位置を取得する位置取得部３３とを備え、データ取得部３２は、前記構造化データと、位置取得部３３が取得した前記ユーザの位置とを参照し、ユーザが存在する前記所定の範囲に含まれる仮想視点位置に対応する仮想視点画像を構成する各データを取得する構成である。

　本発明の態様５に係る再生装置２０は、仮想空間上の任意の区間ごとに生成された仮想視点画像を構成する各データの取得先を示す構造化データであって、仮想視点画像を構成するデータ群ごとに、前記仮想視点画像が何れの回数の再帰的な合成を経た画像であるかを示す合成レベルデータを含む構造化データを取得するデータ取得部３２を備え、データ取得部３２は、前記合成レベルデータを参照して、何れの仮想視点画像を取得するかを決定する構成である。

　本発明の態様６に係る再生装置２０は、仮想空間上の任意の区間ごとに生成された仮想視点画像を構成する各データの取得先を示す構造化データであって、前記仮想視点画像のそれぞれが何れの仮想視点位置に配置されるかを示す配置パターンデータを含む構造化データを取得するデータ取得部３２を備え、データ取得部３２は、前記配置パターンデータを参照して、何れの仮想視点画像を取得するかを決定する構成である。

　本発明の態様７に係る生成方法は、装置によって実行されるデータの生成方法であって、仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成ステップと、前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成ステップとを含み、前記データ生成ステップにおいて、前記構造化データに、前記仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含ませる方法である。

　本発明の態様８に係る生成方法は、装置によって実行されるデータの生成方法であって、仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成ステップと、前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成ステップとを含み、前記仮想視点画像生成ステップにおいて、生成済みの仮想視点画像から再帰的に仮想視点画像を合成し、前記データ生成ステップにおいて、前記構造化データの前記仮想視点画像を構成するデータ群ごとに、前記仮想視点画像が何れの回数の再帰的な合成を経た画像であるかを示す合成レベルデータを含ませる方法である。

　本発明の態様９に係る生成方法は、装置によって実行されるデータの生成方法であって、仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成ステップと、前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成ステップとを含み、前記データ生成ステップにおいて、前記仮想視点画像のそれぞれが何れの仮想視点位置に配置されるかを示す配置パターンデータを含む構造化データを生成する方法である。

　本発明の態様１０に係る生成装置２としてコンピュータを機能させるための制御プログラムであって、前記コンピュータを前記生成装置２として機能させることを特徴とする制御プログラムは、上記の態様１から３までの何れかに記載の生成装置２としてコンピュータを機能させるための制御プログラムであって、前記コンピュータを前記生成装置２として機能させる構成としてもよい。

　本発明の態様１１に係る再生装置２０としてコンピュータを機能させるための制御プログラムであって、前記コンピュータを前記再生装置２０として機能させることを特徴とする制御プログラムは、上記の態様４から６までの何れかに記載の再生装置２０としてコンピュータを機能させるための制御プログラムであって、前記コンピュータを前記再生装置２０として機能させる構成としてもよい。

　本発明の態様１２に係る記録媒体は、態様１０に係る制御プログラムを記録したコンピュータ読み取り可能な記録媒体であってもよい。

　本発明の態様１３に係る記録媒体は、態様１１に係る制御プログラムを記録したコンピュータ読み取り可能な記録媒体であってもよい。

　本発明の各態様に係る生成装置２及び再生装置２０は、コンピュータによって実現してもよく、この場合には、コンピュータを上記生成装置２及び再生装置２０が備える各部（ソフトウェア要素）として動作させることにより上記生成装置２及び再生装置２０をコンピュータにて実現させる上記生成装置２及び再生装置２０の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

　本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

１　画像再生システム
２　生成装置
３、２１　制御部
４、２２　記憶部
５、２４　通信部
１１　仮想視点画像生成部
１２　データ生成部
１３、３５　通信制御部
２０　再生装置
２３　表示部
３１　再生処理部
３２　データ取得部
３３　位置取得部
３４　表示制御部

Claims

　仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成部と、
　前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成部とを備え、
　前記データ生成部は、
　　前記構造化データに、前記仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含ませる
ことを特徴とする生成装置。
　仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成部と、
　前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成部とを備え、
　前記仮想視点画像生成部は、生成済みの仮想視点画像から再帰的に仮想視点画像を合成し、
　前記データ生成部は、
　　前記構造化データの前記仮想視点画像を構成するデータ群ごとに、前記仮想視点画像が何れの回数の再帰的な合成を経た画像であるかを示す合成レベルデータを含ませる
ことを特徴とする生成装置。
　仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成部と、
　前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成部とを備え、
　前記データ生成部は、前記仮想視点画像のそれぞれが何れの仮想視点位置に配置されるかを示す配置パターンデータを含む構造化データを生成する
ことを特徴とする生成装置。
　仮想空間上の任意の区間ごとに生成された仮想視点画像を構成する各データの取得先を示す構造化データであって、前記仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含む構造化データを取得するデータ取得部と、
　仮想空間上におけるユーザの位置を取得する位置取得部とを備え、
　前記データ取得部は、前記構造化データと、前記位置取得部が取得した前記ユーザの位置とを参照し、ユーザが存在する前記所定の範囲に含まれる仮想視点位置に対応する仮想視点画像を構成する各データを取得する
ことを特徴とする再生装置。
　仮想空間上の任意の区間ごとに生成された仮想視点画像を構成する各データの取得先を示す構造化データであって、仮想視点画像を構成するデータ群ごとに、前記仮想視点画像が何れの回数の再帰的な合成を経た画像であるかを示す合成レベルデータを含む構造化データを取得するデータ取得部を備え、
　前記データ取得部は、前記合成レベルデータを参照して、何れの仮想視点画像を取得するかを決定する
ことを特徴とする再生装置。
　仮想空間上の任意の区間ごとに生成された仮想視点画像を構成する各データの取得先を示す構造化データであって、前記仮想視点画像のそれぞれが何れの仮想視点位置に配置されるかを示す配置パターンデータを含む構造化データを取得するデータ取得部を備え、
　前記データ取得部は、前記配置パターンデータを参照して、何れの仮想視点画像を取得するかを決定する
ことを特徴とする再生装置。
　装置によって実行されるデータの生成方法であって、
　仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成ステップと、
　前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成ステップとを含み、
　前記データ生成ステップにおいて、
　　前記構造化データに、前記仮想空間上における１又は複数の仮想視点位置を含む所定の範囲であって、互いに識別可能である１又は複数の所定の範囲を規定したサブセットデータを含ませる
ことを特徴とする生成方法。
　装置によって実行されるデータの生成方法であって、
　仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成ステップと、
　前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成ステップとを含み、
　前記仮想視点画像生成ステップにおいて、生成済みの仮想視点画像から再帰的に仮想視点画像を合成し、
　前記データ生成ステップにおいて、
　　前記構造化データの前記仮想視点画像を構成するデータ群ごとに、前記仮想視点画像が何れの回数の再帰的な合成を経た画像であるかを示す合成レベルデータを含ませる
ことを特徴とする生成方法。
　装置によって実行されるデータの生成方法であって、
　仮想空間上の任意の区間ごとに仮想視点画像を生成する仮想視点画像生成ステップと、
　前記仮想視点画像を構成する各データの取得先を示す構造化データを生成するデータ生成ステップとを含み、
　前記データ生成ステップにおいて、前記仮想視点画像のそれぞれが何れの仮想視点位置に配置されるかを示す配置パターンデータを含む構造化データを生成する
ことを特徴とする生成方法。
　請求項１から３までの何れか１項に記載の生成装置としてコンピュータを機能させるための制御プログラムであって、前記コンピュータを前記生成装置として機能させることを特徴とする制御プログラム。
　請求項４から６までの何れか１項に記載の再生装置としてコンピュータを機能させるための制御プログラムであって、前記コンピュータを前記再生装置として機能させることを特徴とする制御プログラム。
　請求項１０に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
　請求項１１に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。