WO2021002338A1

WO2021002338A1 - 情報処理装置、情報処理方法、再生処理装置及び再生処理方法

Info

Publication number: WO2021002338A1
Application number: PCT/JP2020/025591
Authority: WO
Inventors: 由佳木山; 遼平高橋; 平林　光浩
Original assignee: ソニー株式会社
Priority date: 2019-07-03
Filing date: 2020-06-29
Publication date: 2021-01-07
Also published as: US20220150461A1; EP3996376A4; JPWO2021002338A1; CN114026849A; US11985290B2; KR20220031560A; EP3996376A1

Abstract

利用者に高品質な視聴体験を提供する情報処理装置、情報処理方法、再生処理装置及び再生処理方法を提供する。メタデータ生成部は、第１ビューポイントを視点位置とする第１映像から遷移可能な第２映像における視点位置である第２ビューポイントを識別するための遷移識別情報を生成する。ファイル生成部は、前記第１映像のデータ及び前記遷移識別情報を含むファイルを生成する。

Description

情報処理装置、情報処理方法、再生処理装置及び再生処理方法

　本発明は、情報処理装置、情報処理方法、再生処理装置及び再生処理方法に関する。

　ＨＴＴＰ（Hypertext　Transfer　Protocol）によるアダプティブなコンテンツ配信技術の標準化規格として、ＭＰＥＧ－ＤＡＳＨ（Moving　Picture　Experts　Group　‐　Dynamic　Adaptive　Streaming　over　HTTP）が存在する。また、ＭＰＥＧ－ＤＡＳＨのファイルフォーマットとして、動画圧縮の国際標準技術「ＭＰＥＧ－４」のファイルコンテナ仕様であるＩＳＯＢＭＦＦ（International　Organization　for　Standardization　Base　Media　File　Format）が提供されている。

　ところで、いわゆる全天球映像のように、水平方向の周囲３６０度及び垂直方向の周期１８０度の画像を立体構造に投影した画像である立体構造画像を、平面画像としてマッピングした全天球画像を再生する映像がある。全天球映像は３ＤｏＦ（Degrees　of　Freedom）映像とも呼ばれ、全天球画像は投影平面画像や３ＤｏＦ画像とも呼ばれる。ＭＰＥＧ－Ｉ　ＯＭＡＦ（Omnidirectional　Media　Format）では、全天球画像を形成する立体構造画像の配信へのＭＰＥＧ－ＤＡＳＨの利用が検討されている。

　さらに、ＭＰＥＧ－Ｉ　Phase　1b　requirementにおいては、Multiple　Viewpointと呼ばれる複数視点からの全天球映像の配信技術が提案されている。このMultiple　Viewpointを用いることで、ある視点の全天球映像から、異なる視点の全天球映像に映像を切り替えてコンテンツをユーザに提供することが可能となる。ビューポイント（Viewpoint）とは、全天球映像における視点位置である。

"ISO/IEC"　14496-12:2015　Information　technology.　Coding　of　audio-visual　objects.　Part　12:ISO　base　media　file　format,　2015-12

　しかしながら、クライアント装置は、現在見ている全天球映像から、他のどの全天球映像に遷移可能かといった製作者の意図を示す情報を有さない。クライアント装置が遷移可能な全天球映像を示す情報などを有さない配信システムでは、遷移可能な全天球映像への遷移を含む視聴体験を提供することは困難であり、視聴者の視聴体験の品質を損なうおそれがある。

　また、映像遷移を実現する機能は、クライアント装置に対して実装された機能の種類に依存するため、コンテンツの再生する際に製作者の意図が適切に反映されるとは限らない。そのため、利用者の視聴体験の品質を損ねるおそれがある。

　そこで、本開示では、利用者に高品質な視聴体験を提供する情報処理装置、情報処理方法、再生処理装置及び再生処理方法を提供する。

　本開示によれば、メタデータ生成部は、第１ビューポイントを視点位置とする第１映像から遷移可能な第２映像における視点位置である第２ビューポイントを識別するための遷移識別情報を生成する。ファイル生成部は、前記第１映像のデータ及び前記遷移識別情報を含むファイルを生成する。

配信システムの一例のシステム構成図である。ファイル生成装置のブロック図である。遷移識別情報の格納を説明するための図である。クライアント装置のブロック図である。ファイル生成装置によるファイル生成処理のフローチャートである。メタデータの作成処理のフローチャートである。クライアント装置により実行される再生処理のフローチャートである。ビューポイントの遷移処理のフローチャートである。 VWPT　descriptorの拡張例を表す図である。 VWPT　descriptorにViewpintInfo.SwitchableContentを含ませたＭＰＤファイルの一例を表す図である。遷移先をビューポイントグループとする遷移識別情報の格納例を示す図である。 SphereRegionStruct()及びRegionForViewpoint()の一例を表す図である。オーバーレイのコントロール構造を表す図である。 SphereRelativeOmniOverlay()及びAssociatiedSpereRegion()の一例を表す図である。遷移実行領域情報を格納するための新たなに新たなコントロール構造を加えたoverlay_control_struct()の一例を表す図である。 Associatedviewpointregion()の一例を表す図である。遷移識別情報を格納するための新たなに新たなコントロール構造を加えたoverlay_control_struct()の一例を表す図である。 Associatedviewpointregion()及びAssociatedViewpoint()の一例を表す図である。映像表示領域を遷移実行領域に流用する場合のAssociatedSphereRegion()の一例を表す図である。一定時間後に遷移実行領域情報を表示する場合のRegionForViewpoint()の一例を表す図である。ユーザインタラクションを切り替える場合のRegionForViewpoint()の一例を表す図である。 Matroska　Media　Containerのフォーマットを表す図である。コンピュータのハードウェア構成図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付すことにより重複する説明を省略する。また、本技術で開示される範囲は、実施形態の内容に限定されるものではなく、出願当時において公知となっている以下の非特許文献におき記載されている内容も含まれる。

　非特許文献１：（上述）
　非特許文献２：ISO/IEC　23090-2:2019　Information　technology.　Coded　representation　of　immersive　media.　Part　2:　Omnidirectional　media　format,　2019-01
　非特許文献３：N18393,　WD5　of　ISO/IEC　23090-2　OMAF　2nd　edition,　2019-05-16
　非特許文献４：m47385,　[OMAF]　Multiviewpoint　switching　transitions,　2019-03
　非特許文献５：”　Matroska　Media　Container”,　［令和２年３月１２日検索］，　インターネット　＜URL　：　https://www.matroscka.org/＞

　上述の非特許文献に記載されている内容も、参照により本実施例に組み込まれる。つまり、上述の非特許文献に記載されている内容もサポート要件について判断する際の根拠となる。例えば、非特許文献１～５に記載されているFile　Structureが発明の詳細な説明において直接的に定義されていない場合でも、本開示の範囲内であり、請求の範囲のサポート要件を満たすものとする。また、例えば、パース（Parsing）、シンタックス（Syntax）、セマンティクス（Semantics）などの技術用語についても同様に、発明の詳細な説明において直接的に定義されていない場合でも、本開示の範囲内であり、請求の範囲のサポート要件を満たすものとする。

　また、以下に示す項目順序に従って本開示を説明する。
　　１．第１の実施形態
　　　１．１　第１の実施形態の変形例（１）
　　　１．２　第１の実施形態の変形例（２）
　　２．第２の実施形態
　　　２．１　第２の実施形態の変形例（１）
　　　２．２　第２の実施形態の変形例（２）
　　　２．３　第２の実施形態の変形例（３）
　　　２．３　第２の実施形態の変形例（４）
　　３．第３の実施形態
　　４．第４の実施形態

［１．第１の実施形態］
（第１の実施形態に係る配信システムの構成）
　図１は、配信システムの一例のシステム構成図である。配信システム１００は、情報処理装置であるファイル生成装置１、再生処理装置であるクライアント装置２及びＷｅｂサーバ３を含む。ファイル生成装置１、クライアント装置２及びＷｅｂサーバ３は、ネットワーク４に接続される。そして、ファイル生成装置１、クライアント装置２及びＷｅｂサーバ３は、ネットワーク４を介して相互に通信可能である。ここで、図１においては、各装置を１台ずつ示しているが、配信システム１００は、ファイル生成装置１及びクライアント装置２をそれぞれ複数台含んでもよい。

　ファイル生成装置１は、３ＤｏＦ映像を提供するデータである３ＤｏＦコンテンツを生成する。ファイル生成装置１は、生成した３ＤｏＦコンテンツをＷｅｂサーバ３にアップロードする。ここで、本実施形態では、Ｗｅｂサーバ３が３ＤｏＦコンテンツをクライアント装置２に提供する構成について説明するが、配信システム１００は他の構成を採ることも可能である。例えば、ファイル生成装置１が、Ｗｅｂサーバ３の機能を含み、生成した３ＤｏＦコンテンツを自装置内に格納し、クライアント装置２に提供する構成であってもよい。

　Ｗｅｂサーバ３は、ファイル生成装置１からアップロードされた３ＤｏＦコンテンツを保持する。そして、Ｗｅｂサーバ３は、クライアント装置２からの要求にしたがい指定された３ＤｏＦコンテンツを提供する。

　クライアント装置２は、３ＤｏＦコンテンツの送信要求をＷｅｂサーバ３へ送信する。そして、クライアント装置２は、送信要求で指定した３ＤｏＦコンテンツをＷｅｂサーバ３から取得する。そして、クライアント装置２は、３ＤｏＦコンテンツをデコードして映像を生成して、その映像をモニタなどの表示装置に表示させる。

（第１の実施形態に係るファイル生成装置の構成）
　次に、ファイル生成装置１の詳細について説明する。図２は、ファイル生成装置のブロック図である。情報処理装置であるファイル生成装置１は、図２に示すように、ファイル生成処理部１０、制御部１１及び通信部１２を有する。制御部１１は、ファイル生成処理部１０の制御に関する処理を実行する。例えば、制御部１１は、ファイル生成処理部１０の各部の動作タイミングなどの統括制御を行う。ファイル生成処理部１０は、データ取得部１０１、符号化部１０２、メタデータ生成部１０３及びファイル生成部１０４を有する。

　データ取得部１０１は、３ＤｏＦ映像を表示させる３ＤｏＦコンテンツの元データの入力を受け付ける。３ＤｏＦコンテンツの元データには、３ＤｏＦ画像を生成するための画像データ及びメタデータを生成するための制御情報が含まれる。制御情報は、例えば、各画像データの時間情報、各画像データの視点位置情報及び各画像データから遷移可能な画像データの情報が含まれる。また、制御情報には、各画像データに対応するビューポイントを示す情報、各ビューポイントの位置情報及び遷移可能なビューポイントとの対応を示す情報などが含まれる。データ取得部１０１は、取得した３ＤｏＦコンテンツの元データに含まれる画像データを符号化部１０２へ出力する。また、データ取得部１０１は、取得した３ＤｏＦコンテンツの元データに含まれる制御情報をメタデータ生成部１０３へ出力する。

　符号化部１０２は、画像データの入力をデータ取得部１０１から受ける。そして、符号化部１０２は、画像データに符号化処理を施して３ＤｏＦ画像データを生成する。そして、符号化部１０２は、生成した３ＤｏＦ画像データをファイル生成部１０４へ出力する。

　以下では、視点位置をビューポイントと呼ぶ場合がある。さらに、３ＤｏＦ画像データが様々な視点位置から見た場合の画像であることを強調する場合、「ビューポイント画像データ」と呼び、そのビューポイント画像データを再生した場合に表示される全天球画像を「ビューポイント画像」と呼ぶ場合がある。

　メタデータ生成部１０３は、制御情報の入力をデータ取得部１０１から受ける。次に、メタデータ生成部１０３は、制御情報をもとにメタデータを生成する。メタデータには、どのようなコーデックで圧縮するかなどの画像生成及び再生に関する制御情報などが含まれる。さらに、メタデータ生成部１０３は、メタデータとして以下の情報を生成する。

　メタデータ生成部１０３は、取得した制御情報から、各ビューポイントから遷移可能なビューポイントを識別するための遷移識別情報を生成する。具体的には、メタデータ生成部１０３は、各ビューポイントに対して識別情報であるviewpoint_idを割り当てる。さらに、メタデータ生成部１０３は、遷移元のビューポイントの識別情報に遷移可能なビューポイントの識別情報を対応付ける。この遷移識別情報を用いることで、クライアント装置２は、特定のビューポイントから遷移可能なビューポイントを識別可能となり、遷移可能なビューポイントへの遷移を実現できる。そして、メタデータ生成部１０３は、各ビューポイントでのビューポイント画像データに、そのビューポイントを遷移元とする遷移識別情報を対応付ける。

　また、メタデータ生成部１０３は、制御情報に含まれるビューポイントの位置情報から、遷移元のビューポイント画像における遷移先のビューポイントに対応する遷移実行領域の表示位置を算出する。次に、メタデータ生成部１０３は、算出した遷移実行領域の表示位置を用いて、各ビューポイント画像上での遷移実行領域を表す遷移実行領域情報を生成する。

　次に、メタデータ生成部１０３は、制御情報で指定された遷移を実行するトリガとなる操作を表す遷移トリガ情報を生成する。その後、メタデータ生成部１０３は、各ビューポイント画像データに対応する遷移実行領域情報及び遷移トリガ情報を対応付ける。このように、メタデータ生成部１０３は、遷移識別情報及び遷移実行領域情報を対応するビューポイント画像データに対応付けることにより、遷移可能なビューポイントを示す３ＤｏＦ画像データを生成する。

　その後、メタデータ生成部１０３は、遷移識別情報、遷移実行領域情報及び遷移トリガ情報を含むメタデータをファイル生成部１０４へ出力する。

　ファイル生成部１０４は、３ＤｏＦ画像データの入力を符号化部１０２から受ける。また、ファイル生成部１０４は、遷移識別情報、遷移実行領域情報及び遷移トリガ情報を含むメタデータの入力をメタデータ生成部１０３から受ける。そして、ファイル生成部１０４は、取得した３ＤｏＦ画像データをセグメント毎にＩＳＯＢＭＦＦファイルに格納することでファイル化し、３ＤｏＦ画像データのセグメントファイルを生成する。また、ファイル生成部１０４は、メタデータに含まれる遷移識別情報、遷移実行領域情報及び遷移トリガ情報などの各種情報を各ＩＳＯＢＭＦＦファイルに格納する。ＩＯＳＢＭＦＦファイルの各TrackBoxには、１つのビューポイント画像に関する情報が含まれる。以下では、ＩＯＳＢＭＦＦファイルの各TrackBoxを、単にtrackと呼ぶ場合がある。例えば、ＩＯＳＢＭＦＦファイルの各trackには、特定のビューポイント画像データへのリンクなどが含まれる。

　ここで、ファイル生成部１０４による遷移識別情報のＩＳＯＢＭＦＦファイルへの格納について説明する。ファイル生成部１０４は、遷移識別情報を格納するために、図３のシンタックス１１１で示されるViewpointTrackGroupBoxを生成する。図３は、遷移識別情報の格納を説明するための図である。

　ViewpointTrackGroupBoxは、ＯＭＡＦのMultiple　Viewpointを用いる場合に使用されるＢｏｘである。ViewpointTrackGroupBoxは、ＩＳＯＢＭＦＦファイルのTrackBoxに含まれるＢＯＸであり、そのTrackBoxに含まれる映像のビューポイントの情報、位置情報、グループ情報、座標回転情報などが格納される。すなわち、ViewpointTrackGroupBoxは、１つのビューポイント画像データに対応する。

　シンタックス１１２におけるsigned　viewpoint_lavelが、trackに含まれる映像のビューポイントの情報を表す。ビューポイントの情報は、例えば、ビューポイントの識別情報であるviewpoint_idであり、track_group_idと一致する。また、ViewPosStruct()は、ビューポイントの位置情報を表す。

　ViewpointGroupStruct()は、ビューポイントをグループ化するための情報であり、VWPT_group_id及びVWPT_group_descrptionを有する。ビューポイントのグループとは、例えば、ある建物内におけるビューポイントをまとめたグループなどである。グループ内では同じ座標が用いられる。

　ViewpointGlobalCoordinateSysRotationStruct()は、ビューポイントが参照する座標系のグローバル座標系における回転情報を有する。ViewpointGlobalCoordinateSysRotationStruct()は、撮影時のセッティングに依存する。ViewpointGlobalCoordinateSysRotationStruct()により、２つのビューポイントの関係を表すことができる。

　さらに、本実施形態に係るファイル生成部１０４は、シンタックス１１１に示すようにViewpointTrackGroupBoxを拡張して、遷移識別情報を表すSwitchableContentStruct()をViewpointTrackGroupBoxに格納する。

　ファイル生成部１０４は、シンタックス１１２で示すSwitchableContentStruct()を新たに定義する。ファイル生成部１０４は、SwitchableContentStruct()により、ある視点における全天球映像であるビューポイント画像から遷移可能なビューポイントを識別するための遷移識別情報を表す。このように、遷移識別情報であるSwitchableContentStruct()をViewpointTrackGroupBoxに格納することで、特定のビューポイント画像データを格納するＩＳＯＢＭＦＦファイルにそのビューポイント画像データに対応する遷移期別情報を格納する。

　ここで、本実施形態では、ファイル生成部１０４は、遷移識別情報であるSwitchableContentStruct()をViewpointTrackGroupBoxに格納したが、これに限らず、SiwtchableContentStruct()をTrackGroupTypeBox()内に格納することも可能である。さらに、ファイル生成部１０４は、特定のビューポイント画像データを格納するＩＳＯＢＭＦＦファイルにそのビューポイント画像データに対応する遷移実行領域情報及び遷移トリガ情報を格納する。これにより、ファイル生成部１０４は、３ＤｏＦコンテンツのセグメントファイルを完成させる。

　また、ファイル生成部１０４は、メタデータ生成部１０３から取得したメタデータを基に、ＭＰＤ（Media　Presentation　Description）ファイルを生成する。ＭＰＤファイルには、メディア種別、動画や音声のセグメントファイルの情報などの３ＤｏＦコンテンツのメタ情報が格納される。その後、ファイル生成部１０４は、生成した３ＦｏＦコンテンツのセグメントファイル及びＭＰＤファイルを通信部１２へ出力する。

　通信部１２は、３ＤｏＦ画像データ、メタデータ、遷移識別情報、遷移実行領域情報及び遷移トリガ情報が格納された３ＤｏＦコンテンツのセグメントファイル及びＭＰＤファイルをファイル生成部１０４から取得する。そして、通信部１２は、取得した３ＤｏＦコンテンツのセグメントファイル及びＭＰＤファイルをＷｅｂサーバ３に送信してアップロードする。

（第１の実施形態に係るクライアント装置の構成）
　図４は、クライアント装置のブロック図である。図４に示すように、クライアント装置２は、再生処理部２０、制御部２１及び通信部２２を有する。制御部２１は、再生処理部２０の各部の動作を制御する。例えば、制御部２１は、再生処理部２０の各部の動作のタイミングを統括制御する。再生処理部２０は、ファイル取得部２０１、計測部２０２、ファイル処理部２０３、復号処理部２０４、表示情報生成部２０５及び表示部２０６を有する。

　通信部２２は、３ＤｏＦコンテンツのセグメントファイル及びＭＰＤファイルをＷｅｂサーバ３から取得する。そして、通信部２２は、取得した３ＤｏＦコンテンツのセグメントファイル及びＭＰＤファイルをファイル取得部２０１へ出力する。

　ファイル取得部２０１は、再生する３ＤｏＦコンテンツに対応するＭＰＤファイルをＷｅｂサーバ３から通信部２２を介して取得する。ＭＰＤファイルには、３ＤｏＦコンテンツのデータの格納先の情報や、符号化速度や画像サイズなどの映像再生に関する情報が含まれる。そして、ファイル取得部２０１は、取得したＭＰＤファイルをファイル処理部２０３へ出力する。その後、ファイル取得部２０１は、再生する３ＤｏＦコンテンツのデータの格納先の情報の入力をファイル処理部２０３から受ける。

　ファイル取得部２０１は、取得した３ＤｏＦコンテンツのデータの格納先の情報を用いて３ＤｏＦコンテンツのデータの取得要求をＷｅｂサーバ３に行う。そして、ファイル取得部２０１は、３ＤｏＦコンテンツのセグメントファイルを取得する。その後、ファイル取得部２０１、３ＤｏＦコンテンツのセグメントファイルをファイル処理部２０３へ出力する。

　計測部２０２は、クライアント装置２とＷＥＢサーバとの間の伝送路の伝送帯域を計測する。そして、計測部２０２は、伝送帯域の計測結果をファイル処理部２０３へ出力する。また、計測部２０２は、ビューポイントの移動などの操作者の操作の入力を受ける。例えば、モニタに表示されている３ＤｏＦ画像に遷移実行領域が表示されている場合、操作者は、遷移実行領域をクリックするなどの操作を行う。そして、計測部２０２は、利用者の操作をファイル処理部２０３へ出力する。

　ファイル処理部２０３は、再生する３ＤｏＦコンテンツに対応するＭＰＤファイルの入力をファイル取得部２０１から受ける。そして、ファイル処理部２０３は、取得したＭＰＤファイルをパースして再生する３ＤｏＦコンテンツのデータを示す情報を取得する。また、ファイル処理部２０３は、適応配信に用いる複数のデータの認識も行う。例えば、ビットレートを切替える適応配信であれば、ファイル処理部２０３は、各ビットレートに対応する３ＤｏＦ画像データの情報を取得する。その後、ファイル処理部２０３は、再生する３ＤｏＦコンテンツを選択して、選択した３ＤｏＦコンテンツの情報をファイル取得部２０１へ出力する。

　ファイル処理部２０３は、再生する３ＤｏＦコンテンツのデータが格納されたセグメントファイルの入力をファイル取得部２０１から受ける。ファイル処理部２０３は、取得したセグメントファイルをパースする。そして、ファイル処理部２０３は、３ＤｏＦ画像データ、メタデータ、遷移識別情報、遷移実行領域情報及び遷移トリガ情報を取得する。

　また、ファイル処理部２０３は、伝送帯域の計測結果の入力を計測部２０２から受ける。そして、ファイル処理部２０３は、パース結果及び計測部２０２から取得した伝送帯域を示す情報等に基づいて、再生する３ＤｏＦ画像データを選択する。そして、ファイル処理部２０３は、選択した３ＤｏＦ画像データを復号処理部２０４へ出力する。また、ファイル処理部２０３は、取得したメタデータ及び遷移実行領域情報を表示情報生成部２０５へ出力する。

　また、ファイル処理部２０３は、操作者の操作の入力を計測部２０２から受ける。そして、ファイル処理部２０３は、入力された操作がビューポイントを遷移させる操作を受け付ける遷移実行領域に対する操作か否か遷移実行領域情報を用いて判定する。さらに、ファイル処理部２０３は、操作者の操作が、ビューポイントの遷移を発生させる遷移トリガとなる操作か否かを遷移トリガ情報から判定する。

　操作者の操作が遷移実行領域に対する遷移トリガとなる操作の場合、ファイル処理部２０３は、取得した遷移識別情報の中から、入力された操作に対応する遷移を行う場合の遷移先のビューポイントを取得する。そして、ファイル処理部２０３は、取得したビューポイントに応じた３ＤｏＦコンテンツを特定する。

　ファイル処理部２０３は、特定した３ＤｏＦコンテンツを未取得の場合は、特定した３ＤｏＦコンテンツの情報をファイル取得部２０１へ出力して特定した３ＤｏＦコンテンツの取得要求を行う。その後、ファイル処理部２０３は、特定した３ＤｏＦコンテンツのセグメントファイルを取得すると、パースを実行してその３ＤｏＦコンテンツの３ＤｏＦ画像データ、メタデータ及び遷移識別情報を取得する。そして、ファイル処理部２０３は、取得した３ＤｏＦ画像データを復号処理部２０４へ出力する。また、ファイル処理部２０３は、メタデータを表示情報生成部２０５へ出力して、３ＤｏＦコンテンツの切り替えを指示する。

　復号処理部２０４は、３ＤｏＦ画像データの入力をファイル処理部２０３から受ける。そして、復号処理部２０４は、取得した３ＤｏＦ画像データのデータに対して復号処理を施す。その後、復号処理部２０４は、復号処理を施した３ＤｏＦ画像データを表示情報生成部２０５へ出力する。

　表示情報生成部２０５は、復号された３ＤｏＦ画像データの入力を復号処理部２０４から受ける。また、表示情報生成部２０５は、メタデータ及び遷移実行領域情報の入力をファイル処理部２０３から受ける。そして、表示情報生成部２０５は、メタデータで指定された視点位置、視点方向及び時刻の情報を用いて、３ＤｏＦ画像データから表示用画像を生成する。さらに、表示情報生成部２０５は、表示用画像の遷移実行領域情報で指定された領域を遷移実行領域とする。その後、表示情報生成部２０５は、生成した表示用画像を表示部２０６に提供して表示させる。

　また、表示情報生成部２０５は、３ＤｏＦ画像データから生成した表示用の画像を表示部２０６に表示させている間に、３ＤｏＦコンテンツの切り替えの指示をファイル処理部２０３からする場合がある。その場合、表示情報生成部２０５は、ファイル処理部２０３から指定された３ＤｏＦコンテンツから３ＤｏＦ画像データを取得する。そして、表示情報生成部２０５は、取得した３ＤｏＦ画像データから生成した表示用画像の表示を表示部２０６に行わせて、ビューポイントの切り替えを行う。この場合も、表示情報生成部２０５は、ビューポイントの遷移後の表示用画像にも遷移実行領域を設ける。

　表示部２０６は、モニタなどの表示装置を有する。表示部２０６は、表示情報生成部２０５により生成された表示用画像の入力を受ける。そして、表示部２０６は、取得した表示用画像を表示装置に表示させる。

（第１の実施形態に係るファイル生成手順）
　次に、図５を参照して、ファイル生成装置１によるファイル生成処理の流れについて詳細に説明する。図５は、ファイル生成装置によるファイル生成処理のフローチャートである。

　データ取得部１０１は、３ＤｏＦコンテンツの元データを取得する。この元データには、複数のビューポイントから見た画像の画像データ及び制御情報が含まれる。そして、データ取得部１０１は、取得した元データに含まれる制御情報をメタデータ生成部１０３へ出力する。メタデータ生成部１０３は、制御情報を用いて、遷移識別情報、遷移実行領域情報及び遷移トリガ情報を含むメタデータを生成する（ステップＳ１０１）。

　また、データ取得部１０１は、取得した元データに含まれる画像データを符号化部１０２へ出力する。符号化部１０２は、画像データを用いて、複数のビューポイントから見た場合のそれぞれ画像のデータである複数のビューポイント画像データを生成する（ステップＳ１０２）。

　次に、メタデータ生成部１０３は、符号化部１０２により生成された各ビューポイント画像データに、遷移識別情報、遷移実行領域情報及び遷移トリガ情報を関連付けて、遷移可能なビューポイントを示すビューポイント画像データを生成する（ステップＳ１０３）。

　ファイル生成部１０４は、符号化されたビューポイント画像データを符号化部１０２から取得する。さらに、ファイル生成部１０４は、各ビューポイント画像データに対して遷移識別情報、遷移実行領域情報及び遷移トリガ情報を関連付ける情報を含むメタデータをメタデータ生成部１０３から取得する。そして、ファイル生成部１０４は、複数のビューポイント画像データを含む３ＤｏＦ画像データをセグメント毎にＩＳＯＢＭＦＦファイルに格納する。さらに、ファイル生成部１０４は、各ビューポイント画像データに対応する遷移識別情報、遷移実行領域情報及び遷移トリガ情報をＩＳＯＢＭＦＦファイルに格納して３ＤｏＦコンテンツのセグメントファイルを生成する（ステップＳ１０４）。

　次に、ファイル生成部１０４は、生成した３ＤｏＦコンテンツのセグメントファイルを通信部１２へ出力する。通信部１２は、ファイル生成部１０４により生成された３ＤｏＦコンテンツのセグメントファイルをＷｅｂサーバ３へ出力する（ステップＳ１０５）。

　次に、図６を参照して、メタデータの作成処理について詳細に説明する。図６は、メタデータの作成処理のフローチャートである。図６のフローチャートで示した処理は、図５におけるステップＳ１０１で実行される処理の一例にあたる。

　メタデータ生成部１０３は、データ取得部１０１から取得した制御情報で通知されたビューポイントのそれぞれに識別情報を割り当てる。次に、メタデータ生成部１０３は、制御情報に含まれる遷移可能なビューポイントの対応関係から、遷移元となるビューポイントからの遷移可能なビューポイントを示す遷移識別情報をビューポイント毎に識別情報を用いて生成する（ステップＳ１１１）。

　次に、メタデータ生成部１０３は、制御情報に含まれるビューポイントの位置情報から、遷移元のビューポイント画像における遷移先のビューポイントに対応する遷移実行領域の表示位置を算出する（ステップＳ１１２）。

　次に、メタデータ生成部１０３は、算出した遷移実行領域の表示位置を用いて、各ビューポイント画像上での遷移実行領域を表す遷移実行領域情報を生成する（ステップＳ１１３）。

　次に、メタデータ生成部１０３は、制御情報で指定された遷移を実行するトリガとなる操作を表す遷移トリガ情報を生成する（ステップＳ１１４）。その後、メタデータ生成部１０３は、使用するコーデックなどの画像生成及び再生に関する制御情報なども生成して、遷移識別情報、遷移実行領域情報及び遷移トリガ情報を含むメタデータの作成を終了する。

（第１の実施形態に係る再生処理手順）
　次に、図７を参照して、クライアント装置２により実行される再生処理の流れを説明する。図７は、クライアント装置により実行される再生処理のフローチャートである。

　ファイル取得部２０１は、再生する３ＤｏＦコンテンツに対応するＭＰＤファイルをＷｅｂサーバ３から通信部２２を介して取得する。次に、ファイル処理部２０３は、ＭＰＤファイルをパースして解析処理を実行する。そして、ファイル取得部２０１は、解析結果からファイル処理部２０３により特定された再生する３ＤｏＦコンテンツのセグメントファイルをＷｅｂサーバ３から取得する（ステップＳ２０１）。

　ファイル処理部２０３は、ファイル取得部２０１が取得した３ＤｏＦコンテンツのセグメントファイルをパースする。次に、ファイル処理部２０３は、パースにより得られたメタデータの解析処理を実行する（ステップＳ２０２）。

　そして、ファイル処理部２０３は、操作者の動作の入力を計測部２０２から受けている場合はその情報も加味して、メタデータの解析処理結果から再生するコンテンツ構成を決定する（ステップＳ２０３）。

　ファイル処理部２０３は、決定したコンテンツ構成にしたがって、３ＤｏＦコンテンツのセグメントファイルを取得する（ステップＳ２０４）。

　ファイル処理部２０３は、取得した３ＤｏＦコンテンツのセグメントファイルから３ＤｏＦ画像データを取得して復号処理部２０４へ出力する。復号処理部２０４は、３ＤｏＦ画像データに対して復号処理を施す。その後、復号処理部２０４は、復号した３ＤｏＦ画像データを表示情報生成部２０５へ出力する。表示情報生成部２０５は、メタデータに含まれる情報を用いて遷移実行領域を含む表示用画像を生成して表示部２０６に表示させる視聴処理を実行する（ステップＳ２０５）。

　次に、図８を参照して、ビューポイントの遷移処理の詳細について説明する。図８は、ビューポイントの遷移処理のフローチャートである。

　ファイル処理部２０３は、３ＤｏＦコンテンツのセグメントファイルをパースしてメタデータを取得し、メタデータから遷移識別情報、遷移実行領域情報及び遷移トリガ情報を取得する（ステップＳ２１１）。

　次に、ファイル処理部２０３は、表示する３ＤｏＦ画像データを取得する（ステップＳ２１２）。

　次に、ファイル処理部２０３は、取得した３ＤｏＦ画像データを復号処理部２０４へ出力する。また、ファイル処理部２０３は、取得したメタデータを表示情報生成部２０５へ出力する。復号処理部２０４は、３ＤｏＦ画像データの復号を行い、復号した３ＤｏＦ画像データを表示情報生成部２０５へ出力する。表示情報生成部２０５は、３ＤｏＦ画像データ及びメタデータから表示用画像を生成し表示部２０６に表示させる（ステップＳ２１３）。

　その後、ファイル処理部２０３は、操作者の操作の通知を計測部２０２から受ける（ステップＳ２１４）。

　次に、ファイル処理部２０３は、入力された操作が遷移実行領域に対する遷移トリガとなる操作であることを確認する。そして、ファイル処理部２０３は、操作に応じて遷移先のビューポイントを特定する。次に、ファイル処理部２０３は、特定した遷移先のビューポイントのビューポイント画像データを含むセグメントファイルを取得する（ステップＳ２１５）。

　次に、ファイル処理部２０３は、遷移先のビューポイント画像データを取得して復号処理部２０４に復号を行わせた上で、表示情報生成部２０５へ送信して、コンテンツの切り替えを指示する。表示情報生成部２０５は、遷移先のビューポイント画像データとともに、コンテンツの切り替えの指示をファイル処理部２０３から受ける。その後、表示情報生成部２０５は、取得したビューポイント画像データから表示用画像を生成して、表示部２０６に表示させることで、表示用画像のビューポイントを遷移先のビューポイントに切り替える（ステップＳ２１６）。

　以上に説明したように、本実施形態に係るファイル生成装置は、各３ＤｏＦ画像のビューポイントに対して遷移可能なビューポイントを表す情報を生成して対応付けて３ＤｏＦコンテンツの中に格納する。これにより、クライアント装置は、表示中の３ＤｏＦ画像のビューポイントから遷移可能なビューポイントを識別して操作者に提供することができる。また、提供された遷移可能なビューポイントの中から遷移先のピューポイントを指定して切り替えを操作者が指示すると、クライアント装置は、現在のビューポートから見た３ＤｏＦ画像から、指定されたビューポイントから見た３ＤｏＦ画像への切り替えが行える。すなわち、本実施形態に係る配信システムでは、操作者は、遷移可能なビューポイントを認識でき、遷移可能なビューポイントの中から遷移先のビューポイントを指定することで、所望の映像へ遷移させることができる。これにより、製作者の意図したとおりに遷移してほしい画像への遷移といった視聴体験を利用者に提供することができ、利用者に高品質な視聴体験を提供することができる。

［１．１　第１の実施形態の変形例（１）］
　次に、第１の実施形態の変形例（１）について説明する。本変形例では、遷移識別情報が、ＭＰＥＧ－ＤＡＳＨで規定されたVWPT　descriptor内に格納される。

　本変形例に係るメタデータ生成部１０３は、遷移識別情報を格納するためにＭＰＤファイルにおけるVWPT　descriptorを図９に示すように拡張する。図９は、VWPT　descriptorの拡張例を表す図である。メタデータ生成部１０３は、図９の最下行から２行のViewPointInfo.SwitchableContent及びViewPointInfo.SwitchableContent@contentをVWPT　descriptorに新たに規定する。ViewPointInfo.SwitchableContent@contentが、ビューポイントの識別情報を表す。

　ファイル生成部１０４は、図１０に示すシンタックスで表される３ＤｏＦコンテンツのＭＰＤファイルを生成し、VWPT　descriptorにViewpintInfo.SwitchableContentを格納する。図１０は、VWPT　descriptorにViewpintInfo.SwitchableContentを含ませたＭＰＤファイルの一例を表す図である。図１０のＭＰＤファイルでは、ビューポイント毎にAdaptationoSetが設けられ、その中のSwitchableContent　contentの値によりそのビューポイントから遷移可能なビューポイントのＩＤが表される。

　以上に説明したように、遷移識別情報は、VWPT　descriptorに格納することも可能である。このように、VWPT　descriptorに格納しても、クライアント装置に遷移可能なビューポートの識別情報を提供することができ、利用者に高品質な視聴体験を提供することができる。

［１．２　第１の実施形態の変形例（２）］
　次に、第１の実施形態の変形例（２）について説明する。本変形例では、遷移可能な遷移先のビューポイントを複数の含むビューポイントグループの情報が、遷移識別情報として用いられる。

　本変形例に係るメタデータ生成部１０３は、各ビューポイントに識別情報を付加する。さらに、メタデータ生成部１０３は、複数のビューポイントをまとめたビューポイントグループを生成して識別情報を付加する。例えば、メタデータ生成部１０３は、ビューポイントの識別情報をグループ化してビューポンとグループを生成する。そして、メタデータ生成部１０３は、各ビューポイントについて、そのビューポイントから遷移可能なビューポイントをまとめたビューポイントグループを選択する。そして、メタデータ生成部１０３は、ビューポイント及びビューポイントグループの識別情報を用いて、各ビューポイントのビューポイント画像データから遷移可能なビューポイントグループを識別するための遷移識別情報を生成する。その後、メタデータ生成部１０３は、遷移識別情報をファイル生成部１０４へ出力する。

　ファイル生成部１０４は、遷移識別情報の入力をメタデータ生成部１０３から受ける。そして、ファイル生成部１０４は、図１１のシンタックス１３１で示される遷移識別情報を表すSwitchableContentStruct()を新たに定義する。シンタックス１３１における、VQPT_group_idが、ビューポイントグループの識別情報にあたる。図１１は、遷移先をビューポイントグループとする遷移識別情報の格納例を示す図である。さらに、メタデータ生成部１０３は、SwitchableContentStruct()をＩＳＯＢＭＦＦファイルのViewpointTrackGroupに格納する。これにより、ファイル生成部１０４は、そのＩＳＯＢＭＦＦファイルに格納されたビューポイント画像データと遷移識別情報とを対応付けてそのビューポイント画像データから遷移可能なビューポイントグループを識別可能にする。

　以上では、ビューポイントグループを遷移先としたが、他の映像の情報を遷移先とすることも可能である。例えば、メタデータ生成部１０３は、遷移先の他の映像を表す情報として、ＭＰＤを表すＵＲＬ（Uniform　Resource　Locator）やＷｅｂ上の位置を表すＵＲＬなどといったＵＲＬで指定される他の映像へのアクセス情報を用いることができる。この場合、メタデータ生成部１０３は、遷移先を他の映像とした遷移識別情報を生成しファイル生成部１０４へ出力する。

　ファイル生成部１０４は、遷移先を他の映像とした遷移識別情報の入力をメタデータ生成部１０３から受ける。そして、ファイル生成部１０４は、図１１のシンタックス１３２で示されるSwitchableContentStruct()を新たに定義して遷移識別情報を格納する。シンタックス３２では、ＭＰＤ＿ＵＲＬが、遷移先の他の映像の識別情報にあたる。

　以上に説明したように、本変形例に係るファイル生成装置では、遷移先としてビューポイント以外を指定して、クライアント装置に遷移先を識別可能にさせた。このように、ビューポイント以外でも遷移先と指定することで、特定のビューポイント画像データで表される画像からの遷移先を利用者に提供することができ、利用者に高品質な視聴体験を提供することができる。

［２．第２の実施形態］
　本実施形態では、映像を遷移させるために使用される操作を受け付ける領域となる遷移実行領域を示す遷移実行領域の生成について詳細に説明する。本実施形態に係るファイル生成装置１は、ビューポイントを遷移させるためのインタラクティブな領域として遷移実行領域を提供する。本実施例に係るファイル生成装置１も図２のブロック図で表される。以下の説明では、第１の実施形態と同様の各部の処理については説明を省略する場合がある。

　メタデータ生成部１０３は、制御情報に含まれるビューポイントの位置情報及び方向情報から、遷移元のビューポイント画像における遷移先のビューポイントに対応する遷移実行領域の表示位置を算出する。メタデータ生成部１０３は、例えば、遷移実行領域のサイズ及びビューポート画像である全天球映像における表示位置を求めて遷移実行領域情報とする。本実施形態では、メタデータ生成部１０３は、全天球映像上のインタラクティブな矩形領域を遷移実行領域とする。遷移実行領域が矩形の場合、遷移実行領域のサイズは縦横の長さで表される。例えば、メタデータ生成部１０３は、全天球画像上においてビューポイント方向に遷移可能なビューポイントの情報を表示する領域として遷移実行領域を決定して遷移実行領域情報を生成する。さらに、メタデータ生成部１０３は、その遷移実行領域とその遷移実行領域に対応するビューポイントの識別情報とを対応付ける情報を生成する。

　そして、メタデータ生成部１０３は、遷移実行領域情報、及び、遷移実行領域とその遷移実行領域に対応するビューポイントとを対応付ける情報をファイル生成部１０４へ出力する。この時、メタデータ生成部１０３は、遷移識別情報もファイル生成部１０４へ出力する。

　ファイル生成部１０４は、遷移識別情報、遷移実行領域情報及び遷移実行領域とその遷移実行領域に対応するビューポイントとを対応付ける情報の入力をメタデータ生成部１０３から受ける。次に、ファイル生成部１０４は、矩形領域である遷移実行領域を示すSphereRegionStruct()を生成する。そして、ファイル生成部１０４は、図１２に示すSphereRegionStruct()及び遷移識別情報を格納するRegionForViewpoint()を新たに定義する。図１２は、SphereRegionStruct()及びRegionForViewpoint()の一例を表す図である。シンタックス２１１におけるSphereRegionStruct()が遷移実行領域情報にあたる。また、シンタックス２１１では、viewpoint_idにより遷移可能なビューポイントが示される遷移識別情報が格納される。すなわち、RegionForViewpoint()には、遷移識別情報及び遷移実行領域情報の両方が格納される。

　さらに、ファイル生成部１０４は、シンタックス２１２で示すようにViewpointTrackGroupを拡張して、新たに定義したRegionForViewpoint()をViewpointTrackGroupに格納する。すなわち、ファイル生成部１０４は、ＩＳＯＢＭＦＦファイルのTracckBoxにおけるViewpointTrackGroupBoxに遷移実行領域情報を格納する。クライアント装置２は、ViewpointTrackGroupBoxに格納された遷移実行領域情報を用いて、３ＤｏＦ映像を視聴する利用者に対して、遷移先の映像に関する情報をインタラクティブな視覚情報として提供することができる。

　以上に説明したように、本実施例に係るファイル装置は、ビューポイントを遷移させるためのインタラクティブな領域を遷移実行領域として３ＤｏＦ画像である全天球映像上に配置させる。そして、クライアント装置は、全天球画像上に遷移実行領域情報を配置して表示することで、利用者にインタラクティブな遷移実行領域を提供することができ、利用者の視聴体験の質を向上させることができる。

［２．１　第２の実施形態の変形例（１）］
　本変形例に係るファイル生成装置１は、遷移実行領域をＯＭＡＦの技術を用いてクライアント装置２に提供する。ここで、ＯＭＡＦのオーバーレイについて説明する。

　既存のＯＭＡＦ技術には、全天球映像上に他の映像などを重畳する技術として、オーバーレイが規定されている。オーバーレイにより重畳される映像は、動画又は静止画どちらでもよい。重畳する映像に関する情報の格納先としてＩＳＯＢＭＦＦにおいてOverlayStruct()が規定されている。OverlayStruct()は、動画であればＩＳＯＢＭＦＦファイルにおけるVisualDample()内に格納され、静止画であればＩＳＯＢＭＦＦファイルにおけるItemPropertyContainerBox()内に格納される。

　図１３は、オーバーレイのコントロール構造を表す図である。OverlayStruct()内には、図１３における表２２１で表されるコントロール構造を内容とするOverlay_control_struct[i]が規定されている。Overlay_control_struct[i]は、ｉの値により種々のオーバーレイの構造を表すプロパティ情報が提供される。これらのプロパティのうち、ｉ＝１の場合のSphereRelativeOmniOverlay()は、全天球映像上のオーバーレイ領域を示すプロパティである。また、ｉ＝１０の場合のAssociatedSphereRegion()は、オーバーレイに関連する領域を示すプロパティであり、この領域がクリックされることで、紐づくオーバーレイの表示と非表示とを切り替えることが可能である。

　本変形例に係るファイル生成装置１は、以上に説明したＯＭＡＦのオーバーレイの技術を用いて遷移実行領域をクライアント装置２に提供する。以下に、本変形例における各部の処理について説明する。

　メタデータ生成部１０３は、遷移実行領域を算出する。そして、メタデータ生成部１０３は、ＯＭＡＦのオーバーレイに対応するように遷移実行情報を生成する。その後、メタデータ生成部１０３は、遷移実行情報をファイル生成部１０４へ出力する。

　ファイル生成部１０４は、遷移実行領域情報の入力をメタデータ生成部１０３から受ける。そして、ファイル生成部１０４は、図１４におけるシンタックス２２２で表されるSphereRelativeOmniOverlay()を使用して、遷移実行領域を表示する全天球画像上の映像表示領域をオーバーレイで示す。図１４は、SphereRelativeOmniOverlay()及びAssociatiedSpereRegion()の一例を表す図である。

　SphereRelativeOmniOverlay()は、全天球画像上のオーバーレイの映像表示領域を示す。シンタックス２２２におけるproj_picture_width及びproj_picture_hightがオーバーレイの映像表示領域に張り付ける画像を表す。また、シンタックス２２２におけるproj_reg_width、roj_reg_hight、proj_reg_top及びproj_reg_reftが画像の貼り付け先となるオーバーレイの映像表示領域を表す。

　さらに、本実施形態に係るファイル生成部１０４は、オーバーレイのコントロール構造におけるOverlay_control_struct[10]の場合のAssociatedSphereRegion()を遷移実行領域の格納に使用する。AssociatiedSpereRegion()は、オーバーレイに関連する領域を示す。AssociatiedSpereRegion()で示される領域は、例えばクリックされるなどの操作が行われた場合に、その領域紐づくオーバーレイの表示と非表示とを切り替えることができる領域である。

　この場合、ファイル生成部１０４は、図１４におけるシンタックス２２３で表されるAssociatiedSpereRegion()を生成する。ここで、ファイル生成部１０４は、遷移実行領域と遷移可能なビューポイントとを紐づけるために、シンタックス２２３で示すようにAssociatiedSpereRegion()を拡張して、紐づくビューポイントの識別情報であるviewpoint_idを格納する。

　以上に説明したように、本変形例ではＯＭＡＦのオーバーレイの技術を用いて全天球映像上に遷移実行領域を表示させる。これにより、利用者は、全天球映像上に表示された遷移実行領域を確認することができ、ビューポイントの移動を容易に行うことができる。

［２．２　第２の実施形態の変形例（２）］
　本変形例に係るファイル生成装置１は、オーバーレイの構造に新たな定義を加えてその構造を使用して遷移実行領域情報を格納する。以下に、本変形例における遷移実行領域情報の格納方法の詳細について説明する。

　ファイル生成部１０４は、AssociatedSphereRegion()を使用する代わりに、図１５の表２３１に示すように、オーバーレイのコントロール構造を表すoverlay_control_struct()に、遷移実行領域情報を格納するための新たなに新たなコントロール構造を規定する。図１５は、遷移実行領域情報を格納するための新たなに新たなコントロール構造を加えたoverlay_control_struct()の一例を表す図である。本変形例では、ファイル生成部１０４は、overlay_control_struct()に新たなコントロール構造としてｉ＝１２にAssociatedviewpointregion()を追加する。

　そして、ファイル生成部１０４は、図１６に示すようなシンタックス２３２で表されるAssociatedviewpointregion()を生成する。図１６は、Associatedviewpointregion()の一例を表す図である。この場合も、ファイル生成部１０４は、遷移実行領域をビューポイントに紐づける情報をのAssociatedviewpointregion()に格納する。

　以上に説明したように、本変形例ではオーバーレイに新たなコントロール構造を定義して全天球映像上に遷移実行領域を表示させる。このような方法でも、利用者は、全天球映像上に表示された遷移実行領域を確認することができ、ビューポイントの遷移を容易に行うことができる。

［２．３　第２の実施形態の変形例（３）］
　上述した第２の実施形態の変形例（１）では、遷移実行領域と遷移可能なビューポイントとを紐づけるために、AssociatedSphereRedionを拡張した。これに対して、本変形例に係るファイル生成装置１は、オーバーレイの構造に新たな定義を加えてその構造を使用して遷移実行領域と遷移可能なビューポイントとを紐づける。以下に、本変形例における遷移実行領域の格納方法の詳細について説明する。

　本実施形態に係るファイル生成部１０４は、オーバーレイのコントロール構造におけるOverlay_control_struct[10]の場合のAssociatedSphereRegion()を遷移実行領域情報の格納に使用する。また、ファイル生成部１０４は、図１７の表２４１に示すように、overlay_control_struct()に遷移識別情報を格納するための新たなに新たなコントロール構造を規定する。図１７は、遷移識別情報を格納するための新たなに新たなコントロール構造を加えたoverlay_control_struct()の一例を表す図である。本変形例では、ファイル生成部１０４は、overlay_control_struct()に新たなコントロール構造としてｉ＝１２にAssociatedviewpoint()を追加する。

　図１８は、Associatedviewpointregion()及びAssociatedViewpoint()の一例を表す図である。例えば、ファイル生成部１０４は、図１８に示すシンタックス２４２で表されるAssociatedviewpointregion()を生成する。また、ファイル生成部１０４は、シンタックス２４３で表されるAssociatedviewpoint()を生成する。そして、ファイル生成部１０４は、AssociatedSphereRegion()とAssociatedviewpoint()とを紐づけることで、遷移実行領域と遷移可能なビューポイントとの紐づけを行う。

　以上に説明したように、本変形例ではオーバーレイに新たなコントロール構造を定義して遷移可能なビューポイントの情報を格納し、遷移実行領域と紐づけを行う。このような方法でも、利用者は、全天球映像上に表示された遷移実行領域を確認することができ、ビューポイントの移動を容易に行うことができる。

［２．４　第２の実施形態の変形例（４）］
　上述した第２の実施形態の変形例（１）～（３）では映像表示領域と遷移実行領域とを別途指定したが、これらの領域が同じ位置及び同じサイズである場合には、同じ領域が２か所で定義されることになり非効率である。そこで、本変形例に係るファイル生成装置１は、遷移実行領域が映像表示領域と同じであることを示すフラグを用いて領域を流用する。以下に、本変形例における遷移実行領域の格納方法の詳細について説明する。

　前記メタデータ生成部１０３は、ＯＭＡＦのオーバーレイにおける映像表示領域と遷移実行領域とが同一になるように遷移実行領域を決定する。そして、メタデータ生成部１０３は、映像表示領域と遷移実行領域とが一致することを示すフラグを生成する。そして、メタデータ生成部１０３は、映像表示領域と遷移実行領域とが一致することを示すフラグを含む遷移実行領域情報をファイル生成部１０４へ出力する。

　ファイル生成部１０４は、映像表示領域と遷移実行領域とが一致することを示すフラグを含む遷移実行領域情報の入力をメタデータ生成部１０３から受ける。そして、ファイル生成部１０４は、ShereRalativeOverlay()において映像表示領域を指定する。次に、ファイル生成部１０４は、遷移実行領域情報を格納するAssociatedSphereRegion()を生成する。さらに、ファイル生成部１０４は、図１９のシンタックス２５１で示すように、AssociatedSphereRegion()を拡張して、遷移実行領域が映像表示領域と同じであることを示すフラグを設定する。図１９は、映像表示領域を遷移実行領域に流用する場合のAssociatedSphereRegion()の一例を表す図である。ファイル生成部１０４は、AssociatedSphereRegion()に設定したフラグを用いて遷移実行領域が映像表示領域と一致することを示すことで、遷移実行領域の情報を格納せずに映像表示領域の情報を遷移実行領域に流用させる。

　ここで、本変形例では、AssociatedSphereRegion()を使用する場合で説明したが、ファイル生成部１０４は、遷移実行領域を示すためにAssociatedViewpointRegion()を使用することも可能である。その場合も、ファイル生成部１０４は、AssociatedViewpointRegion()に遷移実行領域が映像表示領域と同じであることを示すフラグを設定することで、映像表示領域の情報を遷移実行領域に流用することができる。

　以上に説明したように、本変形例ではAssociatedSphereRegion()に新たに設けたフラグを用いて映像表示領域の情報を遷移実行領域に流用する。これにより、データの削減を図ることが可能となる。

［第２の実施形態の変形例（４）］
　上述した第２の実施形態では遷移実行領域情報が常に３ＤｏＦ画像である全天球映像上に表示される。そのため、ビューポイントの遷移に興味のない利用者には不要な情報が提示されることとなり、利用者の視聴体験の品質が低下するおそれがある。そこで、本変形例に係るファイル生成装置１は、遷移実行領域を含む同じ全天球画像を利用者が一定時間見ている場合に遷移実行領域情報を全天球映像上に表示する。以下に、本変形例における遷移実行領域情報の格納方法の詳細について説明する。

　メタデータ生成部１０３は、遷移実行領域情報を算出する。また、メタデータ生成部１０３は、全天球映像上への遷移実行領域の表示を制御する時間情報を生成する。例えば、メタデータ生成部１０３は、表示した全天球映像に紐づく遷移実行領域情報が表示されるまでの時間を表す時間情報を生成する。そして、メタデータ生成部１０３は、遷移実行領域情報とともに時間情報をファイル生成部１０４へ出力する。

　ファイル生成部１０４は、遷移実行領域情報及び時間情報の入力をメタデータ生成部１０３から受ける。そして、ファイル生成部１０４は、SphereRegionStruct()及び遷移識別情報を格納するRegionForViewpoint()を新たに定義する。さらに、ファイル生成部１０４は、RegionForViewpoint()に時間情報を格納する。

　例えば、ファイル生成部１０４は、図２０のシンタックス２６１で示すように、表示した全天球映像に紐づく遷移実行領域情報が表示されるまでの時間をRegionForViewpoint()に格納する。図２０は、一定時間後に遷移実行領域情報を表示する場合のRegionForViewpoint()の一例を表す図である。シンタックス２６１におけるtime_to_ovelayが、遷移実行領域情報を表示するまでの時間である。

　クライアント装置２のファイル処理部２０３は、RegionForViewpoint()に含まれる遷移実行領域情報が表示されるまでの時間を取得する。そして、ファイル処理部２０３は、３ＤｏＦ画像の表示を表示情報生成部２０５に行わせてからその３ＤｏＦ画像が表示された状態で指定された時間が経過すると、実行領域の表示を表示情報生成部２０５に指示する。これにより、クライアント装置２では３ＤｏＦ画像の表示から一定時間経過後に遷移実行領域が表示され、ビューポイントの遷移が可能となる。

　以上に説明したように、本変形例では、全天球映像上の遷移実行領域情報を最初は表示させずに一定時間経過後に表示させる。これにより、利用者が遷移実行領域に対して興味があり、ビューポイントの遷移を行う可能性が高い場合に遷移実行領域情報が表示されることになる。したがって、不要な情報の表示を削減でき、利用者の視聴体験の質を向上させることができる。

［３．第３の実施形態］
　本実施形態では、ビューポイントを遷移させる場合の操作の情報である遷移トリガ情報の生成について詳細に説明する。本実施例に係るファイル生成装置１は、ビューポイントを遷移させる際の、領域に対する操作（ユーザインタラクション）を切り替える情報をクライアント装置２に提供する。本実施例に係るファイル生成装置１も図２のブロック図で表される。以下の説明では、第１の実施形態と同様の各部の処理については説明を省略する場合がある。

　メタデータ生成部１０３は、操作者から指定されたユーザインタラクションの情報にしたがって、ユーザインタラクションを示す遷移トリガ情報を生成する。指定されたユーザインタラクションが複数の場合、メタデータ生成部１０３は、各ユーザインタラクションの間で切り替えが可能なことを示す遷移トリガ情報を生成する。例えば、ユーザインタラクションとしてクリックとズームとが指定された場合、メタデータ生成部１０３は、クリックとズームとが切り替え可能であることを含む遷移トリガ情報を生成する。また、メタデータ生成部１０３は、例えば、ユーザインタラクションとしてズームを使用する場合には、遷移が起こるズームの閾値を設定して遷移トリガ情報に加えてもよい。その後、メタデータ生成部１０３は、生成した遷移トリガ情報をファイル生成部１０４へ出力する。

　ファイル生成部１０４は、遷移トリガ情報の入力をメタデータ生成部１０３から受ける。次に、ファイル生成部１０４は、SphereRegionStruct()及び遷移識別情報を格納するRegionForViewpoint()を新たに定義する。さらに、ファイル生成部１０４は、図２１のシンタックス３１１で示すように、領域に対するユーザインタラクションを切り替えるための情報をRegionForViewpoint()に格納する。図２１は、ユーザインタラクションを切り替える場合のRegionForViewpoint()の一例を表す図である。

　シンタックス３１１におけるaction_control_flagが、遷移実行領域に対するユーザインタラクションを切り替えるためのフラグである。例えば、ファイル生成部１０４は、次のようにaction_control_flagを定義する。action_control_flagの値が０の場合、遷移実行領域をクリックすることでviewpoint_idにより指定されたビューポイントから見た全天球映像に切り替わる。また、action_control_flagの値が１の場合、遷移実行領域に対するズームを行うことでviewpoint_idにより指定されたビューポイントから見た全天球映像に切り替わる。

　また、ファイル生成部１０４は、ユーザインタラクションがズームの場合には、シンタックス３１１に示すように遷移が起こるズームの閾値を設定する。シンタックス３１１におけるZoom_thresholdは、遷移のトリガとなるユーザインタラクションがズームの場合の遷移を実行する閾値である。例えば、ファイル生成部１０４は、次のようにZoom_thresholdを規定する。Zoom_threshold＞１と定義された場合、遷移可能領域へのズームインのズーム率が１より大きい場合に遷移を実行する。また、Zoom_threshold＜１と定義された場合、遷移可能領域へのズームアウトのズーム率が１より大きい場合に遷移を実行する。

　このユーザインタラクションの切り替えの情報の設定及び遷移を発生させる閾値の設定は、第２の実施形態の変形例（２）などのAssociatedSphereRegion()に適用することも可能である。また、本実施例では、クリック及びズームをユーザインタラクションとして使用する場合で説明したが、他の操作でも同様に設定することが可能である。

［４．第４の実施形態］
　以上の各実施形態及びそれらの各変形例ではＩＳＯＢＭＦＦに格納する場合を説明した。ただし、図２２に示すMatroska　Media　Container（http://www.matroska.org/）を用いて伝送する場合でも遷移識別情報、遷移実行領域情報及び遷移トリガ情報を提供することが可能である。図２２は、Matroska　Media　Containerのフォーマットを表す図である。その場合、ファイル生成部１０４は、Track　Entry　elementに新しく定義したelementに遷移識別情報、遷移実行領域情報及び遷移トリガ情報を格納する。

［ハードウェア構成］
　図２３は、コンピュータのハードウェア構成図である。ファイル生成装置１及びクライアント装置２は、図２３に示すコンピュータ９０によって実現可能である。コンピュータ９０において、プロセッサ９１、メモリ９２、ネットワークインタフェース９３、不揮発性ストレージ９４、入出力インタフェース９５及びディスプレイインタフェース８６は、バスを介して相互に接続される。

　入出力インタフェース９５には、例えば、入力装置、出力装置、記憶装置及びドライブといった外部デバイスが接続される。入力装置は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などである。出力装置は、例えば、スピーカ、出力端子などである。記憶装置は、例えば、ハードディスク、ＲＡＭ（Random　Access　Memory）ディスクなどである。ドライブは、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディアを駆動する。また、ディスプレインタフェース９６には、表示装置であるディスプレイ９８が接続される。

　ネットワークインタフェース９３は、外部のネットワークに接続される。ファイル生成装置１及びクライアント装置２は、ネットワークインタフェース９３を介して相互に接続される。また、ファイル生成装置１及びクライアント装置２は、ネットワークインタフェース９３を介してＷｅｂサーバ３に接続する。不揮発性ストレージ９４は、ハードディスクやＳＳＤ（Solid　State　Drive）などの内蔵の補助記憶装置である。

　以上のように構成されるコンピュータ９０では、プロセッサ９１が、例えば、不揮発性ストレージ９４に記憶されているプログラムを、バスを介して、メモリ９２にロードして実行することにより、上述した一連の処理が行われる。メモリ９２にはまた、プロセッサ９１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　プロセッサ９１が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディアに記録して適用することができる。その場合、プログラムは、リムーバブルメディアを外部デバイス９７であるドライブに装着することにより、入出力インタフェース９５を介して、不揮発性ストレージ９４にインストールすることができる。

　また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、ネットワークインタフェース９３で受信し、不揮発性ストレージ９４にインストールすることができる。

　その他、このプログラムは、不揮発性ストレージ９４に、予めインストールしておくこともできる。

　以上、本開示の実施形態について説明したが、本開示の技術的範囲は、上述の実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また他の効果があってもよい。

　なお、本技術は以下のような構成を取ることもできる。
（１）第１ビューポイントを視点位置とする第１映像から遷移可能な第２映像における視点位置である第２ビューポイントを識別するための遷移識別情報を生成するメタデータ生成部と、
　前記第１映像のデータ及び前記遷移識別情報を含むファイルを生成するファイル生成部と
　を備えた情報処理装置。
（２）前記メタデータ生成部は、前記第２ビューポイントを特定するための識別情報を含む前記遷移識別情報を生成する付記（１）に記載の情報処理装置。
（３）前記メタデータ生成部は、前記第２ビューポイントを複数含むビューポイントグループの識別情報を含む前記遷移識別情報を生成する付記（１）又は（２）に記載の情報処理装置。
（４）前記メタデータ生成部は、ＵＲＬ（Uniform　Resource　Locator）で指定される他の映像へのアクセス情報を含む前記遷移識別情報を生成する付記（１）～（３）のいずれか一つに記載の情報処理装置。
（５）前記ファイル生成部は、前記識別情報をＩＳＯＢＭＦＦファイルのTrackBoxにおけるViewpointTrackGroupBoxに格納する付記（１）～（４）のいずれか一つに記載の情報処理装置。
（６）前記ファイル生成部は、前記識別情報をＭＰＤ（Media　Presentation　Description）ファイルのVWPT　descriptorに格納する付記（１）～（４）のいずれか一つに記載の情報処理装置。
（７）前記メタデータ生成部は、前記第１ビューポイントから前記第２ビューポイントへ遷移させるための操作を受け付ける前記第１映像上の遷移実行領域を示す遷移実行領域情報を生成し、
　前記ファイル生成部は、前記ファイルに前記遷移実行領域情報を含ませる
　付記（１）に記載の情報処理装置。
（８）前記メタデータ生成部は、前記遷移実行領域のサイズ及び前記第１映像における表示位置を含む前記遷移実行領域情報を生成する付記（７）に記載の情報処理装置。
（９）前記ファイル生成部は、ＩＳＯＢＭＦＦファイルのTrackBoxにおけるViewpointTrackGroupBoxに前記遷移実行領域情報を格納する付記（７）又は（８）に記載の情報処理装置。
（９）前記メタデータ生成部は、ＯＭＡＦにおけるオーバーレイにより前記遷移実行領域情報を示す付記（７）又は（８）に記載の情報処理装置。
（１１）前記メタデータ生成部は、前記遷移実行領域が前記オーバーレイにおける映像表示領域と同じであることを示すフラグを含む前記遷移実行領域情報を生成する付記（１０）に記載の情報処理装置。
（１２）前記メタデータ生成部は、前記第１映像上への前記遷移実行領域の表示を制御する時間情報が含まれる付記（７）～（１１）のいずれか一つに記載の情報処理装置。
（１３）前記メタデータ生成部は、前記第１ビューポイントから前記第２ビューポイントへの遷移を発生させる操作を示す遷移トリガ情報を生成し、
　前記ファイル生成部は、前記ファイルに前記遷移実行領域情報を含ませる
　付記（１）に記載の情報処理装置。
（１４）前記メタデータ生成部は、クリックによって前記遷移を発生させることを示す前記遷移トリガ情報を生成する付記（１３）に記載の情報処理装置。
（１５）前記メタデータ生成部は、ズームによって前記遷移を発生させることを示す前記遷移トリガ情報を生成する付記（１３）又は（１４）に記載の情報処理装置。
（１６）前記メタデータ生成部は、前記遷移を発生させる前記ズームの閾値を含む前記遷移トリガ情報を生成する付記（１５）に記載の情報処理装置。
（１７）第１ビューポイントを視点位置とする第１映像から遷移可能な第２映像における視点位置である第２ビューポイントを識別するための遷移識別情報を生成し、
　前記第１映像のデータ及び前記遷移識別情報を含むファイルを生成する
　処理をコンピュータに実行させる情報処理方法。
（１８）第１ビューポイントを視点位置とする第１映像から遷移可能な第２映像における視点位置である第２ビューポイントを識別するための遷移識別情報を含むファイルを取得するファイル取得部と、
　前記ファイル取得部により取得された前記ファイルから前記遷移識別情報を取得し、取得した前記遷移識別情報を基に、前記第１ビューポイントから遷移可能な前記第２ビューポイントを特定するファイル処理部と、
　前記第１映像を再生し、且つ、前記ファイル処理部により特定された前記第２ビューポイントの情報を出力する再生部と
　を備えた再生処理装置。
（１９）第１ビューポイントを視点位置とする第１映像から遷移可能な第２映像における視点位置である第２ビューポイントを識別するための遷移識別情報を含むファイルを取得し、
　取得した前記ファイルから前記遷移識別情報を取得し、取得した前記遷移識別情報を基に、前記第１ビューポイントから遷移可能な前記第２ビューポイントを特定し、
　前記第１映像を再生し、且つ、特定した前記第２ビューポイントの情報を出力する
　処理をコンピュータに実行させる再生処理方法。

　１　ファイル生成装置
　２　クライアント装置
　３　Ｗｅｂサーバ
　４　ネットワーク
　１０　ファイル生成処理部
　１１　制御部
　１２　通信部
　２０　再生処理部
　２１　制御部
　２２　通信部
　１００　配信システム
　１０１　データ取得部
　１０２　符号化部
　１０３　メタデータ生成部
　１０４　ファイル生成部
　２０１　ファイル取得部
　２０２　計測部
　２０３　ファイル処理部
　２０４　復号処理部
　２０５　表示情報生成部
　２０６　表示部

Claims

　第１ビューポイントを視点位置とする第１映像から遷移可能な第２映像における視点位置である第２ビューポイントを識別するための遷移識別情報を生成するメタデータ生成部と、
　前記第１映像のデータ及び前記遷移識別情報を含むファイルを生成するファイル生成部と
　を備えた情報処理装置。
　前記メタデータ生成部は、前記第２ビューポイントを特定するための識別情報を含む前記遷移識別情報を生成する請求項１に記載の情報処理装置。
　前記メタデータ生成部は、前記第２ビューポイントを複数含むビューポイントグループの識別情報を含む前記遷移識別情報を生成する請求項１に記載の情報処理装置。
　前記メタデータ生成部は、ＵＲＬ（Uniform　Resource　Locator）で指定される他の映像へのアクセス情報を含む前記遷移識別情報を生成する請求項１に記載の情報処理装置。
　前記ファイル生成部は、前記遷移識別情報をＩＳＯＢＭＦＦファイルのTrackBoxにおけるViewpointTrackGroupBoxに格納する請求項１に記載の情報処理装置。
　前記ファイル生成部は、前記遷移識別情報をＭＰＤ（Media　Presentation　Description）ファイルのVWPT　descriptorに格納する請求項１に記載の情報処理装置。
　前記メタデータ生成部は、前記第１ビューポイントから前記第２ビューポイントへ遷移させるための操作を受け付ける前記第１映像上の遷移実行領域を示す遷移実行領域情報を生成し、
　前記ファイル生成部は、前記遷移実行領域情報を含む前記ファイルを生成する
　請求項１に記載の情報処理装置。
　前記メタデータ生成部は、前記遷移実行領域のサイズ及び前記第１映像における表示位置を含む前記遷移実行領域情報を生成する請求項７に記載の情報処理装置。
　前記ファイル生成部は、ＩＳＯＢＭＦＦファイルのTrackBoxにおけるViewpointTrackGroupBoxに前記遷移実行領域情報を格納する請求項７に記載の情報処理装置。
　前記メタデータ生成部は、ＯＭＡＦにおけるオーバーレイにより前記遷移実行領域情報を示す請求項７に記載の情報処理装置。
　前記メタデータ生成部は、前記遷移実行領域と前記オーバーレイにおける映像表示領域とが前記第１映像上の同じ領域であることを示すフラグを含む前記遷移実行領域情報を生成する請求項１０に記載の情報処理装置。
　前記メタデータ生成部は、前記第１映像上への前記遷移実行領域の表示を制御する時間情報が含まれる請求項７に記載の情報処理装置。
　前記メタデータ生成部は、前記第１ビューポイントから前記第２ビューポイントへの遷移を発生させる操作を示す遷移トリガ情報を生成し、
　前記ファイル生成部は、前記遷移トリガ情報を含む前記ファイルを生成する
　請求項１に記載の情報処理装置。
　前記メタデータ生成部は、クリックによって前記遷移を発生させることを示す前記遷移トリガ情報を生成する請求項１３に記載の情報処理装置。
　前記メタデータ生成部は、ズームによって前記遷移を発生させることを示す前記遷移トリガ情報を生成する請求項１３に記載の情報処理装置。
　前記メタデータ生成部は、前記遷移を発生させる前記ズームの閾値を含む前記遷移トリガ情報を生成する請求項１５に記載の情報処理装置。
　第１ビューポイントを視点位置とする第１映像から遷移可能な第２映像における視点位置である第２ビューポイントを識別するための遷移識別情報を生成し、
　前記第１映像のデータ及び前記遷移識別情報を含むファイルを生成する
　処理をコンピュータに実行させる情報処理方法。
　第１ビューポイントを視点位置とする第１映像から遷移可能な第２映像における視点位置である第２ビューポイントを識別するための遷移識別情報を含むファイルを取得するファイル取得部と、
　前記ファイル取得部により取得された前記ファイルから前記遷移識別情報を取得し、取得した前記遷移識別情報を基に、前記第１ビューポイントから遷移可能な前記第２ビューポイントを特定するファイル処理部と、
　前記第１映像を再生し、且つ、前記ファイル処理部により特定された前記第２ビューポイントの情報を出力する再生部と
　を備えた再生処理装置。
　第１ビューポイントを視点位置とする第１映像から遷移可能な第２映像における視点位置である第２ビューポイントを識別するための遷移識別情報を含むファイルを取得し、
　取得した前記ファイルから前記遷移識別情報を取得し、取得した前記遷移識別情報を基に、前記第１ビューポイントから遷移可能な前記第２ビューポイントを特定し、
　前記第１映像を再生し、且つ、特定した前記第２ビューポイントの情報を出力する
　処理をコンピュータに実行させる再生処理方法。