WO2019181493A1

WO2019181493A1 - 受信装置、受信方法、送信装置および送信方法

Info

Publication number: WO2019181493A1
Application number: PCT/JP2019/008772
Authority: WO
Inventors: 塚越　郁夫
Original assignee: ソニー株式会社
Priority date: 2018-03-19
Filing date: 2019-03-06
Publication date: 2019-09-26

Abstract

受信画像データに対応した表示能力を持たない受信機においても適切な表示用画像データを容易に取得可能とする。　画像データを符号化して得られたビデオストリームを含むコンテナを受信する。ビデオストリームを復号化して画像データを得、この画像データから表示用画像データを得る。ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されている。コンテナのレイヤには、表示能力との関連で切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報が挿入されている。表示用画像データを得る際に、指示情報に基づいて切出し位置情報を選択的に使用する。

Description

受信装置、受信方法、送信装置および送信方法

　本技術は、受信装置、受信方法、送信装置および送信方法に関し、詳しくは、切出し位置情報が挿入されたビデオストリームを受け取って処理する受信装置等に関する。

　近時、ＶＲ（Virtual Reality）コンテンツの配信が考えられている。例えば、特許文献１には、バック・ツー・バック（Back to Back）方式で撮像を行って１８０°以上の視野角を持つ超広視野角の前面画像および後面画像を得、これらの２つの画像から正距円筒画像を作成して通信端末に送信することが記載されている。ここで、１８０°以上の視野角を持つ超広視野角の前面画像および後面画像は球面キャプチャ画像（３６０°ＶＲ画像）を構成し、正距円筒法は平面パッキングの方法の一つである。

特開２０１６-１９４７８４号公報

　ＶＲコンテンツの配信は、ＶＲ表示対応受信機でその効果を発揮する。しかし、従来のＶＲ表示非対応受信機がＶＲコンテンツを受信する場合の配慮を行わないと、このＶＲ表示非対応受信機では歪んだ画像が表示されることになる。従来のＶＲ表示非対応受信機に対する後方互換性を確保する必要がある。

　本技術の目的は、受信画像データに対応した表示能力を持たない受信機においても適切な表示用画像データを容易に取得可能とすることにある。

　本技術の概念は、
　画像データを符号化して得られたビデオストリームを含むコンテナを受信する受信部と、
　上記ビデオストリームを復号化して画像データを得、該画像データから表示用画像データを得る処理部を備え、
　上記ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されており、
　上記コンテナのレイヤには、表示能力との関連で上記切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報が挿入されており、
　上記処理部は、上記指示情報に基づいて上記切出し位置情報を選択的に使用する
　受信装置にある。

　本技術において、受信部により、画像データを符号化して得られたビデオストリームを含むコンテナが受信される。処理部により、ビデオストリームが復号化されて画像データが得られ、この画像データが処理されて表示用画像データが得られる。ここで、ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されている。また、コンテナのレイヤには、表示能力との関連で切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報が挿入されている。

　処理部では、指示情報に基づいて切出し位置情報が選択的に使用される。例えば、処理部は、指示情報に基づいて切出し位置情報による切出しが必須であると判断するとき、ビデオストリームを復号化して得られた画像データから切出し位置情報で示される位置の画像データを切出して表示用画像データを得る、ようにされてもよい。

　例えば、画像データは、球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られた長方形のプロジェクション画像の画像データである、ようにされてもよい。そして、この場合、例えば、コンテナのレイヤおよび/またはビデオストリームのレイヤに、プロジェクション画像のレンダリング用メタ情報が挿入されており、切出し位置情報で示される切出し位置の中心はレンダリング用メタ情報で示されるプロジェクション画像の基準点と一致する、ようにされてもよい。

　例えば、プロジェクション画像は、基準点を中心位置とするデフォルトリージョンを含む複数のリージョンからなり、切出し位置情報で示される位置は、デフォルトリージョンの位置と一致する、ようにされてもよい。また、例えば、レンダリング用メタ情報は、プロジェクション画像の基準点の位置情報を持つ、ようにされてもよい。また、例えば、レンダリング用メタ情報は、切出し位置情報で示される切出し位置の中心はレンダリング用メタ情報で示されるプロジェクション画像の基準点と一致することを示す後方互換性情報を持つ、ようにされてもよい。

　例えば、コンテナのレイヤに、ビデオストリームに対応付けて、指示情報が記述されたデスクリプタが挿入されている、ようにされてもよい。この場合、例えば、コンテナは、ＩＳＯＢＭＦＦであり、デスクリプタは、ｍｏｏｖボックスに挿入されている、ようにされてもよい。また、この場合、例えば、コンテナは、ＭＰＥＧ２－ＴＳであり、デスクリプタは、プログラム・マップ・テーブルに挿入されている、ようにされてもよい。また、この場合、例えば、コンテナは、ＭＭＴストリームであり、デスクリプタは、ＭＭＴ・パッケージ・テーブルに挿入されている、ようにされてもよい。

　このように本技術においては、コンテナに含まれるビデオストリームを復号化して得られた画像データから表示用画像データを得る際に、コンテナのレイヤに挿入されている指示情報に基づいて、ビデオストリームのレイヤに挿入されている切出し位置情報を選択的に使用するものである。そのため、受信画像データに対応した表示能力を持たない受信機においても適切な表示用画像データを容易に取得可能となる。

　また、本技術の他の概念は、
　画像データを符号化して得られたビデオストリームを含むコンテナを生成するコンテナ生成部を備え、
　上記ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されており、
　上記コンテナのレイヤに、受信側の表示能力との関連で上記切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報を挿入する情報挿入部と、
　上記指示情報が挿入された上記コンテナを送信する送信部をさらに備える
　送信装置にある。

　本技術において、コンテナ生成部により、画像データを符号化して得られたビデオストリームを含むコンテナが生成される。このビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されている。情報挿入部により、コンテナのレイヤに、受信側の表示能力との関連で切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報が挿入される。そして、送信部により、指示情報が挿入されたコンテナが送信される。

　このように本技術においては、ビデオストリームのレイヤには画像データの切出し位置を示す切出し位置情報が挿入されており、コンテナのレイヤに、受信側の表示能力との関連で切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報を挿入するものである。そのため、受信側においては、コンテナに含まれるビデオストリームを復号化して得られた画像データから表示用画像データを得る際に、指示情報に基づいて切出し位置情報を選択的に使用でき、受信画像データに対応した表示能力を持たなくても適切な表示用画像データを容易に取得可能となる。

　本技術によれば、受信画像データに対応した表示能力を持たない受信機においても適切な表示用画像データを容易に取得できる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

ＭＰＥＧ－ＤＡＳＨベースのストリーム配信システムの構成例を示すブロック図である。ＭＰＤファイルに階層的に配置されている各構造体の関係の一例を示す図である。実施の形態としての送受信システムの構成例を示すブロック図である。送受信システムのシステム全体の構成例を概略的に示す図である。球面キャプチャ画像からプロジェクション画像を得る平面パッキングを説明するための図である。ＨＥＶＣの符号化におけるＳＰＳ　ＮＡＬユニットの構造例を示す図である。切出し位置の中心Ｏ(p,q)をプロジェクション画像の基準点ＲＰ(x,y)と一致させることを説明するための図である。切出し位置情報で示される位置をデフォルトリージョンの位置と一致させることを説明するための図である。レンダリングメタデータの構造例を示す図である。図９の構造例における各情報を説明するための図である。レンダリングメタデータの他の構造例を示す図である。図１１の構造例における各情報を説明するための図である。図９、図１１に示す構造例における主要な情報の内容を示す図である。コンポーネントデスクリプタの構造例と、その構造例における主要な情報の内容を示す図である。ディスプレイ・ウインドウ・アクティベートデスクリプタの構造例と、その構造例における主要な情報の内容を示す図である。配信ストリームとしてのＭＰ４ストリームの一例を示す図である。ＭＰＤファイルの記述例を示す図である。 “SupplementaryDescriptor”の「Value」セマンティスクスを示す図である。受信機タイプによるＶＲサービスストリームの受信可否とＶＲ表示の可否を示す図である。プロジェクション画像に対するＶＲ表示対応受信機およびＶＲ表示非対応受信機の処理を説明するための図である。サービス送信システムの構成例を示すブロック図である。サービス受信機（ＶＲ表示対応受信機）の構成例を示すブロック図である。サービス受信機（ＶＲ表示対応受信機）における表示切り替えシーケンスを示す図である。サービス受信機（ＶＲ表示非対応受信機）の構成例を示すブロック図である。トランスポートストリームの構成例を示す図である。ＭＭＴストリームの構成例を示す図である。フォーマットタイプがクロスキュービックであるプロジェクション画像を示す図である。基準点ＲＰ(x,y)の指定および切出し位置「default_display_window」の指定について説明するための図である。ステレオスコピック画像の場合についての本技術の適用を説明するための図である。パノラマビュー画像の場合についての本技術の適用を説明するための図である。

　以下、発明を実施するための形態（以下、「実施の形態」とする）について説明する。なお、説明は以下の順序で行う。
　１．実施の形態
　２．変形例

　＜１．実施の形態＞
　［ＭＰＥＧ－ＤＡＳＨベースのストリーム配信システムの概要］
　最初に、本技術を適用し得るＭＰＥＧ－ＤＡＳＨベースのストリーム配信システムの概要を説明する。なお、配信は、放送で行ってもよく、あるいは通信で行ってもよい。

　図１（ａ）は、ＭＰＥＧ－ＤＡＳＨベースのストリーム配信システム３０Ａの構成例を示している。この構成例では、メディアストリームとＭＰＤ（Media Presentation Description ）ファイルが、通信ネットワーク伝送路（通信伝送路）を通じて送信される。このストリーム配信システム３０Ａは、ＤＡＳＨストリームファイルサーバ３１およびＤＡＳＨＭＰＤサーバ３２に、Ｎ個のサービス受信機３３-1，３３-2，・・・，３３-Nが、ＣＤＮ（Content Delivery Network）３４を介して、接続された構成となっている。

　ＤＡＳＨストリームファイルサーバ３１は、所定のコンテンツのメディアデータ（ビデオデータ、オーディオデータ、字幕データなど）に基づいて、ＤＡＳＨ仕様のストリームセグメント（以下、適宜、「ＤＡＳＨセグメント」という）を生成し、サービス受信機からのＨＴＴＰ要求に応じてセグメントを送出する。このＤＡＳＨストリームファイルサーバ３１は、ストリーミング専用のサーバであってもよいし、また、ウェブ（Web）サーバで兼用されることもある。

　また、ＤＡＳＨストリームファイルサーバ３１は、サービス受信機３３（３３-1，３３-2，・・・，３３-N）からＣＤＮ３４を介して送られてくる所定ストリームのセグメントの要求に対応して、そのストリームのセグメントを、ＣＤＮ３４を介して、要求元の受信機に送信する。この場合、サービス受信機３３は、ＭＰＤ（Media Presentation Description）ファイルに記載されているレートの値を参照して、クライアントの置かれているネットワーク環境の状態に応じて、最適なレートのストリームを選択して要求を行う。

　ＤＡＳＨＭＰＤサーバ３２は、ＤＡＳＨストリームファイルサーバ３１において生成されるＤＡＳＨセグメントを取得するためのＭＰＤファイルを生成するサーバである。コンテンツマネジメントサーバ（図示せず）からのコンテンツメタデータと、ＤＡＳＨストリームファイルサーバ３１において生成されたセグメントのアドレス（url）をもとに、ＭＰＤファイルを生成する。なお、ＤＡＳＨストリームファイルサーバ３１とＤＡＳＨＭＰＤサーバ３２は、物理的に同じものであってもよい。

　ＭＰＤのフォーマットでは、ビデオやオーディオなどのそれぞれのストリーム毎にリプレゼンテーション（Representation）という要素を利用して、それぞれの属性が記述される。例えば、ＭＰＤファイルには、レートの異なる複数のビデオデータストリーム毎に、リプレゼンテーションを分けてそれぞれのレートが記述される。サービス受信機３３では、そのレートの値を参考にして、上述したように、サービス受信機３３の置かれているネットワーク環境の状態に応じて、最適なストリームを選択できる。

　図１（ｂ）は、ＭＰＥＧ－ＤＡＳＨベースのストリーム配信システム３０Ｂの構成例を示している。この構成例では、メディアストリームとＭＰＤファイルが、ＲＦ伝送路（放送伝送路）を通じて送信される。このストリーム配信システム３０Ｂは、ＤＡＳＨストリームファイルサーバ３１およびＤＡＳＨＭＰＤサーバ３２が接続された放送送出システム３６と、Ｍ個のサービス受信機３５-1，３５-2，・・・，３５-Mとで構成されている。

　このストリーム配信システム３０Ｂの場合、放送送出システム３６は、ＤＡＳＨストリームファイルサーバ３１で生成されるＤＡＳＨ仕様のストリームセグメント（ＤＡＳＨセグメント）およびＤＡＳＨＭＰＤサーバ３２で生成されるＭＰＤファイルを、放送波に載せて送信する。

　図２は、ＭＰＤファイルに階層的に配置されている各構造体の関係の一例を示している。図２（ａ）に示すように、ＭＰＤファイル全体としてのメディア・プレゼンテーション（Media Presentation）には、時間間隔で区切られた複数のピリオド（Period）が存在する。例えば、最初のピリオドはスタートが０秒から、次のピリオドはスタートが１００秒から、などとなっている。

　図２（ｂ）に示すように、ピリオドには、複数のアダプテーションセット(AdaptationSet)が存在する。各アダプテーションセットはビデオやオーディオ等のメディアタイプの違いや、同じメディアタイプでも言語の違い、視点の違い等に依存する。図２（ｃ）に示すように、アダプテーションセットには複数のリプレゼンテーション(Representation)が存在する。各リプレゼンテーションはストリーム属性、例えばレートの違い等に依存する。

　図２（ｄ）に示すように、リプレゼンテーションには、セグメントインフォ（SegmentInfo）が含まれている。このセグメントインフォには、図２（ｅ）に示すように、イニシャライゼーション・セグメント（Initialization Segment）と、ピリオドをさらに細かく区切ったセグメント（Segment）毎の情報が記述される複数のメディア・セグメント（Media Segment）が存在する。メディアセグメントには、ビデオやオーディオなどのセグメントデータを実際に取得するためのアドレス(url)の情報等が存在する。

　なお、アダプテーションセットに含まれる複数のリプレゼンテーションの間では、ストリームのスイッチングを自由に行うことができる。これにより、受信側のネットワーク環境の状態に応じて、最適なレートのストリームを選択でき、途切れのないビデオ配信が可能となる。

　［送受信システムの構成例］
　図３は、実施の形態としての送受信システム１０の構成例を示している。この送受信システム１０は、サービス送信システム１００とサービス受信機２００により構成されている。この送受信システム１０において、サービス送信システム１００は、上述の図１（ａ）に示すストリーム配信システム３０ＡのＤＡＳＨストリームファイルサーバ３１およびＤＡＳＨＭＰＤサーバ３２に対応する。また、この送受信システム１０において、サービス送信システム１００は、上述の図１（ｂ）に示すストリーム配信システム３０ＢのＤＡＳＨストリームファイルサーバ３１、ＤＡＳＨＭＰＤサーバ３２および放送送出システム３６に対応する。

　また、この送受信システム１０において、サービス受信機２００は、上述の図１（ａ）に示すストリーム配信システム３０Ａのサービス受信機３３（３３-1，３３-2，・・・，３３-N）に対応する。また、この送受信システム１０において、サービス受信機２００は、上述の図１（ｂ）に示すストリーム配信システム３０Ｂのサービス受信機３５（３５-1，３５-2，・・・，３５-M）に対応する。

　サービス送信システム１００は、ＤＡＳＨ/ＭＰ４、つまりメタファイルとしてのＭＰＤファイルと、ビデオやオーディオなどのメディアストリーム（メディアセグメント）が含まれるＭＰ４（ＩＳＯＢＭＦＦ）を、通信ネットワーク伝送路（図１（ａ）参照）、またはＲＦ伝送路（図１（ｂ）参照）を通じて、送信する。

　この実施の形態においては、メディアストリームとして、長方形のプロジェクション画像（Projection picture）の画像データを符号化して得られたビデオストリームが含まれる。プロジェクション画像は、球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られたものである。

　コンテナのレイヤおよび/またはビデオストリームのレイヤには、プロジェクション画像のレンダリング用メタ情報が挿入されている。レンダリング用メタ情報がビデオストリームのレイヤに挿入されることで、コンテナの種類によらず、レンダリング用メタ情報の動的な変更が可能となる。

　ビデオストリームのレイヤには、画像データの切り出し位置を示す切り出し位置情報が挿入されている。この実施の形態においてはこの切出し位置情報で示される切出し位置の中心は、レンダリング用メタ情報で示されるプロジェクション画像の基準点と一致するようにされるが、必ずしもこれに限定されるものではない。例えば、プロジェクション画像は、基準点を中心位置とするデフォルトリージョンを含む複数のリージョンからなり、切出し位置情報で示される位置はデフォルトリージョンの位置と一致するようにされる。

　レンダリング用メタ情報は、プロジェクション画像の基準点の位置情報を持っている。また、レンダリング用メタ情報は、後方互換性情報を持っている。この後方互換性情報は、切出し位置情報で示される切出し位置の画像データに歪みがほとんどなく、ＶＲ表示非対応受信機に対する後方互換性を確保できることを示すものである。その意味で、この実施の形態では、後方互換性情報は、切出し位置情報で示される切出し位置の中心はレンダリング用メタ情報で示されるプロジェクション画像の基準点と一致することを示している。

　ＭＰＤファイルには、コンテナおよび/またはビデオストリームのレイヤにレンダリング用メタ情報の挿入があることを示す識別情報、後方互換性情報、さらにはプロジェクション画像のフォーマットタイプ情報が挿入されている。

　また、コンテナのレイヤには、ＶＲ表示能力との関連で切出し位置情報による画像データの切り出しを必須とするか否かを示す指示情報が挿入されている。この場合、コンテナのレイヤに、ビデオストリームに対応付けて、指示情報が記述されたデスクリプタが挿入されている。

　サービス受信機２００は、サービス送信システム１００から通信ネットワーク伝送路（図１（ａ）参照）またはＲＦ伝送路（図１（ｂ）参照）を通じて送られてくる上述のＭＰ４（ＩＳＯＢＭＦＦ）を受信する。サービス受信機２００は、ＭＰＤファイルから、ビデオストリームに関するメタ情報を取得する。

　また、サービス受信機２００は、ＶＲ表示対応受信機であるときは、ＭＰＤファイルから、さらに、コンテナおよび/またはビデオストリームのレイヤにレンダリング用メタ情報の挿入があることを示す識別情報、後方互換性情報、さらにはプロジェクション画像のフォーマットタイプ情報を取得する。

　サービス受信機２００は、ＶＲ表示対応受信機であるとき、ビデオストリームを復号化してプロジェクション画像を得、このプロジェクション画像をレンダリング用メタ情報に基づいてレンダリングしてレンダリング画像（第１の表示画像）を得る。なお、この実施の形態において、サービス受信機２００は、ＶＲ表示対応受信機であるときは、さらに、プロジェクション画像から切出し位置情報に基づいて切出して部分画像（第２の表示画像）を得て、レンダリング画像あるいは切出し画像を選択的に表示する。なお、切出し画像（第２の表示画像）は、プロジェクション画像から切出し位置情報に基づいて切出して得られるものであり、比較的歪みの少ない画像とすることが可能となる。

　また、サービス受信機２００は、ＶＲ表示非対応受信機であるとき、ビデオストリームを復号化してプロジェクション画像を得、コンテナのレイヤに挿入されている指示情報に基づいて、切出し位置情報による切出しが必須であると判断し、このプロジェクション画像から切出し位置情報に基づいて切出して切出し画像（第２の表示画像）を得る。

　上述したように、この実施の形態においては、挿入されている切出し位置情報で示される切出し位置の中心は、レンダリング用メタ情報で示されるプロジェクション画像の基準点と一致するようにされている。そのため、切出し画像はレンダリング画像と共通のものとなり、従ってＶＲ表示対応受信機とＶＲ表示非対応受信機との間で共通の画像が得られる。

　図４は、送受信システム１０のシステム全体の構成例を概略的に示している。サービス送信システム１００は、カメラ１０２と、平面パッキング部１０３と、ビデオエンコーダ１０４と、コンテナエンコーダ１０５を有している。

　カメラ１０２は、被写体を撮像して、球面キャプチャ画像（３６０°ＶＲ画像）の画像データを得る。例えば、カメラ１０２は、バック・ツー・バック（Back to Back）方式で撮像を行って、球面キャプチャ画像として、それぞれ魚眼レンズを用いて撮像された１８０°以上の視野角を持つ、超広視野角の前面画像および後面画像を得る。

　平面パッキング部１０３は、カメラ１０２で得られた球面キャプチャ画像の一部または全部を切り取って平面パッキングして長方形のプロジェクション画像（Projection picture）を得る。この場合、プロジェクション画像のフォーマットタイプとしては、例えば、エクイレクタングラー(Equirectangular)、クロスキュービック（Cross-cubic）などが選択される。なお、平面パッキング部では、プロジェクション画像に必要に応じてスケーリングを施し、所定の解像度のプロジェクション画像を得る。

　図５（ａ）は、カメラ１０２で得られる球面キャプチャ画像としての、超広視野角の前面画像および後面画像の一例を示している。図５（ｂ）は、平面パッキング部１０３で得られるプロジェクション画像の一例を示している。この例は、プロジェクション画像のフォーマットタイプがエクイレクタングラーである場合の例である。また、この例は、図５（ａ）に示す各画像において破線で示す緯度で切出した場合の例である。図５（ｃ）は、スケーリング後のプロジェクション画像の一例を示している。

　図４に戻って、ビデオエンコーダ１０４は、平面パッキング部１０３からのプロジェクション画像の画像データに対して、例えば、ＨＥＶＣなどの符号化を施して符号化画像データを得、この符号化画像データを含むビデオストリームを生成する。ビデオストリームのＳＰＳ　ＮＡＬユニットには、切出し位置情報が挿入されている。例えば、ＨＥＶＣの符号化では「default_display_window」が対応する。

　図６は、ＨＥＶＣの符号化におけるＳＰＳ　ＮＡＬユニットの構造例（Syntax）を示している。「pic_width_in_luma_samples」のフィールドは、プロジェクション画像の水平方向の解像度（画素サイズ）を示している。「pic_height_in_luma_samples」のフィールドは、プロジェクション画像の垂直方向の解像度（画素サイズ）を示している。そして、「default_display_window_flag」が立っているとき、切出し位置情報「default_display_window」が存在する。この切出し位置情報は、デコード画像の左上を基点（０，０）としたオフセット情報とされる。

　「def_disp_win_left_offset」のフィールドは、切出し位置の左端位置を示している。「def_disp_win_right_offset」のフィールドは、切出し位置の右端位置を示している。「def_disp_win_top_offset」のフィールドは、切出し位置の上端位置を示している。「def_disp_win_bottom_offset」のフィールドは、切出し位置の下端位置を示している。

　この実施の形態において、この切出し位置情報で示される切出し位置の中心は、プロジェクション画像の基準点と一致するようにされる。ここで、切出し位置の中心をＯ(p,q)とすると、ｐ，ｑは、それぞれ、以下の数式で表される。

　p = ( def_disp_win_right_offset -　def_disp_win_left_offset ) * 1/2
　　　　　　　　　　　　　　　　　　　　　　　　　+ def_disp_win_left_offset
　q = ( def_disp_win_bottom_offset -　def_disp_win_top_offset ) * 1/2
　　　　　　　　　　　　　　　　　　　　　　　　　+ def_disp_win_top_offset

　図７は、切出し位置の中心Ｏ(p,q)がプロジェクション画像の基準点ＲＰ(x,y)と一致するようにされることを示している。図示の例において、「projection_pic_size_horizontal」はプロジェクション画像の水平画素サイズを示し、「projection_pic_size_vertical」はプロジェクション画像の垂直画素サイズを示している。なお、ＶＲ表示対応受信機ではプロジェクション画像をレンダリングして表示ビュー（表示画像）を得ることが可能とされるが、デフォルトビューは基準点ＲＰ(x,y)を中心としたものとされる。

　この場合、例えば、プロジェクション画像が、基準点ＲＰ(x,y)を中心位置とするデフォルトリージョンを含む複数のリージョンからなるとき、切出し位置情報で示される位置はデフォルトリージョンの位置と一致するようにされる。この場合、切出し位置情報で示される切出し位置の中心Ｏ(p,q)は、プロジェクション画像の基準点ＲＰ(x,y)と一致する。

　図８（ａ）は、切出し位置情報で示される位置がデフォルトリージョンの位置と一致するようにされることを示している。図示の例においては、プロジェクション画像はリージョン０（Region 0）からリージョン８（Region 8）までの９つのリージョンからなっており、リージョン４（Region 4）がデフォルトリージョンであるとする。ＶＲ表示対応受信機ではプロジェクション画像をレンダリングして表示ビュー（表示画像）を得ることが可能とされ、表示ビューをリージョンの指定で切り替えることが可能であるが、デフォルトビューはデフォルトリージョンに対応したものとされる。

　図８（ｂ）は、切出し位置情報がデフォルトリージョン位置情報に基づいてどのように設定されるかを示している。切出し位置の上端位置「def_disp_win_top_offset」は、デフォルトリージョンの上端位置「proj_reg_top」と等しくされる。また、切出し位置の左端位置「def_disp_win_left_offset」は、デフォルトリージョンの左端位置「proj_reg_left」と等しくされる。また、切出し位置の下端位置「def_disp_win_bottom_offset」は、デフォルトリージョンの上端位置「proj_reg_top」にデフォルトリージョンの垂直サイズ「proj_reg_height」が加算されたものと等しくされる。また、切出し位置の右端位置「def_disp_win_right_offset」は、デフォルトリージョンの左端位置「proj_reg_left」にデフォルトリージョンの水平サイズ「proj_reg_width」が加算されたものと等しくされる。

　図４に戻って、ビデオエンコーダ１０４は、アクセスユニット（ＡＵ）の“ＳＥＩｓ”の部分に、レンダリングメタデータ（レンダリング用メタ情報）を持つＳＥＩメッセージ（SEI message）を挿入する。図９は、レンダリングメタデータ（Rendering_metadata）の構造例（Syntax）を示している。この例は、基準点ＲＰ(x,y)の位置情報を伝送する例である。また、図１１は、レンダリングメタデータ（Rendering_metadata）の他の構造例（Syntax）を示している。この例は、基準点ＲＰ(x,y)の位置情報を伝送しない例である。図１３は、各構造例における主要な情報の内容（Semantics）を示している。

　最初に、図９のレンダリングメタデータの構造例について説明する。「rendering_metadata_id」の１６ビットフィールドは、レンダリングメタデータ構造体を識別するＩＤである。「rendering_metadata_length」の１６ビットフィールドは、レンダリングメタデータ構造体バイトサイズを示す。

　「start_offset_sphere_latitude」、「start_offset_sphere_longitude」、「end_offset_sphere_latitude」、「end_offset_sphere_longitude」の各１６ビットフィールドは、球面キャプチャ画像を平面パッキングする場合の切り取り範囲の情報を示す（図１０（ａ）参照）。「start_offset_sphere_latitude」のフィールドは、球面からの切り取り開始オフセットの緯度（垂直方向）を示す。「start_offset_sphere_longitude」のフィールドは、球面からの切り取り開始オフセットの経度（水平方向）を示す。「end_offset_sphere_latitude」のフィールドは、球面からの切り取り終了オフセットの緯度（垂直方向）を示す。「end_offset_sphere_longitude」のフィールドは、球面からの切り取り終了オフセットの経度（水平方向）を示す。

　「projection_pic_size_horizontal」、「projection_pic_size_vertical」の各１６ビットフィールドは、プロジェクション画像（projection picture）のサイズ情報を示す（図１０（ｂ）参照）。「projection_pic_size_horizontal」のフィールドは、プロジェクション画像のサイズでトップ・レフト（top-left）からの水平画素カウントを示す。「projection_pic_size_vertical」のフィールドは、プロジェクション画像のサイズでトップ・レフト（top-left）からの垂直画素カウントを示す。

　「scaling_ratio_horizontal」、「scaling_ratio_vertical」の各１６ビットフィールドは、プロジェクション画像の元のサイズからのスケーリング比を示す（図５（ｂ）、（ｃ）参照）。「scaling_ratio_horizontal」のフィールドは、プロジェクション画像の元のサイズからの水平スケーリング比を示す。「scaling_ratio_vertical」のフィールドは、プロジェクション画像の元のサイズからの垂直スケーリング比を示す。

　「reference_point_horizontal」、「reference_point_vertical」の各１６ビットフィールドは、プロジェクション画像の基準点ＲＰ(x,y)の位置情報を示す（図１０（ｂ），（ｃ）参照）。「reference_point_horizontal」のフィールドは、基準点ＲＰ(x,y)の水平画素位置“ｘ”を示す。「reference_point_vertical」のフィールドは、基準点ＲＰ(x,y)の垂直画素位置“ｙ”を示す。

　図１０（ｂ）に示すように、プロジェクション画像にリージョンが設定されていない場合、基準点ＲＰ(x,y)を指定して、デフォルトビューの中心とする。一方、図１０（ｃ）に示すように、プロジェクション画像にリージョンが設定される場合、基準点ＲＰ(x,y)がデフォルトリージョンの中心となるようにリージョン位置を定義する。

　「format_type」の５ビットフィールドは、プロジェクション画像のフォーマットタイプを示す。例えば、“０”はエクイレクタングラー(Equirectangular)を示し、“１”はクロスキュービック（Cross-cubic）を示し、“２”はパーティションド・クロスキュービック（partitioned cross cubic）を示す。

　「backwardcompatible」の１ビットフィールドは、後方互換性の設定がなされているかどうか、つまりビデオストリームのレイヤに挿入される切出し位置情報で示される切出し位置の中心Ｏ(p,q)がプロジェクション画像の基準点ＲＰ(x,y)と一致するように設定されているか否かを示す。例えば、“０”は後方互換性の設定がなされていないことを示し、“１”は後方互換性の設定がなされていることを示す。

　「number_of_regions」の８ビットフィールドは、プロジェクション画像の中のリージョン数を示す。リージョン数が２以上であるとき、「region_id[i]」、「start_offset_horizontal_region[i]」、「start_offset_vertical_region[i]」、「width_region[i]」、「height_region[i]」、「default_region_flag[i]」の各フィールドが、その数だけ繰り返し存在する。

　「region_id[i]」の８ビットフィールドは、リージョンの識別番号を示す。「start_offset_horizontal_region[i]」の１６ビットフィールドは、ｉ番目のリージョンの水平開始画素オフセットを示す。「start_offset_vertical_region[i]」の１６ビットフィールドは、ｉ番目のリージョンの垂直開始画素オフセットを示す。

　「width_region[i]」の１６ビットフィールドは、ｉ番目のリージョンの水平幅を画素数で示す。「height_region[i]」の１６ビットフィールドは、ｉ番目のリージョンの垂直幅を画素数で示す。「default_region_flag[i]」の１ビットフィールドは、デフォルトリージョンであるか否かを示す。例えば、“０”はデフォルトリージョンでないことを示し、“１”はデフォルトリージョンであることを示す。

　次に、図１１のレンダリングメタデータの構造例について説明する。「rendering_metadata_id」の１６ビットフィールドは、レンダリングメタデータ構造体を識別するＩＤである。「rendering_metadata_length」の１６ビットフィールドは、レンダリングメタデータ構造体バイトサイズを示す。

　「start_offset_sphere_latitude」、「start_offset_sphere_longitude」、「end_offset_sphere_latitude」、「end_offset_sphere_longitude」の各１６ビットフィールドは、図９の構造例と同様に、球面キャプチャ画像を平面パッキングする場合の切り取り範囲を示す（図１２（ａ）参照）。「projection_pic_size_horizontal」、「projection_pic_size_vertical」の各１６ビットフィールドは、図９の構造例と同様に、プロジェクション画像（projection picture）のサイズ情報を示す（図１２（ｂ）参照）。「scaling_ratio_horizontal」、「scaling_ratio_vertical」の各１６ビットフィールドは、図９の構造例と同様に、プロジェクション画像の元のサイズからのスケーリング比を示す（図５（ｂ）、（ｃ）参照）。

　「format_type」の５ビットフィールドは、プロジェクション画像のフォーマットタイプを示す。「backwardcompatible」の１ビットフィールドは、後方互換性の設定がなされているかどうかを示す。「number_of_regions」の８ビットフィールドは、プロジェクショ画像の中のリージョン数を示す。リージョン数が２以上であるとき、図９の構造例と同様に、「region_id[i]」、「start_offset_horizontal_region[i]」、「start_offset_vertical_region[i]」、「width_region[i]」、「height_region[i]」、「default_region_flag[i]」の各フィールドが、その数だけ繰り返し存在する。

　図１１に示す構造例においては、図９に示す構造例から、プロジェクション画像の基準点ＲＰ(x,y)の位置情報を示す「reference_point_horizontal」、「reference_point_vertical」の各１６ビットフィールが除かれたものである。

　プロジェクション画像にリージョンが設定されていない場合、図１２（ｂ）に示すように、プロジェクション画像の中心を基準点ＲＰ(x,y)、従ってデフォルトビューの中心と見なす。一方、プロジェクション画像にリージョンが設定されていない場合、図１２（ｃ）に示すように、デフォルトリージョンの中心が基準点ＲＰ(x,y)となるようにリージョン位置を定義する。

　図４に戻って、コンテナエンコーダ１０５は、ビデオエンコーダ１０４で生成されたビデオストリームを含むコンテナ、ここではＭＰ４ストリームを、配信ストリームＳＴＭとして生成する。この場合、コンテナエンコーダ１０５は、コンテナのレイヤに、レンダリングメタデータ（図９、図１１参照）を挿入する。なお、この実施の形態においては、ビデオストリームのレイヤとコンテナのレイヤの双方にレンダリングメタデータを挿入するものであるが、いずれか一方のみに挿入することも考えられる。

　また、コンテナエンコーダ１０５は、コンテナのレイヤに、ビデオストリームに対応付けて、種々の情報を持つデスクリプタを挿入する。このデスクリプタとして、従来周知のコンポーネントデスクリプタ（component_descriptor）が存在し、さらに新規定義するディスプレイ・ウインドウ・アクティベートデスクリプタ（display_window_activate_descriptor）が存在する。

　図１４（ａ）は、コンポーネントデスクリプタの構造例（syntax）を示し、図１４（ｂ）は、その構造例における主要な情報の内容（semantics）を示している。「stream_content」の４ビットフィールドは、ビデオ・オーディオ・サブタイトルの符号化方式を示す。この実施の形態では、“０ｘ９”とされ、ＨＥＶＣ符号化であることが示される。

　「stream_content_ext」の４ビットフィールドは、上述の「stream_content」との組み合わせで用いることで、符号化内容の詳細を示す。この実施の形態では、“０ｘ２”とされ、“VR Partial displaying Service”であること、つまりＶＲサービスであって部分的に切り取って見ることができるサービスであることが示される。

　「component_type」の８ビットフィールドは、各符号化方式の中のバリエーションを示す。この実施の形態では、例えば、“ＵＨＤ　１６：９”であることが示される。なお、「stream_content_ext」が“０ｘ２”であって“VR Partial displaying Service”である場合に、ディスプレイ・ウインドウ・アクティベートデスクリプタが配置される。

　図１５（ａ）は、ディスプレイ・ウインドウ・アクティベートデスクリプタの構造例（syntax）を示し、図１５（ｂ）は、その構造例における主要な情報の内容（semantics）を示している。「display_window_activate_flag」の１ビットフィールドは、ＶＲ表示能力との関連で切出し位置情報による切出しが必須であるか否かを示す指示情報である。例えば、“１”は、ＶＲ表示非対応受信機が部分表示を行う場合、ビデオストリームＶＵＩの「default_display_window」に応じた切出しを必須とすることを示し、“０”は、「default_display_window」に応じた切出しを必須としないことを示す。

　ここで、「display_window_activate_flag」が“１”である場合、ビデオストリームＶＵＩの「default_display_window_flag」（図６参照）は“１”に設定され、「default_display_window」を含むようにされる。なお、「cropping_window_flag」は、常に、０とされる。

　このようにコンテナエンコーダ１０５で得られたＭＰ４の配信ストリームＳＴＭは、放送波あるいはネットのパケットに載せて、サービス受信機２００Ａ，２００Ｂに送信される。

　図１６は、配信ストリームＳＴＭとしてのＭＰ４ストリームの一例を示している。一般の放送など、送信の途中から画音が出るように、サービスストリーム全体がフラグメント化されて送信される。各ランダムアクセス期間は、イニシャライゼーション・セグメント（ＩＳ：initialization segment）から始まり、それに、“ｓｔｙｐ”、“ｓｉｄｘ（Segment index box）”、“ｓｓｉｘ（Sub-segment index box）”、“ｍｏｏｆ（Movie fragment box）”、“ｍｄａｔ（Media data box）”のボックスが続いた構成となっている。

　イニシャライゼーション・セグメント（ＩＳ）は、ＩＳＯＢＭＦＦ（ISO Base Media File Format）に基づくボックス（Box）構造を持つ。先頭に、ファイルタイプ（File type）を示す“ｆｔｙｐ”ボックスが配置され、それに続いて制御用の“ｍｏｏｖ”ボックスが配置されている。詳細説明は省略するが、この“ｍｏｏｖ”ボックス内に、“ｔｒａｋ”ボックス、“ｍｄｉａ”ボックス、“ｍｉｎｆ”ボックス、“ｓｔｂｌ”ボックス、“ｓｔｓｄ”ボックスおよび“ｓｃｈｉ”ボックスが階層的に配置される。そして、この“ｓｃｈｉ”ボックスに、レンダリングメタデータ（図９、図１１参照）、コンポーネントデスクリプタ(図１４参照)およびディスプレイ・ウインドウ・アクティベートデスクリプタ（図１５参照）あるいはそれらのデスクリプタに含まれる要素が挿入される。

　“ｓｔｙｐ”ボックスにはセグメントタイプ情報が入る。 “ｓｉｄｘ”ボックスには、各トラック（track）のレンジ情報が入り、“ｍｏｏｆ”/“ｍｄａｔ”の位置が示され、“ｍｄａｔ”内の各サンプル（ピクチャ）の位置も示される。“ｓｓｉｘ”ボックスには、トラック（track）の区分け情報が入り、Ｉ/Ｐ/Ｂタイプの区分けがされる。

　“ｍｏｏｆ”ボックスには制御情報が入る。“ｍｄａｔ”ボックスにはビデオ、オーディオなどの信号（伝送メディア）の実体そのものが入る。“ｍｏｏｆ”ボックスと“ｍｄａｔ”ボックスによりムービーフラグメント（Movie fragment）が構成されている。１つのムービーフラグメントの“ｍｄａｔ”ボックスには、伝送メディアがフラグメント化（断片化）されて得られた断片が入るので、“ｍｏｏｆ”ボックスに入る制御情報はその断片に関する制御情報となる。

　各ムービーフラグメントの“ｍｄａｔ”ボックスには、プロジェクション画像の符号化画像データ（アクセスユニット）が所定ピクチャ数分、例えば１ＧＯＰ（Group of picture）分だけ配置される。ここで、各アクセスユニットは、「ＶＰＳ」、「ＳＰＳ」、「ＰＰＳ」、「ＰＳＥＩ」、「ＳＬＩＣＥ」、「ＳＳＥＩ」などのＮＡＬユニットにより構成される。なお、「ＶＰＳ」、「ＳＰＳ」は、例えば、ＧＯＰの先頭ピクチャに挿入される。

　ＳＰＳ　ＮＡＬユニットには、切出し位置情報としての「default_display_window」の情報が挿入される（図６参照）。また、「ＳＳＥＩ」のＮＡＬユニットとして、レンダリングメタデータ（Rendering_metadata）（図９、図１１参照）を持つＳＥＩメッセージが挿入される。

　図１７は、ＭＰＤファイルの記述例を示している。ここでは、説明の簡単化のためにビデオストリームに関する情報のみが記述されている例を示しているが、実際には他のメディアストリームに関する情報も記述されている。図１８は、“SupplementaryDescriptor”の「Value」セマンティスクスを示している。

　「<AdaptationSet mimeType=“video/mp4” codecs=“hev1.xx.xx.Lxxx,xx”」の記述により、ビデオストリームに対するアダプテーションセット（AdaptationSet）が存在し、そのビデオストリームはＭＰ４ファイル構造で供給され、LxxxのレベルのＨＥＶＣのビデオストリーム（符号化画像データ）の存在が示されている。

　このＭＰＤファイルには、ビデオストリームに対応したリプレゼンテーション（Representation）が存在する。このリプレゼンテーションにおいて、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:renderingmetadata” value=“1”/>」の記述により、レンダリングメタデータ（Rendering_metadata）の存在が示される。

　また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:projectiontype” value=“0”/>」の記述により、プロジェクション画像のフォーマットタイプがエクイレクタングラー(Equirectangular)であることが示される。「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:video:backwardcompatible” value=“1”/>」の記述により、後方互換性の設定がなされていること、つまりビデオストリームのレイヤに挿入される切出し位置情報で示される切出し位置の中心Ｏ(p,q)がプロジェクション画像の基準点ＲＰ(x,y)と一致するように設定されていることが示される。

　また、「width=“” height=“” frameRate=“”」、「codecs="hev1.xx.xx.Lxxx,xx"」、「level= “0”」の記述により、解像度、フレームレート、コーデックの種類が示され、タグ情報としてレベル“０”が付与されることが示され、さらにビデオストリーム（符号化ストリーム）のレベルが“Lxxx”であることが示される。また、「<BaseURL>videostreamVR.mp4</BaseURL>」の記述により、このビデオストリームのロケーション先が、「videostreamVR.mp4」として示されている。

　図４に戻って、サービス受信機２００Ａは、ＶＲ表示対応受信機である。このサービス受信機２００Ａは、ＶＲサービスストリーム（HEVC UHD 16:9 VR Partial displaying Service）の受信が可能であって、ＶＲ表示にも対応している。つまり、このサービス受信機２００Ａは、レンダリングによる表示をする。なお、ＶＲサービスストリームであることは、上述したように、コンポーネントデスクリプタ（図１４参照）の「stream_content_ext」、「stream_content」、「component_type」のフィールドで判断される。

　また、サービス受信機２００Ｂは、ＶＲ表示非対応受信機である。このサービス受信機２００Ｂは、ＶＲサービスストリームの受信は可能であるが、レンダリングによる表示は行うことができず、切出しによる部分画像表示をする。この場合、サービス受信機２００は、ディスプレイ・ウインドウ・アクティベートデスクリプタ（図１５参照）の「display_window_activate_flag」が“１”であるか“０”であるかに応じた切出しをする。

　すなわち、サービス受信機２００Ｂは、「display_window_activate_flag」が“１”であるときは、ビデオストリームＶＵＩの「default_display_window」の切出し位置情報に基づいた切出しをする。一方、サービス受信機２００Ｂは、「display_window_activate_flag」が“０”であるときは、「default_display_window」の切出し位置情報に制約されることなく切出しを行い得る。

　図１９は、受信機タイプによるＶＲサービスストリームの受信可否とＶＲ表示の可否を示している。ＶＲサービスストリームは、コンポーネントデスクリプタでＶＲサービスストリームであることを識別でき、ＶＲサービス受信可能な受信機は受信するが、ＶＲサービス受信非対応の受信機は受信しない。

　また、ＶＲサービス受信可能な受信機のうち、ＶＲ表示対応受信機（サービス受信機２００Ａ）は、レンダリングによる表示をする。一方、ＶＲサービス受信可能な受信機のうち、ＶＲ表示非応受信機（サービス受信機２００Ｂ）は、切出しによる部分画像表示をするが、ディスプレイ・ウインドウ・アクティベートデスクリプタで切出し位置情報「default_display_window」に応じた切出しが必須か否かの指示がされる。

　図４に戻って、ＶＲ表示対応受信機であるサービス受信機２００Ａは、コンテナデコーダ２０３と、ビデオデコーダ２０４と、レンダラ２０５を有している。コンテナデコーダ２０３は、受信されたＭＰ４の配信ストリームＳＴＭからビデオストリームを取り出し、ビデオデコーダ２０４に送る。

　ビデオデコーダ２０４は、コンテナデコーダ２０３で取り出されたビデオストリームに復号化処理を施して、プロジェクション画像（画像データ）を得る。レンダラ２０５は、コンテナおよび/またはビデオストリームのレイヤに挿入されているレンダリングメタデータ（レンダリング用メタ情報）に基づいて、プロジェクション画像（画像データ）にレンダリング処理を施して、レンダリング画像（画像データ）を得る。

　この場合、レンダラ２０５は、プロジェクション画像の基準点ＲＰ(x,y)を中心とするデフォルトビューに対応したレンダリング画像を生成する他、ユーザ操作あるいはユーザの動作に応じて他のビューに対応したレンダリング画像も生成し得る。例えば、プロジェクション画像が複数のリージョンからなる場合、デフォルトリージョンに対応したデフォルトビューのレンダリング画像を生成する他、ユーザにより指定された他のリージョンに対応したビューのレンダリング画像も生成し得る。

　なお、図示していないが、サービス受信機２００Ａは、プロジェクション画像（画像データ）から、ビデオストリームのレイヤに挿入される切出し位置情報で切出し処理をして部分画像（画像データ）を得ることも可能とされる。そして、サービス受信機２００Ａにおいては、ユーザの切り替え操作に応じて、表示画像としてレンダリング画像または切出し画像を選択的に表示できる。

　また、ＶＲ表示非対応受信機であるサービス受信機２００Ｂは、コンテナデコーダ２３３と、ビデオデコーダ２３４と、パーシャルピクチャ部２３５を有している。コンテナデコーダ２３３は、受信されたＭＰ４の配信ストリームＳＴＭからビデオストリームを取り出し、ビデオデコーダ２３４に送る。

　ビデオデコーダ２３４は、コンテナデコーダ２３３で取り出されたビデオストリームに復号化処理を施して、プロジェクション画像（画像データ）を得る。パーシャルピクチャ部２３５は、プロジェクション画像（画像データ）から、切出し処理をして、切出し画像（画像データ）を得る。この場合、ディスプレイ・ウインドウ・アクティベートデスクリプタの「display_window_activate_flag」が“１”であるときは、ビデオストリームＶＵＩの「default_display_window」の切出し位置情報に基づいた切出しをする。サービス受信機２００Ｂにおいては、この切出し画像を表示できる。

　図２０（ａ）は、ビデオデコーダ２０４，２３４の出力であるプロジェクション画像の一例を示している。ここで、ビデオストリームのレイヤに挿入される切出し位置情報で示される切出し位置「default_display_window」の中心Ｏ(p,q)は、プロジェクション画像の基準点ＲＰ(x,y)と一致するようにされている。

　図２０（ｂ）は、ＶＲ表示対応受信機であるサービス受信機２００Ａにおいて、プロジェクション画像を処理して得られたレンダリング画像あるいは切出し画像を選択的に表示できることを示している。ここで、レンダリング画像は、プロジェクション画像にレンダリング処理を施して得られたものである。そして、デフォルトのレンダリング画像は、プロジェクション画像の基準点ＲＰ(x,y)を中心とするデフォルトビューに対応したものとなる。また、切出し画像は、プロジェクション画像から切出し位置「default_display_window」の領域が切出されて得られたものである。

　図２０（ｃ）は、ＶＲ表示非対応受信機であるサービス受信機２００Ｂにおいて、切出し画像を表示できることを示している。図示の例では、この切出し画像は、プロジェクション画像から切出し位置「default_display_window」の領域が切出されて得られたものである。

　上述したように切出し位置「default_display_window」の中心Ｏ(p,q)はプロジェクション画像の基準点ＲＰ(x,y)と一致する。そのため、サービス受信機２００Ｂにおいてプロジェクション画像から切出し位置「default_display_window」の領域を切り出す場合には、サービス受信機２００Ａで表示されるデフォルトビューに対応したレンダリング画像とサービス受信機２００Ｂで表示される切出し画像は共通の画像となる。つまり、ＶＲ表示対応受信機であるサービス受信機２００ＡとＶＲ表示非対応受信機であるサービス受信機２００Ｂとの間で共通の画像を得ることができる。

　「サービス送信システムの構成例」
　図２１は、サービス送信システム１００の構成例を示している。このサービス送信システム１００は、制御部１０１と、ユーザ操作部１０１ａと、カメラ１０２と、平面パッキング部１０３と、ビデオエンコーダ１０４と、コンテナエンコーダ１０５と、送信部１０６を有している。

　制御部１０１は、ＣＰＵ（Central Processing Unit）を備えて構成され、制御プログラムに基づいて、サービス送信システム１００の各部の動作を制御する。ユーザ操作部１０１ａは、ユーザが種々の操作を行うためのキーボード、マウス、タッチパネル、リモコンなどである。

　カメラ１０２は、被写体を撮像して、球面キャプチャ画像（３６０°ＶＲ画像）の画像データを得る。例えば、カメラ１０２は、バック・ツー・バック（Back to Back）方式で撮像を行って、球面キャプチャ画像として、それぞれ魚眼レンズを用いて撮像された１８０°以上の視野角を持つ、超広視野角の前面画像および後面画像を得る（図５（ａ）参照）。

　平面パッキング部１０３は、カメラ１０２で得られた球面キャプチャ画像の一部または全部を切り取って平面パッキングして長方形のプロジェクション画像（Projection picture）を得る（図５（ｂ）参照）。この場合、プロジェクション画像のフォーマットタイプとしては、例えば、エクイレクタングラー(Equirectangular)、クロスキュービック（Cross-cubic）などが選択される。なお、平面パッキング部では、プロジェクション画像に必要に応じてスケーリングを施し、所定の解像度のプロジェクション画像を得る（図５（ｃ）参照）。

　ビデオエンコーダ１０４は、平面パッキング部１０３からのプロジェクション画像の画像データに対して、例えばＨＥＶＣなどの符号化を施して符号化画像データを得、この符号化画像データを含むビデオストリームを生成する。ビデオストリームのＳＰＳ　ＮＡＬユニットには、切出し位置情報が挿入されている（図６の「default_display_window」の情報参照）。

　ここで、切出し位置情報で示される切出し位置の中心Ｏ(p,q)は、プロジェクション画像の基準点ＲＰ(x,y)と一致するようにされる（図７参照）。この場合、例えば、プロジェクション画像が、基準点ＲＰ(x,y)を中心位置とするデフォルトリージョンを含む複数のリージョンからなるとき、切出し位置情報で示される位置はデフォルトリージョンの位置と一致するようにされる（図８参照）。この場合、切出し位置情報で示される切出し位置の中心Ｏ(p,q)は、プロジェクション画像の基準点ＲＰ(x,y)と一致する。

　また、ビデオエンコーダ１０４は、アクセスユニット（ＡＵ）の“ＳＥＩｓ”の部分に、レンダリングメタデータ（レンダリング用メタ情報）を持つＳＥＩメッセージ（SEI message）を挿入する。レンダリング用メタデータには、球面キャプチャ画像を平面パッキングする場合の切り取り範囲の情報、プロジェクション画像の元のサイズからのスケーリング比の情報、プロジェクション画像のフォーマットタイプの情報、切出し位置の中心Ｏ(p,q)をプロジェクション画像の基準点ＲＰ(x,y)と一致させるという後方互換性の設定がなされているかどうかを示す情報などが挿入されている（図９、図１１参照）

　また、レンダリングメタデータに、基準点ＲＰ(x,y)の位置情報が挿入される場合（図９参照）と、挿入されない場合（図１１参照）がある。挿入されない場合、プロジェクション画像の中心が基準点ＲＰ(x,y)とみなされ（図１２（ｂ）参照）、あるいはデフォルトリージョンの中心が基準点ＲＰ(x,y)とみなされる（図１２（ｃ）参照）。

　コンテナエンコーダ１０５は、ビデオエンコーダ１０４で生成されたビデオストリームを含むコンテナ、ここではＭＰ４ストリームを、配信ストリームＳＴＭとして生成する（図１６参照）。この場合、コンテナエンコーダ１０５は、コンテナのレイヤに、レンダリングメタデータ（図９、図１１参照）を挿入する。

　また、コンテナエンコーダ１０５は、コンテナのレイヤに、ビデオストリームに対応付けて、種々の情報を持つデスクリプタを挿入する。このデスクリプタとしてコンポーネントデスクリプタ（図１４参照）が存在し、さらに新規定義するディスプレイ・ウインドウ・アクティベートデスクリプタ（図１５参照）が存在する。コンポーネントデスクリプタには、ビデオストリームがＶＲサービスストリームであることを示す情報も存在する。また、ディスプレイ・ウインドウ・アクティベートデスクリプタには、ＶＲ表示能力との関連で切出し位置情報による切出しが必須であるか否かを示す指示情報が存在する。送信部１０６は、コンテナエンコーダ１０５で得られたＭＰ４の配信ストリームＳＴＭを、放送波あるいはネットのパケットに載せて、サービス受信機２００Ａ，２００Ｂに送信する。

　「サービス受信機（ＶＲ表示対応受信機）の構成例」
　図２２は、ＶＲ表示対応受信機であるサービス受信機２００Ａの構成例を示している。このサービス受信機２００Ａは、制御部２０１と、ユーザ操作部２０１ａと、受信部２０２と、コンテナデコーダ２０３と、ビデオデコーダ２０４と、レンダラ２０５と、パーシャルピクチャ部２０６と、切り替えスイッチ２０７と、スケーリング部２０８と、表示部２０９を有している。

　制御部２０１は、ＣＰＵ（Central Processing Unit）を備えて構成され、制御プログラムに基づいて、サービス受信機２００Ａの各部の動作を制御する。ユーザ操作部２０１ａは、ユーザが種々の操作を行うためのキーボード、マウス、タッチパネル、リモコンなどであり、ユーザ操作情報は制御部２３１に供給される。また、制御部２０１には図示しないユーザの動作を感知するセンサからのセンサ情報も供給される。受信部２０２は、サービス送信システム１００から放送波あるいはネットのパケットに載せて送られてくるＭＰ４の配信ストリームＳＴＭを受信する。

　コンテナデコーダ（マルチプレクサ）１０３は、制御部２０１の制御のもと、受信部２０２で受信されたＭＰ４の配信ストリームＳＴＭから、イニシャラゼイションセグメントの“ｍｏｏｖ”ブロックや“ｍｏｏｆ”ブロックなどの制御情報に基づいて、ビデオストリームを取り出し、ビデオデコーダ２０４に送る。また、コンテナデコーダ２０３は、配信ストリームＳＴＭから“ｍｏｏｖ”ブロックの情報などを取り出し、制御部２０１に送る。“ｍｏｏｖ”ブロックの情報の一つとしてレンダリングメタデータ（図９、図１１参照）が存在する。また、“ｍｏｏｖ”ブロックの情報の一つとして、コンポーネントデスクリプタ（図１４参照）やディスプレイ・ウインドウ・アクティベートデスクリプタ（図１５参照）も存在する。

　ビデオデコーダ２０４は、コンテナデコーダ２０３で取り出されたビデオストリームに復号化処理を施して、プロジェクション画像（画像データ）を得る。また、ビデオデコーダ２０４は、コンテナデコーダ２０３で取り出されたビデオストリームに挿入されているパラメータセットやＳＥＩメッセージを抽出し、制御部２０１に送る。この抽出情報には、ＳＰＳ　ＮＡＬパケットに挿入されている切出し位置「default_display_window」の情報、さらにはレンダリングメタデータ（図９、図１１参照）を持つＳＥＩメッセージも含まれる。

　レンダラ２０５は、制御部２０１の制御のもと、レンダリングメタデータに基づいて、プロジェクション画像（画像データ）にレンダリング処理を施して、レンダリング画像（画像データ）を得る。

　パーシャルピクチャ部２０６は、制御部２０１の制御のもと、ビデオストリームのレイヤに挿入される切出し位置情報で、プロジェクション画像に切出し処理を施して、切出し画像（画像データ）を得る。切り替えスイッチ２０７は、制御部２０１の制御のもと、センサ情報あるいはユーザの切り替え操作に応じて、レンダラ２０５で得られたレンダリング画像（画像データ）またはパーシャルピクチャ部２０６で得られた切出し画像（画像データ）を選択的に取り出して出力する。

　スケーリング部２０８は、切り替えスイッチ２０７で取り出された画像（画像データ）に対して、表示部２０９のサイズに合うようにスケーリング処理を行う。表示部２０９は、スケーリング処理されたレンダリング画像または切出し画像を表示する。この表示部２０９は、例えば、表示パネルやＨＭＤ（Head Mounted Display）などで構成される。

　図２３は、サービス受信機２００Ａにおける表示切り替えシーケンスを示している。この表示切り替えシーケンスは一例であって、これに限定されるものではない。

　図示の表示切り替えシーケンスにおいては、表示状態として、大きく分けて、切出し画像を表示する基本表示状態と、デフォルトビュー（あるいはデフォルトリージョン）に対応したレンダリング画像を表示するＶＲ表示（デフォルトビュー）状態と、ＶＲ表示（他のビュー）状態の３つが存在する。

　起動時やチャネル切り換え時には、基本表示状態となる。この場合、パーシャルピクチャ部２０６で切出し画像（画像データ）が得られ、この切出し画像（画像データ）が切り替えスイッチ２０７で取り出され、スケーリング部２０８を通じて表示部２０９に供給されて、切出し画像が表示される。

　この基本表示状態において、ユーザ操作によりＶＲモードが選択されると、ＶＲ表示（デフォルトビュー）状態となる。この場合、最初は、レンダラ２０５でデフォルトビュー（あるいはデフォルトリージョン）に対応したレンダリング画像（画像データ）が得られ、このレンダリング画像（デフォルトビュー）が切り替えスイッチ２０７で取り出され、スケーリング部２０８を通じて表示部２０９に供給されて、デフォルトビュー（あるいはデフォルトリージョン）に対応したレンダリング画像が表示される。

　また、この基本表示状態において、ユーザ操作あるいはユーザの動作により他のビュー（あるいは他のリージョン）が選択されると、ＶＲ表示（他のビュー）状態となる。この場合、レンダラ２０５で選択された他のビュー（あるいはリージョン）に対応したレンダリング画像（画像データ）が得られ、このレンダリング画像（他のビュー）が切り替えスイッチ２０７で取り出され、スケーリング部２０８を通じて表示部２０９に供給されて、他のビュー（あるいはリージョン）に対応したレンダリング画像が表示される。

　また、このＶＲ表示（他のビュー）状態において、デフォルト回帰選択がされると、ＶＲ表示（デフォルトビュー）状態となる。また、このＶＲ表示（デフォルトビュー）状態において、ユーザ操作により復帰選択がされると、基本表示状態となる。なお、ＶＲ表示（他のビュー）状態からユーザの復帰操作により、直接基本表示に移行することも可能である。

　「サービス受信機（ＶＲ表示非対応受信機）の構成例」
　図２４は、ＶＲ表示非対応受信機であるサービス受信機２００Ｂの構成例を示している。このサービス受信機２００Ｂは、制御部２３１と、ユーザ操作部２３１ａと、受信部２３２と、コンテナデコーダ２３３と、ビデオデコーダ２３４と、パーシャルピクチャ部２３５と、スケーリング部２３６と、表示部２３７を有している。

　制御部２３１は、ＣＰＵ（Central Processing Unit）を備えて構成され、制御プログラムに基づいて、サービス受信機２００Ｂの各部の動作を制御する。ユーザ操作部２３１ａは、ユーザが種々の操作を行うためのキーボード、マウス、タッチパネル、リモコンなどであり、ユーザ操作情報は制御部２３１に供給される。また、制御部２３１には図示しないユーザの動作を感知するセンサからのセンサ情報も供給される。受信部２３２は、サービス送信システム１００から放送波あるいはネットのパケットに載せて送られてくるＭＰ４の配信ストリームＳＴＭを受信する。

　コンテナデコーダ（マルチプレクサ）２３３は、制御部２３１の制御のもと、受信部２３２で受信されたＭＰ４の配信ストリームＳＴＭから、イニシャラゼイションセグメントの“ｍｏｏｖ”ブロックや“ｍｏｏｆ”ブロックなどの制御情報に基づいて、ビデオストリームを取り出し、ビデオデコーダ２３４に送る。また、コンテナデコーダ２３３は、配信ストリームＳＴＭから“ｍｏｏｖ”ブロックの情報などを取り出し、制御部２３１に送る。“ｍｏｏｖ”ブロックの情報の一つとして、コンポーネントデスクリプタ（図１４参照）やディスプレイ・ウインドウ・アクティベートデスクリプタ（図１５参照）も存在する。

　ビデオデコーダ２３４は、コンテナデコーダ２３３で取り出されたビデオストリームに復号化処理を施して、プロジェクション画像（画像データ）を得る。また、ビデオデコーダ２３４は、コンテナデコーダ２３３で取り出されたビデオストリームに挿入されているパラメータセットやＳＥＩメッセージを抽出し、制御部２３１に送る。この抽出情報には、ＳＰＳ　ＮＡＬパケットに挿入されている切出し位置「default_display_window」の情報も含まれる。

　パーシャルピクチャ部２３５は、制御部２３１の制御のもと、プロジェクション画像に切出し処理を施して、切出し画像（画像データ）を得る。この場合、ディスプレイ・ウインドウ・アクティベートデスクリプタの「display_window_activate_flag」が“１”であるときは、ビデオストリームＶＵＩの「default_display_window」の切出し位置情報に基づいた切出しをする。

　スケーリング部２３６は、パーシャルピクチャ部２３５で得られた切出し画像（画像データ）に対して、表示部２３７で指定されるサイズに合うようにスケーリング処理を行う。表示部２３７は、スケーリング処理された切出し画像を表示する。この表示部２３７は、例えば、表示パネルやＨＭＤ（Head Mounted Display）などで構成される。

　上述したように、図１に示す送受信システム１０においては、ビデオストリームを含むコンテナのレイヤに、ビデオストリームに挿入された切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報としての「display_window_activate_flag」が記述されたディスプレイ・ウインドウ・アクティベートデスクリプタが挿入されて送信される。そのため、ＶＲ表示非対応受信機であるサービス受信機２００Ｂは、「display_window_activate_flag」が“１”である場合、プロジェクション画像にビデオストリームＶＵＩの「default_display_window」の切出し位置情報に基づいた切出しを行って画像表示をして、歪みがないあるいは歪みの少ない適切な画像をユーザに容易に提供できる。

　また、図１に示す送受信システム１０において、ビデオストリームのレイヤに挿入される切出し位置情報で示される切出し位置「default_display_window」の中心Ｏ(p,q)はプロジェクション画像の基準点ＲＰ(x,y)と一致するようにされている。そのため、ＶＲ表示対応受信機であるサービス受信機２００Ａで表示されるデフォルトビューに対応したレンダリング画像とＶＲ表示非対応受信機であるサービス受信機２００Ｂで表示される切出し画像は共通の画像となり、従ってＶＲ表示対応受信機とＶＲ表示非対応受信機との間で共通の画像を得ることが可能となる。

　＜２．変形例＞
　「ＭＰＥＧ－２　ＴＳ、ＭＭＴへの適用」
　なお、上述実施の形態においては、コンテナがＭＰ４（ＩＳＯＢＭＦＦ）である例を示した。しかし、本技術は、コンテナがＭＰ４に限定されるものではなく、ＭＰＥＧ－２　ＴＳやＭＭＴなどの他のフォーマットのコンテナであっても同様に適用し得る。

　例えば、ＭＰＥＧ－２　ＴＳの場合には、図４に示すサービス送信システム１００のコンテナエンコーダ１０５では、ビデオストリームを含むトランスポートストリーム（Transport Stream）が生成される。

　この際、コンテナエンコーダ１０５では、プログラム・マップ・テーブル（ＰＭＴ：Program Map Table）のビデオストリームに対応したビデオエレメンタリストリームループに、レンダリングメタデータ（図９、図１１参照）を含むレンダリング・メタデータ・デスクリプタ（Rendering_metadata_descriptor）が挿入されると共に、コンポーネントデスクリプタ（図１４参照）やディスプレイ・ウインドウ・アクティベートデスクリプタ（図１５参照）も挿入される。

　図２５は、トランスポートストリームの構成例を示している。この構成例では、ＰＩＤ１で識別されるビデオストリームのＰＥＳパケット「video PES1」が存在する。このＰＥＳパケット「video PES1」のペイロードには、各ピクチャのアクセスユニット（符号化画像データ）が含まれる。

　ＰＥＳパケット「video PES1」でコンテナされるアクセスユニット（符号化画像データ）において、「ＳＰＳ」には切出し位置「default_display_window」の情報が挿入されている。また、「ＳＳＥＩ」にはレンダリングメタデータ（図９、図１１参照）を持つＳＥＩメッセージが挿入されている。

　また、ＰＭＴに、ＰＥＳパケット「video PES1」に対応したビデオエレメンタリストリームループ（video ES1 loop）が存在する。ビデオエレメンタリストリームループ（video ES1 loop）には、ビデオストリーム（video PES1）に対応して、ストリームタイプ、パケット識別子（PID）等の情報が配置されると共に、そのビデオストリームに関連する情報を記述するデスクリプタも配置される。

　このストリームタイプは、ビデオストリームを示す“０ｘ２４”とされる。また、デスクリプタの一つとして、レンダリングメタデータを含むレンダリング・メタデータ・デスクリプタが挿入されていると共に、コンポーネントデスクリプタやディスプレイ・ウインドウ・アクティベートデスクリプタも挿入されている。

　また、例えば、ＭＭＴの場合には、図４に示すサービス送信システム１００のコンテナエンコーダ１０５では、ビデオストリームを含むＭＭＴストリーム（MMT Stream）が生成される。

　この際、コンテナエンコーダ１０５では、ＭＭＴ・パッケージ・テーブル（ＭＰＴ：MMT Package Table）の拡張ビデオストリームに対応したビデオアセットループに、レンダリングメタデータ（図９、図１１参照）を含むレンダリング・メタデータ・デスクリプタ（Rendering_metadata_descriptor）が挿入されると共に、コンポーネントデスクリプタ（図１４参照）やディスプレイ・ウインドウ・アクティベートデスクリプタ（図１５参照）も挿入される。

　図２６は、ＭＭＴストリームの構成例を示している。この構成例では、ＩＤ１で識別されるビデオストリームのＭＰＵパケット「video MPU1」が存在する。このＭＰＵパケット「video MPU1」のペイロードには、各ピクチャのアクセスユニット（符号化画像データ）が含まれる。

　ＭＰＵパケット「video MPU1」でコンテナされるアクセスユニット（符号化画像データ）において、「ＳＰＳ」には切出し位置「default_display_window」の情報が挿入されている。また、「ＳＳＥＩ」にはレンダリングメタデータ（図９、図１１参照）を持つＳＥＩメッセージが挿入されている。

　また、ＭＰＴに、ＭＰＵパケット「video MPU1」に対応したビデオアセットループ（video asset1 loop）が存在する。ビデオアセットループ（video asset1 loop）には、ビデオストリーム（video MPU1）に対応して、ストリームタイプ、パケット識別子（PID）等の情報が配置されると共に、そのビデオストリームに関連する情報を記述するデスクリプタも配置される。

　このアセットタイプは、ビデオストリームを示す“０ｘ２４”とされる。また、デスクリプタの一つとして、レンダリングメタデータを含むレンダリング・メタデータ・デスクリプタが挿入されていると共に、コンポーネントデスクリプタやディスプレイ・ウインドウ・アクティベートデスクリプタも挿入されている。

　また、上述実施の形態においては、プロジェクション画像のフォーマットタイプがエクイレクタングラー(Equirectangular)であることを想定した説明となっている（図５、図７、図８参照）。上述したように、プロジェクション画像のフォーマットタイプはエクイレクタングラーに限定されるものではなく、その他のフォーマットであってもよい。

　「フォーマットタイプがクロスキュービックである場合」
　図２７は、フォーマットタイプがクロスキュービック（Cross-cubic）であるプロジェクション画像を示している。このプロジェクション画像には、「top」、「front」、「bottom」、「right」、「back」、「left」の６つのビューが存在する。

　図２８（ａ）は、「front」ビュー（図２７に破線矩形枠で示す）がデフォルトビュー（Default view）であるケース１における基準点ＲＰ(x,y)の指定および切出し位置「default_display_window」の指定について示している。

　この場合、基準点ＲＰ(x,y)のｘ，ｙは、以下の数式のように指定される。
　　x = projection_pic_size_horizontal * 1/8
　　y = projection_pic_size_vertical * 1/2

　また、この場合、切出し位置「default_display_window」は、その中心が基準点ＲＰ(x,y)と一致するように、以下の数式のように指定される。
　　def_disp_win_left_offset　 = 0
　　def_disp_win_right_offset　= projection_pic_size_horizontal * 1/4
　　def_disp_win_top_offset　　= projection_pic_size_vertical * 1/3
　　def_disp_win_bottom_offset = projection_pic_size_vertical * 2/3

　図２８（ｂ）は、「left」ビュー（図２７に一点鎖線矩形枠で示す）がデフォルトビュー（Default view）であるケース２における基準点ＲＰ´(x,y)の指定および切出し位置「default_display_window」の指定について示している。

　この場合、基準点ＲＰ´(x,y)のｘ，ｙは、以下の数式のように指定される。
　　x = projection_pic_size_horizontal * 7/8
　　y = projection_pic_size_vertical * 1/2

　また、この場合、切出し位置「Conformance_window」は、その中心が基準点ＲＰ´(x,y)と一致するように、以下の数式のように指定される。
　　def_disp_win_left_offset　 = projection_pic_size_horizontal * 3/4
　　def_disp_win_right_offset　= projection_pic_size_horizontal
　　def_disp_win_top_offset　　= projection_pic_size_vertical * 1/3
　　def_disp_win_bottom_offset = projection_pic_size_vertical * 2/3

　上述のフォーマットタイプがクロスキュービック（Cross-cubic）であるプロジェクション画像の場合、「top」、「front」、「bottom」、「right」、「back」、「left」の６つのビューをそれぞれリージョンとして扱うことも可能である。その場合、基準点ＲＰ(x,y)の情報を伝送する代わりに、いずれかのビューをデフォルトリージョンとし、その中心が基準点ＲＰ(x,y)であるとみなして、上述の要領で切出し位置「default_display_window」を指定する。

　また、上述実施の形態においては、本技術を、プロジェクション画像を取り扱う送受信システムに適用した例を示した。本技術は、その他の画像、例えば、ステレオスコピック画像やパノラマビュー画像（マルチビュー画像）を取り扱う送受信システムにも同様に適用することが可能である。

　最初に、ステレオスコピック画像の場合について説明する。図２９（ａ）は、デコーダ出力であるステレオスコピック画像（画像データ）の一例を示している。このステレオスコピック画像はサイドバイサイド方式の画像であるが、これに限定されるものではなく、例えばトップアンドボトム法域の画像であってもよい。また、切出し位置「default_display_window」は、左眼画像に対応して設定されているが、右眼画像に対応して設定されていてもよい。

　図２９（ｂ）は、３Ｄ（3 Dimension）表示受信機において、ステレオスコピック画像の画像データをレンダリングして左眼画像データおよび右眼画像データを生成し、３Ｄ画像の表示を行うことを示している。図２９（ｃ）は、２Ｄ（2 Dimension）表示受信機において、切出し位置「default_display_window」で切出された画像データを拡大して、２Ｄ画像の表示を行うことを示している。この場合、「display_window_activate_flag」が“１”であるときは、２Ｄ表示受信機が部分表示を行う場合に「default_display_window」に応じた切出しを必須とすることを示すことになる。

　次に、パノラマビュー画像の場合について説明する。図３０（ａ）は、デコーダ出力であるパノラマビュー画像（画像データ）の一例を示している。このパノラマビュー画像は水平方向に延びた画像であるが、これに限定されるものではない。切出し位置「default_display_window」は、中央部分の画像に対応して設定されている。

　図３０（ｂ）は、パノラマビュー表示受信機において、パノラマビュー画像の画像データをレンダリングして、パノラマビュー画像上に設定された表示領域の画像を所定数の画像、図示の例では３つのスクリーンにそれぞれ表示するための所定数の画像データを生成し、スクリーン表示することを示している。図３０（ｃ）は、２Ｄ表示受信機において、切出し位置「default_display_window」で切出された画像データを拡大して表示することを示している。この場合、「display_window_activate_flag」が“１”であるときは、２Ｄ表示受信機が部分表示を行う場合に「default_display_window」に応じた切出しを必須とすることを示すことになる。

　また、本技術は、以下のような構成を取ることもできる。
　（１）画像データを符号化して得られたビデオストリームを含むコンテナを受信する受信部と、
　上記ビデオストリームを復号化して画像データを得、該画像データを処理して表示用画像データを得る処理部を備え、
　上記ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されており、
　上記コンテナのレイヤには、表示能力との関連で上記切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報が挿入されており、
　上記処理部は、上記指示情報に基づいて上記切出し位置情報を選択的に使用する
　受信装置。
　（２）上記処理部は、上記指示情報に基づいて上記切出し位置情報による切出しが必須であると判断するとき、上記ビデオストリームを復号化して得られた画像データから上記切出し位置情報で示される位置の画像データを切出して上記表示用画像データを得る
　前記（１）に記載の受信装置。
　（３）上記画像データは、球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られた長方形のプロジェクション画像の画像データである
　前記（１）または（２）に記載の受信装置。
　（４）上記コンテナのレイヤおよび/または上記ビデオストリームのレイヤに、上記プロジェクション画像のレンダリング用メタ情報が挿入されており、
　上記切出し位置情報で示される切出し位置の中心は上記レンダリング用メタ情報で示されるプロジェクション画像の基準点と一致する
　前記（３）に記載の受信装置
　（５）上記プロジェクション画像は、上記基準点を中心位置とするデフォルトリージョンを含む複数のリージョンからなり、
　上記切出し位置情報で示される位置は、上記デフォルトリージョンの位置と一致する
　前記（４）に記載の受信装置。
　（６）上記レンダリング用メタ情報は、上記プロジェクション画像の基準点の位置情報を持つ
　前記（４）または（５）に記載の受信装置。
　（７）上記レンダリング用メタ情報は、上記切出し位置情報で示される切出し位置の中心は上記レンダリング用メタ情報で示されるプロジェクション画像の基準点と一致することを示す後方互換性情報を持つ
　前記（４）から（６）のいずれかに記載の受信装置。
　（８）上記コンテナのレイヤに、上記ビデオストリームに対応付けて、上記指示情報が記述されたデスクリプタが挿入されている
　前記（１）から（７）のいずれかに記載の受信装置。
　（９）上記コンテナは、ＩＳＯＢＭＦＦであり、
　上記デスクリプタは、ｍｏｏｖボックスに挿入されている
　前記（８）に記載の受信装置。
　（１０）上記コンテナは、ＭＰＥＧ２－ＴＳであり、
　上記デスクリプタは、プログラム・マップ・テーブルに挿入されている
　前記（８）に記載の受信装置。
　（１１）上記コンテナは、ＭＭＴストリームであり、
　上記デスクリプタは、ＭＭＴ・パッケージ・テーブルに挿入されている
　前記（８）に記載の受信装置。
　（１２）受信部が、画像データを符号化して得られたビデオストリームを含むコンテナを受信する受信ステップと、
　処理部が、上記ビデオストリームを復号化して画像データを得、該画像データを処理して表示用画像データを得る処理ステップを有し、
　上記ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されており、
　上記コンテナのレイヤには、表示能力との関連で上記切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報が挿入されており、
　上記処理ステップでは、上記指示情報に基づいて上記切出し位置情報を選択的に使用する
　受信方法。
　（１３）上記処理ステップでは、上記指示情報に基づいて上記切出し位置情報による切出しが必須であると判断するとき、上記ビデオストリームを復号化して得られた画像データから上記切出し位置情報で示される位置の画像データを切出して上記表示用画像データを得る
　前記（１２）に記載の受信方法。
　（１４）上記画像データは、球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られた長方形のプロジェクション画像の画像データである
　前記（１２）または（１３）に記載の受信方法。
　（１５）上記コンテナのレイヤおよび/または上記ビデオストリームのレイヤに、上記プロジェクション画像のレンダリング用メタ情報が挿入されており、
　上記切出し位置情報で示される切出し位置の中心は上記レンダリング用メタ情報で示されるプロジェクション画像の基準点と一致する
　前記（１４）に記載の受信方法
　（１６）上記プロジェクション画像は、上記基準点を中心位置とするデフォルトリージョンを含む複数のリージョンからなり、
　上記切出し位置情報で示される位置は、上記デフォルトリージョンの位置と一致する
　前記（１５）に記載の受信方法。
　（１７）上記レンダリング用メタ情報は、上記プロジェクション画像の基準点の位置情報を持つ
　前記（１５）または（１６）に記載の受信方法。
　（１８）上記レンダリング用メタ情報は、上記切出し位置情報で示される切出し位置の中心は上記レンダリング用メタ情報で示されるプロジェクション画像の基準点と一致することを示す後方互換性情報を持つ
　前記（１５）から（１７）のいずれかに記載の受信方法。
　（１９）上記コンテナのレイヤに、上記ビデオストリームに対応付けて、上記指示情報が記述されたデスクリプタが挿入されている
　前記（１２）から（１８）のいずれかに記載の受信方法。
　（２０）上記コンテナは、ＩＳＯＢＭＦＦであり、
　上記デスクリプタは、ｍｏｏｖボックスに挿入されている
　前記（１９）に記載の受信方法。
　（２１）上記コンテナは、ＭＰＥＧ２－ＴＳであり、
　上記デスクリプタは、プログラム・マップ・テーブルに挿入されている
　前記（１９）に記載の受信方法。
　（２２）上記コンテナは、ＭＭＴストリームであり、
　上記デスクリプタは、ＭＭＴ・パッケージ・テーブルに挿入されている
　前記（１９）に記載の受信方法。
　（２３）画像データを符号化して得られたビデオストリームを含むコンテナを生成するコンテナ生成部を備え、
　上記ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されており、
　上記コンテナのレイヤに、受信側の表示能力との関連で上記切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報を挿入する情報挿入部と、
　上記指示情報が挿入された上記コンテナを送信する送信部をさらに備える
　送信装置。
　（２４）画像データを符号化して得られたビデオストリームを含むコンテナを生成して送信し、
　上記ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入され、
　上記コンテナのレイヤには、受信側の表示能力との関連で上記切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報が挿入される
　送信方法。

　本技術の主な特徴は、コンテナに含まれるビデオストリームを復号化して得られた画像データから表示用画像データを得る際に、コンテナのレイヤに挿入されている指示情報に基づいて、ビデオストリームのレイヤに挿入されている切出し位置情報を選択的に使用することで、受信画像データに対応した表示能力を持たない受信機においても適切な表示用画像データを容易に取得可能としたことである（図４、図１９、図２０参照）。

　１０・・・送受信システム
　１００・・・サービス送信システム
　１０１・・・制御部
　１０１ａ・・・ユーザ操作部
　１０２・・・カメラ
　１０３・・・平面パッキング部
　１０４・・・ビデオエンコーダ
　１０５・・・コンテナエンコーダ
　１０６・・・送信部
　２００，２００Ａ，２００Ｂ・・・サービス受信機
　２０１，２３１・・・制御部
　２０１ａ，２３１ａ・・・ユーザ操作部
　２０２，２３２・・・受信部
　２０３，２３３・・・コンテナデコーダ
　２０４，２３４・・・ビデオデコーダ
　２０５・・・レンダラ
　２０６，２３５・・・パーシャルピクチャ部
　２０７・・・切り替えスイッチ
　２０８，２３６・・・スケーリング部
　２０９，２３７・・・表示部

Claims

　画像データを符号化して得られたビデオストリームを含むコンテナを受信する受信部と、
　上記ビデオストリームを復号化して画像データを得、該画像データを処理して表示用画像データを得る処理部を備え、
　上記ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されており、
　上記コンテナのレイヤには、表示能力との関連で上記切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報が挿入されており、
　上記処理部は、上記指示情報に基づいて上記切出し位置情報を選択的に使用する
　受信装置。
　上記処理部は、上記指示情報に基づいて上記切出し位置情報による切出しが必須であると判断するとき、上記ビデオストリームを復号化して得られた画像データから上記切出し位置情報で示される位置の画像データを切出して上記表示用画像データを得る
　請求項１に記載の受信装置。
　上記画像データは、球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られた長方形のプロジェクション画像の画像データである
　請求項１に記載の受信装置。
　上記コンテナのレイヤおよび/または上記ビデオストリームのレイヤに、上記プロジェクション画像のレンダリング用メタ情報が挿入されており、
　上記切出し位置情報で示される切出し位置の中心は上記レンダリング用メタ情報で示されるプロジェクション画像の基準点と一致する
　請求項３に記載の受信装置
　上記プロジェクション画像は、上記基準点を中心位置とするデフォルトリージョンを含む複数のリージョンからなり、
　上記切出し位置情報で示される位置は、上記デフォルトリージョンの位置と一致する
　請求項４に記載の受信装置。
　上記レンダリング用メタ情報は、上記プロジェクション画像の基準点の位置情報を持つ
　請求項４に記載の受信装置。
　上記レンダリング用メタ情報は、上記切出し位置情報で示される切出し位置の中心は上記レンダリング用メタ情報で示されるプロジェクション画像の基準点と一致することを示す後方互換性情報を持つ
　請求項４に記載の受信装置。
　上記コンテナのレイヤに、上記ビデオストリームに対応付けて、上記指示情報が記述されたデスクリプタが挿入されている
　請求項１に記載の受信装置。
　上記コンテナは、ＩＳＯＢＭＦＦであり、
　上記デスクリプタは、ｍｏｏｖボックスに挿入されている
　請求項８に記載の受信装置。
　上記コンテナは、ＭＰＥＧ２－ＴＳであり、
　上記デスクリプタは、プログラム・マップ・テーブルに挿入されている
　請求項８に記載の受信装置。
　上記コンテナは、ＭＭＴストリームであり、
　上記デスクリプタは、ＭＭＴ・パッケージ・テーブルに挿入されている
　請求項８に記載の受信装置。
　受信部が、画像データを符号化して得られたビデオストリームを含むコンテナを受信する受信ステップと、
　処理部が、上記ビデオストリームを復号化して画像データを得、該画像データを処理して表示用画像データを得る処理ステップを有し、
　上記ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されており、
　上記コンテナのレイヤには、表示能力との関連で上記切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報が挿入されており、
　上記処理ステップでは、上記指示情報に基づいて上記切出し位置情報を選択的に使用する
　受信方法。
　上記処理ステップでは、上記指示情報に基づいて上記切出し位置情報による切出しが必須であると判断するとき、上記ビデオストリームを復号化して得られた画像データから上記切出し位置情報で示される位置の画像データを切出して上記表示用画像データを得る
　請求項１２に記載の受信方法。
　上記画像データは、球面キャプチャ画像の一部または全部を切り取って平面パッキングして得られた長方形のプロジェクション画像の画像データである
　請求項１２に記載の受信方法。
　上記コンテナのレイヤおよび/または上記ビデオストリームのレイヤに、上記プロジェクション画像のレンダリング用メタ情報が挿入されており、
　上記切出し位置情報で示される切出し位置の中心は上記レンダリング用メタ情報で示されるプロジェクション画像の基準点と一致する
　請求項１４に記載の受信方法
　上記プロジェクション画像は、上記基準点を中心位置とするデフォルトリージョンを含む複数のリージョンからなり、
　上記切出し位置情報で示される位置は、上記デフォルトリージョンの位置と一致する
　請求項１５に記載の受信方法。
　上記レンダリング用メタ情報は、上記プロジェクション画像の基準点の位置情報を持つ
　請求項１５に記載の受信方法。
　上記レンダリング用メタ情報は、上記切出し位置情報で示される切出し位置の中心は上記レンダリング用メタ情報で示されるプロジェクション画像の基準点と一致することを示す後方互換性情報を持つ
　請求項１５に記載の受信方法。
　上記コンテナのレイヤに、上記ビデオストリームに対応付けて、上記指示情報が記述されたデスクリプタが挿入されている
　請求項１２に記載の受信方法。
　上記コンテナは、ＩＳＯＢＭＦＦであり、
　上記デスクリプタは、ｍｏｏｖボックスに挿入されている
　請求項１９に記載の受信方法。
　上記コンテナは、ＭＰＥＧ２－ＴＳであり、
　上記デスクリプタは、プログラム・マップ・テーブルに挿入されている
　請求項１９に記載の受信方法。
　上記コンテナは、ＭＭＴストリームであり、
　上記デスクリプタは、ＭＭＴ・パッケージ・テーブルに挿入されている
　請求項１９に記載の受信方法。
　画像データを符号化して得られたビデオストリームを含むコンテナを生成するコンテナ生成部を備え、
　上記ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入されており、
　上記コンテナのレイヤに、受信側の表示能力との関連で上記切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報を挿入する情報挿入部と、
　上記指示情報が挿入された上記コンテナを送信する送信部をさらに備える
　送信装置。
　画像データを符号化して得られたビデオストリームを含むコンテナを生成して送信し、
　上記ビデオストリームのレイヤには、画像データの切出し位置を示す切出し位置情報が挿入され、
　上記コンテナのレイヤには、受信側の表示能力との関連で上記切出し位置情報による画像データの切出しを必須とするか否かを示す指示情報が挿入される
　送信方法。