以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(MPDの拡張)
2.第2の実施の形態(配信システム)
3.第3の実施の形態(MPD拡張の具体例)
4.第4の実施の形態(MPD拡張の他の例)
5.第5の実施の形態(MP4ファイルとMPD拡張の他の例)
6.第6の実施の形態(コンピュータ)
7.第7の実施の形態(多視点画像符号化装置、多視点画像復号装置)
8.第8の実施の形態(階層画像符号化装置、階層画像復号装置)
9.第9の実施の形態(応用例)
10.第10の実施の形態(セット・ユニット・モジュール・プロセッサ)
<1.第1の実施の形態>
<DASH>
従来、HTTP(HyperText Transfer Protocol)を利用したコンテンツ配信技術として、例えば非特許文献1に記載のように、MPEG-DASH(Moving Picture Experts Group - Dynamic Adaptive Streaming over HTTP)がある。MPEG-DASHでは、同一コンテンツが異なるビットレートで表現された複数の符号化データをコンテンツサーバに格納し、クライアントが、ネットワーク帯域に応じて複数の符号化データのいずれかの符号化データを選択しながら再生するABS(Adaptive Bitrate Streaming)技術が採用されている。
DASHによるコンテンツの伝送の手順を、図1を参照して説明する。まず、コンテンツを取得する側の動画再生端末において、ストリーミング・データの制御用ソフトウエアが、所望のコンテンツのMPD(Media Presentation Description)ファイルを選択し、Webサーバから取得する。MPDは、配信する動画や音声等のコンテンツを管理するメタデータである。
MPDを取得すると、動画再生端末のストリーミング・データの制御用ソフトウエアは、そのMPDを解析し、所望のコンテンツの、通信回線の品質や動画再生端末の性能等に合ったデータ(DASHセグメント)をWebサーバから取得するように制御する。HTTPアクセス用のクライアント・ソフトウエアは、その制御に従って、そのDASHセグメントを、HTTPを用いてWebサーバから取得する。このように取得されたコンテンツを、動画再生ソフトウエアが再生する。
MPDは、例えば図2に示されるような構成を有する。MPDの解析(パース)においては、クライアントは、MPD(図2のMedia Presentation)のピリオド(Period)に含まれるリプレゼンテーション(Representation)の属性から最適なものを選択する。
クライアントは、選択したリプレゼンテーション(Representation)の先頭のセグメント(Segment)を読んでイニシャライズセグメント(Initialization Segment)を取得し、処理する。続いて、クライアントは、後続のセグメント(Segment)を取得し、再生する。
なお、MPDにおける、ピリオド(Period)、リプレゼンテーション(Representation)、およびセグメント(Segment)の関係は、図3のようになる。つまり、1つのメディアコンテンツは、時間方向のデータ単位であるピリオド(Period)毎に管理することができ、各ピリオド(Period)は、時間方向のデータ単位であるセグメント(Segment)毎に管理することができる。また、各ピリオド(Period)について、ビットレート等の属性の異なる複数のリプレゼンテーション(Representation)を構成することができる。
したがって、このMPDのファイル(MPDファイルとも称する)は、ピリオド(Period)以下において、図4に示されるような階層構造を有する。また、このMPDの構造を時間軸上に並べると図5の例のようになる。図5の例から明らかなように、同一のセグメント(Segment)に対して複数のリプレゼンテーション(Representation)が存在している。クライアントは、これらのうちのいずれかを適応的に選択することにより、通信環境や自己のデコード能力などに応じて適切なストリームデータを取得し、再生することができる。
<タイル構造>
このような従来のDASHでは、全体画像のデータの配信が適応的に制御されていたが、全体画像の代わりにその一部である部分画像を適応的に選択して配信することが考えられた。例えば、全体画像の内、画像データを受け取る端末側によって選択された部分の部分画像を配信したり、端末の性能(例えばCPU等の処理能力やディスプレイの大きさ等)や伝送経路やサーバの負荷状況等に応じて、配信する部分画像の大きさを制御したりすることが考えられた。
このような部分画像の適応的な配信を行うために、タイル(Tile)という概念が用いられた。タイル(Tile)は、予め定められたレイアウト(大きさ、形状、数等)で全体画像を分割した部分領域である。以下において、1タイルの画像をタイル画像と称する。このように全体画像を予めタイル化しておくことにより、配信するタイル画像を選択するだけで、容易に部分画像の適応的な配信が可能となる。この場合、部分画像は、単数若しくは複数のタイル画像により構成される。
DASHのようにHTTPを用いて配信する場合、画像データは、符号化され、そのビットストリームがファイル化されて配信される(ファイルとして公開される)。上述したようなタイル構造を有する全体画像の場合、画像データは、タイル画像毎に独立して符号化される。その際、図6のAに示される例のように、各タイルの符号化データをそれぞれ1つのビットストリームとしてもよい。
図6のAの例では、640x480サイズの全体画像、1980x1080サイズの全体画像、その全体画像が縦方向および横方向のそれぞれに2分割された960x540サイズのタイル画像(4枚の部分画像)のそれぞれが、配信用の画像として用意されている。640x480サイズの全体画像のデータは、符号化されて1本のビットストリーム(bitstream1)とされ、1980x1080サイズの全体画像のデータも、符号化されて1本のビットストリーム(bitstream2)とされている。そして、それらとは別に、960x540サイズの各タイル画像のデータは、互いに独立して符号化され、それぞれ、1本のビットストリーム(bitstream3乃至bitstream6)とされている。
各ビットストリームにおいては、ビデオパラメータセット(VPS(Video Parameter Set))、シーケンスパラメータセット(SPS(Sequence Parameter Set))、SEI(Supplemental Enhancement Information)、ピクチャパラメータセット(PPS(Picture Parameter Set))等のヘッダ情報が付加され、画像データのビットストリームがスライス(Slice)毎に並べられている。
このような構造とすることにより、配信するビットストリームを、bitstream3乃至bitstream6の中から選択することによって、配信するタイル画像を選択することができる。また、図6のAの例の場合、各タイル画像を、全体画像と同様に配信することができる。
ところで、例えばHEVC(High Efficiency Video Coding)等の符号化方式では、全体画像を分割するタイル(Tile)と称される構造をサポートしており、そのタイル毎に独立して符号化を行うことができる。例えば、その一部のタイルの画像のみを得るように復号することができる。つまり、全体画像の一部である部分画像のみを得るように復号することができる。
このような符号化方式の機能を利用して、図6のBに示される例のように、複数のタイル画像の符号化データを、1本のビットストリーム(bitstream7)とすることもできる。つまり、この場合、上述した配信の為のタイル(Tile)を符号化方式がサポートするタイル(Tile)として取り扱い符号化するようにしている。この場合、ビットストリームにおいて、各タイルのデータはスライス(Slice)として並べられている。
<MP4ファイル>
上述したように、配信用のビットストリームは、例えばMP4ファイルフォーマット等によってファイル化される。その場合、図7に示される例のように、各タイルのビットストリームを別ファイルとすることができる。各タイルのビットストリームはトラック(Track)という単位で管理される。また、各タイルのヘッダ(Header)情報と、各トラックへの参照が記述されたベーストラック(Base Track)が設けられ、各タイルのビットストリームとは別のファイルとしてファイル化される。全てのタイルを復号する場合は、ベーストラックを再生し、各タイルを復号する場合、ヘッダ情報はベーストラックが参照される。
また、図8に示される例のように、各タイルのビットストリームをまとめて1つのファイルとすることもできる。その際、図8のAのように、各タイルのデータをまとめて1つのトラックで管理することもできるし、図8のBのように、各タイルを互いに異なるトラックとして管理することもできる。その場合、図7の場合と同様に、各タイルのヘッダ(Header)情報と、各トラックへの参照が記述されたベーストラック(Base Track)が設けられる。
<分割方法>
タイル(Tile)は、図9のAの例のように全体画像を均等に分割するものであってもよいし、図9のBの例のように全体画像を不均等に分割するものであってもよい。つまり、全体画像を構成する各タイル画像の画像サイズは互いに同一であってもよいし、異なっていてもよい。
<アプリケーション>
このようなタイル(Tile)構造を利用するアプリケーションとして、例えば、表示させる部分画像のサイズを制御するアプリケーションが考えられる。
図9のAに示される全体画像10はタイル化され、互いに同じ大きさの複数のタイル画像11に分割することができるとする。例えば、この画像をディスプレイのサイズが小さいモバイルデバイス21に表示させる場合、アプリケーションは、2x2の4枚のタイル画像からなる部分画像12を表示させる。また、例えば、この画像をディスプレイのサイズが大きなテレビジョン信号受像機(TV)22に表示させる場合、アプリケーションは、6x5の30枚のタイル画像からなる部分画像13を表示させる。このように、画像を表示する端末の性能等に応じて表示させる部分画像の画サイズを制御するアプリケーションが考えられる。
また、図9のBの例の場合、各タイル画像の画サイズは不均等である。アプリケーションは、タイル3(Tile3)の画像を表示させることにより、HD解像度の画像を表示させることができ、タイル2(Tile2)乃至タイル4(Tile4)の画像を表示させることにより、シネマ(Cinema)解像度の画像を表示させることができ、タイル1(Tile1)乃至タイル5(Tile5)の画像を表示させることにより、さらに大きな拡張サイズ(EXT)の画像を表示させることができる。このように、表示させる部分画像の画サイズを制御することにより、表示画像の解像度やアスペクト比を制御するアプリケーションが考えられる。
これらのようなアプリケーションに対して、表示させる部分画像の画サイズに応じて、上述したように配信する部分画像のサイズを適応的に制御する(配信するタイル画像の数を制御する)ことにより、表示されない不要な部分の画像を配信する必要がないので、サーバ、端末、伝送路等の負荷を適応的に制御することができ、不要な負荷の増大を抑制することができる。
<タイル画像の適応的な提供>
しかしながら、従来のMPEG-DASH規格では、ビットレート(Bitrate)を切り替えるという概念しかなく、上述したようなタイル構造を利用し、任意の部分画像を選択してそのデータを提供するといった、適応的な部分画像のデータの提供を行うことができなかった。
そこで、全体画像の一部である部分画像に関する情報である部分画像情報をMPDの拡張データとして生成し、生成されたその部分画像情報を用いて、全体画像のビットストリームの提供および部分画像のビットストリームの提供に利用されるメタデータ、すなわち、部分画像情報を含むことができるように拡張された拡張MPDを生成するようにする。
なお、提供の対象となる部分画像は、全体画像の一部分であればどのようなものであってもよく、その形状や大きさ等は任意である。例えば、部分画像は、他の部分と独立して符号化することができる部分であればよい。しかしながら、以下においては、説明の便宜上、部分画像は、上述したタイル単位の画像であるものとする。つまり、部分画像は、1つまたは複数のタイル画像により構成されるものとする。
MPDは、階層構造を有し、アダプテーションセット(AdaptationSet)、リプレゼンテーション(Representation)、サブリプレゼンテーション(Sub-Representation)、サブセグメント(Sub-Segment)等の階層を有することができる。このような階層のいずれを拡張するようにしてもよい。
例えば、MPDのディスクリプタタイプエレメント(DescriptorType element)を活用して、タイル(Tile)用のディスクリプション(description)を定義する。例えば、ビューポイント(Viewpoint)というタイル用のディスクリプションを、図10のAのように定義する。
ビューポイントは、アダプテーションセット(AdaptationSet)に存在するエレメントである。ビューポイントは、当該ビューが何であるかを定義するディスクリプションである。例えば、ステレオ画像の右(R)画像であるか、左(L)画像であるか等を定義する。
つまり、アダプテーションセットを拡張する場合、既存のエレメントを利用(拡張)することになる。既存のエレメントを利用することにより、従来のMPDとの親和性の低減を抑制することができる(従来のデコーダが解析できないディスクリプションの増大を抑制することができる)。これに対して、リプレゼンテーション(Representation)やサブリプレゼンテーション(Sub-Representation)を拡張する場合、新たにエレメントを定義することになる。
また、上述したビューポイントのエレメントにおいて、部分画像情報を格納する為のスキーマ(schemeIdUri)が定義される。図10のAの例の場合、タイル用のスキーマとして(urn:mpeg:DASH:tile:2013)が定義されている。このようなスキーマの拡張は、アダプテーションセット、リプレゼンテーション、サブリプレゼンテーションのいずれを拡張する場合も行われる。
さらに、この新たなタイル用のスキーマ(urn:mpeg:DASH:tile:2013)のバリュー(value)が定義される。このバリューには、上述した部分画像情報が定義される。例えば、このエレメントが示す画像がどのような画像であるかを示すビュータイプ((1)viewtype)と、全体画像のサイズに関する情報((2)全体画像のwidthとheight)と、全体画像における部分画像の位置を示す情報((3)エレメントが示す画像のx座標とy座標)と、部分画像が属する、1画像として表示可能な部分画像のグループを識別するグループ識別情報((4)TilegroupID)とが、バリューとして定義される。
ビュータイプ(viewtype)は、図10のBに示されるように、当該画像がタイル画像であるか否か等を示す情報である。例えば、当該画像が全体画像の場合の値を「0」とし、当該画像がタイル画像であり、かつ、図6のAの例のように、ビットストリームがタイル毎に分けられている場合の値を「1」とし、当該画像がタイル画像であり、かつ、図6のBの例のように、全てのタイルのデータが1つのビットストリームにまとめられている場合の値を「2」とする。これらの値やその値が示す状態(値の定義)は、予め定められている。もちろん、この値の定義の仕方は任意であり、この例以外であってもよい。この値を参照することにより、他のエレメントを参照する必要があるか否か(つまり、他のタイルが存在するか否か)を容易に把握することができる。特に、当該画像が全体画像の場合、この値を参照するだけで、他のエレメントを参照する必要がないことを容易に把握することができる。
全体画像のサイズに関する情報(全体画像のwidthとheight)は、図10のBに示されるように、当該画像(タイル画像)と同じグループに属するタイル画像が全て統合された画像のサイズ(横幅(width)と高さ(height))を示す情報である。従来のMPDの場合、各ビットストリームの画像のサイズが表示画像のサイズと同じであることが前提となっている。上述したように部分画像の提供を行う場合、ビットストリームの画像のサイズが表示画像のサイズと異なる場合がある。例えば、互いに異なるビットストリームの複数のタイル画像が統合されて表示される場合、表示画像のサイズがビットストリームの画像のサイズより大きくなることがあり得る。そのようなケースに対応することができるように、当該画像(タイル画像)と同じグループに属するタイル画像が全て統合された画像のサイズが示される。つまり、この値を参照することにより、当該画像(タイル画像)と同じグループに属するタイル画像を全て復号する場合の最大処理負荷を容易に把握することができる。図10のBの例の場合、全体画像のサイズに関する情報として、960x540サイズのタイル画像が4枚(2x2)統合された画像のサイズ(1920x1080)が示される。
全体画像における部分画像の位置を示す情報(エレメントが示す画像のx座標とy座標)は、図10のBに示されるように、当該画像が、当該画像(タイル画像)と同じグループに属するタイル画像が全て統合された画像の何処に位置するかを示す情報である。位置をどのように表すか(どのような値で示すか)は、任意である。例えば、当該画像の左上の座標で表すようにしてもよい。例えばタイルの識別情報や左上以外の場所の座標等、その他の情報で表すようにしてもよい。この値を参照することにより、当該画像(タイル画像)を統合(合成)する際の、当該画像の位置を容易に把握することができる。つまり、統合(合成)する各タイル画像の、この値を参照することにより、各タイル画像をどのように並べて統合する(合成する)かを容易に把握することができる。
グループ識別情報(TilegroupID)は、図10のBに示されるように、当該画像が属するタイル画像のグループを示す識別情報である。同一のグループのタイル画像には、同一の値が割り当てられる。逆に、グループ毎に異なる値が割り当てられる。図10のBの例の場合、タイル1(Tile1)乃至タイル4(Tile4)の各タイル画像は統合することができるので、それらには、グループ識別情報として互いに同じ値が割り当てられる。この値を参照することにより、どのタイル画像同士が統合可能(合成可能)であるかを容易に把握することができる。換言するに、表示の際に当該画像と統合(合成)すべき他のタイル画像を容易に識別することができる。
なお、グループ識別情報(TilegroupID)は、ビューポイントのバリューとしてではなく、例えば以下のように、他のエレメントのアトリビュート(attribute)として定義するようにしてもよい。
<AdaptationSet mimeType="video/mp4" group="1">
アダプテーションセットには、グループ(group)というアトリビュートが既に存在する。上記の例では、このグループに、タイル(Tile)の集合(Tilegroup)としての意味が割り当てられている。
<Representation mimeType="video/mp4" group="1">
これに対して、リプレゼンテーションやサブリプレゼンテーションには、グループ(group)というアトリビュートは存在しない。つまり、リプレゼンテーションやサブリプレゼンテーションを拡張する場合、(group)という新たなアトリビュートが設定されることになる。
また、以上のような拡張方法は、図7や図8の例のように、ビットストリームをファイル化(特にMP4ファイル化)する場合にも適用することができる。その場合、ベーストラック(Base Track)には、その他のトラックに割り当てられたビットストリームのヘッダ情報等が割り当てられるので当該セグメントの位置情報は不要である。そのため、ベーストラックに対応するディスクリプション(ビューポイント)では、当該画像の位置に関する情報として実際の座標でない値を定義するようにしてもよい。例えば、NULL、空、スペース(space)等を設定するようにしてもよい。また、例えば、座標としては大き過ぎる値やマイナス値等を設定するようにしてもよい。また、ベーストラックであることを示す識別情報(フラグ等)を別途設けるようにしてももちろんよい。
また、従来のMPDの場合、リプレゼンテーション(Representation)の下に必ずセグメント(Segment)が存在しなければならなかった。つまり、MP4ファイルのURLは、リプレゼンテーション直下のセグメントに記述される。サブリプレゼンテーション(Sub-Representation)は、例えばトリックプレイや音楽のみの再生等に利用される情報であり、リプレゼンテーション直下のセグメントのMP4ファイルの中の一部のデータを指定する。
このようなMPDを、部分画像情報を含むことができるように拡張する際に、サブリプレゼンテーション(Sub-Representation)の下にセグメントが存在するように拡張するようにしてもよい。つまり、サブリプレゼンテーションにタイル画像を割り当て、MP4ファイルのURLを参照することができるようにしてもよい。
より具体的には、サブリプレゼンテーションに、ベースURL(<BaseURL>)、セグメントベース(<SegmentBase>)、セグメントリスト(<SegmentList>)、およびセグメントテンプレート(<SegmentTemplate>)等のタグを追加定義する。
ただし、その場合、サブリプレゼンテーション(Sub-Representation)の下にビットストリームの情報が存在することを示すセグメント情報を、部分画像情報として生成し、そのセグメント情報をMPDに格納する必要がある。例えば、このセグメント情報として、サブリプレゼンテーションの下にビットストリームの情報が存在するか否かを示すフラグ(@SegmentInSubRepresentation:true or false)が定義される。
このようにすることにより、リプレゼンテーションが複数のタイル画像のサブリプレゼンテーションによって構成されるようにすることができる。このような構造にすることにより、従来のリプレゼンテーションとの切り分けが可能になる。
また、従来のMPDの場合、セグメント(Segment)は、時間を表す概念となっており、同時刻のセグメントが1つのリプレゼンテーション(Representation)に存在することが許されていない。
このようなMPDを、部分画像情報を含むことができるように拡張する際に、セグメントにタイル画像を割り当てるようにし、1つのリプレゼンテーションに複数の同時刻のセグメントが存在することができるように拡張するようにしてもよい。
ただし、その場合、リプレゼンテーションの下に、同時刻のタイル画像が割り当てられた複数のセグメントが存在することを示すマルチセグメント情報を、部分画像情報として生成し、そのマルチセグメント情報をMPDに格納する必要がある。例えば、このマルチセグメント情報として、リプレゼンテーションの下に同時刻のビットストリームの情報が複数存在するか否かを示すフラグ(@multiSegmentInRepresentation:true or false)が定義される。
このようにすることにより、従来のセグメントとの切り分けが可能になる。
また、従来アクセスユニット(AU)単位でしか指定することができなかったものを、タイル単位のデータを指定することができるように拡張されたssixボックスを割り当てるサブセグメント(Sub-Segment)を、単数若しくは複数のタイル画像のビットストリームを格納するMP4ファイルが割り当てられるセグメントの下に定義するようにしてもよい。つまり、MP4ファイルが割り当てられるセグメントの下に、そのMP4ファイルから自身に対応するタイルを指定するssixを含むサブセグメントが1つまたは複数存在するようにしてもよい。
このようにすることにより、サブセグメントにおいてサンプル(Sample)よりも小さい単位を表すことができる。
なお、そのためには、そのことを暗示させるために、セグメント情報を偽(@SegmentInSubRepresentation = false)とし、かつ、ビューポイント(Viewpoint)をセグメントに定義する必要がある。つまり、これらの2つの情報から、サブセグメントによってタイル画像を表していること(MP4ファイルが拡張されていること)を把握することができる。
なお、専用のフラグ情報を別途定義し、サブセグメントによってタイル画像を表していること(MP4ファイルが拡張されていること)を明示するようにしてもよい。
部分画像情報は、上述した例に限らず、任意である。例えば、バリューに、上述した例に示される情報(ビュータイプ((1)viewtype)、全体画像のサイズに関する情報((2)全体画像のwidthとheight)、全体画像における部分画像の位置を示す情報((3)エレメントが示す画像のx座標とy座標)、部分画像が属する、1画像として表示可能な部分画像のグループを識別するグループ識別情報((4)TilegroupID))以外の情報を定義するようにしてもよい。また、上述した以外のフラグ情報を部分情報として定義するようにしてもよい。
以上のように部分画像情報を生成し、その部分画像情報を用いてMPD(メタデータ)を拡張することにより、そのメタデータを用いて、部分画像のデータの適応的な提供を実現することができる。
<2.第2の実施の形態>
<配信システム>
次に、以上のような本技術を実現する装置とその方法について説明する。図11は、本技術を適用したシステムの一態様である、配信システムを示す図である。図11に示される配信システム100は、全体画像の一部である部分画像のデータを適応的に配信することができるシステムである。
図11に示されるように配信システム100は、配信データ生成装置101、配信サーバ102、および端末装置103を有する。
配信データ生成装置101は、配信サーバ102が配信する、例えば画像や音声等のコンテンツのファイル(コンテンツファイル)とそのMPDファイルを生成し、それを配信サーバ102に供給する。配信サーバ102は、配信データ生成装置101から供給されたコンテンツファイルとそのMPDファイルを、ネットワーク104に向けて公開し、部分画像の適応的な配信を行う。
端末装置103は、ネットワーク104を介して配信サーバ102にアクセスし、配信サーバ102が公開する所望のコンテンツのMPDファイルを取得する。
端末装置103は、そのMPDファイルに従って、ネットワーク104を介して配信サーバ102にアクセスし、MPDファイルに対応する適切なコンテンツファイルを適応的に選択し、それをHTTPプロトコルにより取得する。端末装置103は、取得したコンテンツファイルを再生する。
<配信データ生成装置>
図12は、配信データ生成装置101の主な構成例を示すブロック図である。図12に示されるように、配信データ生成装置101は、画面分割処理部121、画像符号化部122、ファイル生成部123、タイル型画像情報生成部124、MPD生成部125、およびサーバアップロード処理部126を有する。
画面分割処理部121は、外部より供給された画像データの全体画像をタイル毎に分割するように画像データを編集(加工)し、タイル画像の画像データを生成する。画面分割処理部121は、このように生成した各タイルの画像データを画像符号化部122に供給する。また、画面分割処理部121は、例えば各タイルの大きさや位置等のタイル構造に関する情報をタイル型画像情報生成部124に供給する。
画像符号化部122は、画面分割処理部121から供給されるタイル毎の画像データを符号化し、ビットストリームを生成する。図12に示されるように、画像符号化部122は、符号化処理部131、符号化処理部132、符号化処理部133、・・・のように、複数の符号化処理部を有しており、供給される各タイルの画像データを並行して符号化することができる。図6等を参照して説明したように画像符号化部122は、1つの画像データから任意の数のビットストリームを生成することができる。また、画像符号化部122は、複数の画像データを1つのビットストリームにまとめることもできる。例えば、画像符号化部122は、タイル画像毎にビットストリームを生成することもできるし、複数のタイル画像を1つのビットストリームにまとめることもできる。画像符号化部122は、生成したビットストリームをファイル生成部123に供給する。
なお、画像符号化部122の符号化方法は任意である。各符号化処理部が同一の方法で符号化するようにしてもよいし、互いに異なる方法で符号化するようにしてもよい。
ファイル生成部123は、供給されたビットストリームを、例えばMP4ファイルフォーマット等の所定のフォーマットでファイル化し、コンテンツファイルを生成する。図7や図8等を参照して説明したように、ファイル生成部123は、1つのビットストリームを任意の数のファイルにファイル化することができる。また、ファイル生成部123は、複数のビットストリームを1つのファイルにまとめることもできる。ファイル生成部123は、生成したコンテンツファイルをMPD生成部125に供給する。また、ファイル生成部123は、各ビットストリームをどのようにファイル化したか等の、ファイル化に関する情報をタイル型画像情報生成部124に供給する。
なお、ファイル生成部123は、任意のフォーマットでファイル化を行うことができる。
タイル型画像情報生成部124は、画面分割処理部121から供給されるタイル構造に関する情報や、ファイル生成部123から供給されるファイル化に関する情報等に基づいて、MPDをタイル構造に対応させるためのタイル型画像情報(すなわち部分画像情報)を生成する。タイル型画像情報(部分画像情報)は、第1の実施の形態において説明した内容を含む情報であり、例えば、ビューポイントのバリューや、フラグ情報等として生成される。タイル型画像情報生成部124は、生成したタイル型画像情報をMPD生成部125に供給する。
MPD生成部125は、ファイル生成部123から供給されるコンテンツファイルについてのMPDを生成し、そのMPDを、タイル型画像情報生成部124から供給されるタイル型画像情報(部分画像情報)を用いて拡張し、タイル構造に対応したタイル型MPDを生成する。MPD生成部125は、生成したタイル型MPDのファイル(MPDファイル)とコンテンツファイルとをサーバアップロード処理部126に供給する。
サーバアップロード処理部126は、供給されたMPDファイルやコンテンツファイルを配信サーバ102(図11)にアップロードし、公開させる。
配信データ生成装置101が以上のようにタイル構造に対応したタイル型MPDを生成することにより、配信サーバ102は、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)することができる。つまり、配信システム100は、部分画像のデータの適応的な提供を実現することができる。
以上に説明した各処理部は、独立した装置として構成するようにしてもよい。特に、タイル型画像情報生成部124やMPD生成部125は、それぞれ、独立した装置として構成するようにしてもよい。つまり、コンテンツファイルの生成に関する構成は必須ではなく、タイル型画像情報(部分画像情報)の生成だけを行うようにしてもよい。例えば、他の装置から供給される情報に基づいてタイル型画像情報(部分画像情報)を生成するようにしてもよい。また、例えば、生成したタイル型画像情報(部分画像情報)を他の装置に供給するようにしてもよい。
また、タイル型MPDの生成だけを行うようにしてもよい。例えば、他の装置から供給されるタイル型画像情報(部分画像情報)を用いて、他の装置において生成されるコンテンツファイルに対応するタイル型MPDを生成するようにしてもよい。また、生成したMPDファイルを他の装置に供給するようにしてもよい。
さらに、タイル型MPD生成部141のように、タイル型画像情報生成部124およびMPD生成部125を一体化するようにしてもよい。例えば、そのタイル型MPD生成部141を1つの独立した装置として構成するようにしてもよい。
<端末装置>
図13は、端末装置103の主な構成例を示すブロック図である。図13に示されるように、端末装置103は、MPD取得部151、パース処理部152、タイル画像選択部153、ファイル取得部154、画像復号部155、タイル画像合成部156、および表示部157を有する。
MPD取得部151は、例えば端末装置103のユーザや制御プログラムの指示等に基づいて、所望のコンテンツのMPDファイルを、ネットワーク104を介して配信サーバ102から取得する。MPD取得部151は、取得したMPDファイルをパース処理部152に供給する。
パース処理部152は、供給されたMPDファイルを解析(パース)する。また、パース処理部152は、MPDファイルに含まれるタイル型画像情報(部分画像情報)も解析(パース)する。パース処理部152は、その解析結果をタイル画像選択部153に供給する。
タイル画像選択部153は、外部から供給される、再生する部分画像(単数若しくは複数のタイル画像からなる画像)を指定するタイル画像指定情報を取得すると、パース処理部152におけるMPDファイル(タイル型画像情報)の解析結果に基づいて、タイル型画像情報に含まれるタイル画像の中から、タイル画像指定情報により指定されるタイル画像を選択する。タイル画像選択部153は、選択したタイル画像のファイルのURL(配信アドレス)をファイル取得部154に供給する。
ファイル取得部154は、ネットワーク104を介して配信サーバ102の、タイル画像選択部153から供給された配信アドレスにアクセスし、所望のコンテンツファイルを取得する。ファイル取得部154は、取得したコンテンツファイルからビットストリームを取得し、そのビットストリームを画像復号部155に供給する。
画像復号部155は、ファイル取得部154から供給されるビットストリームを復号し、タイル画像の画像データを得る。図13に示されるように、画像復号部155は、復号処理部161、復号処理部162、復号処理部163、・・・のように、複数の復号処理部を有しており、供給される複数のビットストリームを並行して復号することができる。画像復号部155は、ビットストリームを復号して得られたタイル画像の画像データをタイル画像合成部156に供給する。
なお、画像復号部155は、画像符号化部122の符号化方法に対応する方法であれば、任意の復号方法で復号を行うことができる。したがって、各復号処理部が同一の方法で復号を行うようにしてもよいし、互いに異なる方法で復号を行うようにしてもよい。
タイル画像合成部156は、画像復号部155から、互いに同じグループに属する複数のタイル画像の画像データが供給された場合、そのタイル画像を合成(統合)し、1枚の画像とするように、各画像データを合成する。つまり、タイル画像合成部156は、表示用の画像の画像データを生成する。画像を合成しない場合(例えば単数のタイル画像を表示させる場合や、配信の際に既に複数のタイル画像が1本のビットストリームとされている場合等)は、供給された画像が表示用の画像とされることになる。タイル画像合成部156は、その表示用の画像データを表示部157に供給する。
表示部157は、供給された表示用の画像データを再生し、その表示用の画像をディスプレイに表示する。
以上のように、端末装置103は、タイル構造に対応したタイル型MPDを正しく解析することができ、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、配信システム100は、部分画像のデータの適応的な提供を実現することができる。
また、上述したように、端末装置103は、配信時と異なる画像サイズで画像を表示することができる。つまり、端末装置103は、配信サーバ102やネットワーク104の負荷状況等に応じて、より適応的にデータ配信を制御することができる。例えば、全体画像を取得するかタイル画像を取得するかを制御することができるため、表示画像のサイズは変えずに、取得するコンテンツファイルの数を適宜増減させることができる。そのため、配信元や経路を分散させたり集中させたりするなどの制御を適宜行うことができる。
以上に説明した各処理部は、独立した装置として構成するようにしてもよい。特に、パース処理部152やタイル画像選択部153は、それぞれ、独立した装置として構成するようにしてもよい。つまり、コンテンツファイルの取得や再生(復号)に関する構成は必須ではなく、タイル型MPDやタイル型画像情報(部分画像情報)の解析だけを行うようにしてもよい。例えば、他の装置によって配信サーバ102から取得されたMPDファイルを解析するようにしてもよい。また、例えば、その解析結果を他の装置に供給するようにしてもよい。
また、タイル型画像情報処理部171のように、パース処理部152およびタイル画像選択部153を一体化するようにしてもよい。例えば、そのタイル型画像情報処理部171を1つの独立した装置として構成するようにしてもよい。
なお、タイル画像合成部156から出力される表示用の画像データは、他の装置に供給されたり、記録媒体に記録されたりするようにしてもよい。また、その際、画像データが符号化されるようにしてもよい。
<配信データ生成処理の流れ>
次に、以上のような配信システム100の各装置により実行される各処理の流れについて説明する。最初に、図14のフローチャートを参照して、配信データ生成装置101による配信データ生成処理の流れの例を説明する。
配信データ生成処理が開始されると、配信データ生成装置101の画面分割処理部121は、ステップS101において、画面(すなわち全体画像)をタイルに分割するように画像データを編集(加工)する。
ステップS102において、画像符号化部122は、ステップS101において生成された各タイル画像の画像データを符号化する。
ステップS103において、ファイル生成部123は、ステップS102において生成された符号化データ(ビットストリーム)をファイル化する(つまり、コンテンツファイルを生成する)。
ステップS104において、タイル型MPD生成部141は、ステップS101の分割やステップS103のファイル化等の処理結果に応じて、タイル型MPDのファイルを生成する。
ステップS105において、サーバアップロード処理部126は、以上のように生成されたMPDファイルおよびコンテンツファイルを配信サーバ102にアップロードする。
ステップS105の処理が終了すると、配信データ生成処理が終了する。
<タイル型MPDファイル生成処理の流れ>
次に、図15のフローチャートを参照して、図14のステップS104において実行されるタイル型MPDファイル生成処理の流れの例を説明する。
タイル型MPDファイル生成処理が開始されると、タイル型画像情報生成部124は、ステップS121において、例えばビューポイントのエレメントにおいて、タイル型画像情報のスキーマ(例えば、urn:mpeg:DASH:tile:2013)を設定する。
ステップS122において、タイル型画像情報生成部124は、タイル型画像情報として、そのスキーマのバリューにビュータイプ(viewtype)を設定する。
ステップS123において、タイル型画像情報生成部124は、タイル型画像情報として、そのスキーマのバリューに全体画像のサイズ(width,height)を設定する。
ステップS124において、タイル型画像情報生成部124は、タイル型画像情報として、そのスキーマのバリューにタイル画像の位置(x,y)を設定する。
ステップS125において、タイル型画像情報生成部124は、タイル型画像情報として、そのスキーマのバリューにグループ識別情報(TilegroupID)を設定する。
ステップS126において、タイル型画像情報生成部124は、タイル型画像情報として、必要に応じて、セグメント情報(@SegmentInSubRepresentation)を設定する。例えば、サブリプレゼンテーション(Sub-Representation)の下にセグメントが存在するようにMPDが拡張される場合、タイル型画像情報生成部124は、この、サブリプレゼンテーション(Sub-Representation)の下にビットストリームの情報が存在することを示すセグメント情報を生成する。
ステップS127において、タイル型画像情報生成部124は、タイル型画像情報として、必要に応じて、マルチセグメント情報(@multiSegmentInRepresentation)を設定する。例えば、セグメントにタイル画像を割り当てるようにし、1つのリプレゼンテーションに複数の同時刻のセグメントが存在することができるようにMPDが拡張される場合、タイル型画像情報生成部124は、この、リプレゼンテーションの下に、同時刻のタイル画像が割り当てられた複数のセグメントが存在することを示すマルチセグメント情報を生成する。
ステップS127の処理が終了するとタイル型MPDファイル生成処理が終了し、処理は図14に戻る。
以上のように各処理を実行することにより、配信データ生成装置101は、配信サーバ102に、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)させることができる。すなわち、部分画像のデータの適応的な提供を実現することができる。
<配信データ再生処理の流れ>
次に、図16のフローチャートを参照して、端末装置103により実行される配信データ再生処理の流れの例を説明する。
配信データ再生処理が開始されると、MPD取得部151は、ステップS141において、配信サーバ102から所望のコンテンツに対応するMPDファイルを取得する。
ステップS142において、パース処理部152は、ステップS141において取得されたMPDファイルを解析(パース)する。
ステップS143において、パース処理部152は、さらに、そのMPDファイルに含まれるタイル型画像情報(部分画像情報)を解析(パース)する。
ステップS144において、タイル画像選択部153は、タイル型画像情報に示されるタイル画像の中から、外部から供給されるタイル画像指定情報により指定されるタイル画像を選択する。
ステップS145において、ファイル取得部154は、ステップS144において選択されたタイル画像のファイルを取得する。
ステップS146において、画像復号部155は、ステップS145において取得されたファイルに含まれるタイル画像のビットストリームを復号する。
ステップS147において、タイル画像合成部156は、必要に応じて、ステップS146においてビットストリームが復号されて得られたタイル画像の画像データを、タイル画像を合成するように編集(加工)する。
ステップS148において、表示部157は、ステップS147において得られたタイル画像の合成画像等の表示用画像をディスプレイに表示する。
ステップS148の処理が終了すると、配信データ再生処理が終了する。
以上のように配信データ再生処理を実行することにより、端末装置103は、タイル構造に対応したタイル型MPDを正しく解析することができ、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、部分画像のデータの適応的な提供を実現することができる。
なお、上述した部分画像の適応的な配信(提供)は、全体画像の配信(提供)と併用することができる。つまり、例えば、サーバが、端末からの要求等に応じて適応的に、全体画像を配信したり、任意の部分画像を配信したりすることができるようにしてもよい。
<3.第3の実施の形態>
<MPD拡張の具体例>
次に、MPDの拡張の仕方の具体例について説明する。
<例1>
拡張したMPDの主な構成例を図17に示す。図17の例の場合、配信される画像データの各タイルの符号化データがそれぞれ1つのビットストリーム(MP4ファイル)とされている(bitstream3.mp4乃至bitstream6.mp4)。そして、MPDは、アダプテーションセット(AdaptationSet)が拡張され、各タイル画像のビットストリーム(MP4ファイル)が、互いに異なるアダプテーションセットにおいて定義されている。タイル用のディスクリプションであるビューポイント(Viewpoint)は、アダプテーションセットに定義され、そのビューポイントに対応するタイルのビットストリーム(MP4ファイル)のURLが、そのアダプテーションセットの下のリプレゼンテーション(Representation)の下のセグメント(Segment)に設定される。
つまり、互いに同じグループに属する複数の部分画像のそれぞれの部分画像情報が互いに異なるアダプテーションセットに格納され、複数の部分画像のそれぞれのビットストリームが、互いに異なるアダプテーションセットに割り当てられる。
図17に示されるように、この例の場合、全体画像(bitstream1.mp4, bitstream2.mp4)のアダプテーションセットと並べてタイル画像のアダプテーションセットを設けることができ、全体画像の配信と部分画像の適応的な配信とを一元的に管理することができる。
従来のDASHでは、例えばステレオ画像のR画像とL画像のように、表示している内容が異なる画像は、互いに異なるアダプテーションセットに定義される場合が多い。本例では、そのような手法にならって各タイル画像を互いに異なるアダプテーションセットに定義している。そのため、部分画像の配信制御においても、従来により近い自然な手法を実現することができる。そのため開発を容易にすることができる。
なお、図17の例においては、解像度の異なる全体画像が、同一のアダプテーションセットに定義されているが、これらの全体画像を互いに異なるアダプテーションセットに定義するようにしてもよい。
なお、本例のMPDの具体的な記述例を図18に示す。
<例2>
拡張したMPDの他の構成例を図19に示す。図19の例の場合、配信される画像データの各タイルの符号化データがそれぞれ1つのビットストリーム(MP4ファイル)とされている(bitstream3.mp4乃至bitstream6.mp4)。そして、MPDは、アダプテーションセット(AdaptationSet)が拡張され、各タイル画像のビットストリーム(MP4ファイル)が、全体画像が定義されるアダプテーションセットとは異なるアダプテーションセットにおいて定義されている。ただし、<例1>の場合と異なり、各タイル画像のビットストリーム(MP4ファイル)は、同一のアダプテーションセットにおいて定義されている。
タイル用のディスクリプションであるビューポイント(Viewpoint)は、そのアダプテーションセットの下のリプレゼンテーション(Representation)に定義され、そのビューポイントに対応するタイルのビットストリーム(MP4ファイル)のURLが、そのリプレゼンテーションの下のセグメント(Segment)に設定されている。
つまり、互いに同じグループに属する複数の部分画像のそれぞれの部分画像情報が、メタデータの1つのアダプテーションセットに属する互いに異なるリプレゼンテーションに格納され、複数の部分画像のそれぞれのビットストリームが、互いに異なるリプレゼンテーションに割り当てられる。
図19に示されるように、この例の場合、全体画像のアダプテーションセットと並べてタイル画像のアダプテーションセットを設けることができ、全体画像の配信と部分画像の適応的な配信とを一元的に管理することができる。
なお、図19の例においては、解像度の異なる全体画像(bitstream1.mp4, bitstream2.mp4)が、同一のアダプテーションセットに定義されているが、これらの全体画像を互いに異なるアダプテーションセットに定義するようにしてもよい。
<例3>
拡張したMPDのさらに他の構成例を図20に示す。図20の例の場合、配信される画像データの各タイルの符号化データが1本のビットストリームにまとめられている。そして、そのビットストリームは、タイル毎にMP4ファイル化されている(bitstream7_Tile1.mp4乃至bitstream7_Tile4.mp4)。また、図7を参照して説明したように、各タイルのヘッダ情報等を集めたベーストラックが各タイルのビットストリームとは別にファイル化されている(bitstream7_base.mp4)。
そして、MPDは、アダプテーションセット(AdaptationSet)が拡張され、各タイル画像のビットストリーム(MP4ファイル)(bitstream7_Tile1.mp4乃至bitstream7_Tile4.mp4)が、互いに異なるアダプテーションセットにおいて定義されている。
タイル用のディスクリプションであるビューポイント(Viewpoint)は、アダプテーションセットに定義され、そのビューポイントに対応するタイルのビットストリーム(MP4ファイル)のURLが、そのアダプテーションセットの下のリプレゼンテーション(Representation)の下のセグメント(Segment)に設定される。
なお、ベーストラックのビットストリーム(MP4ファイル)(bitstream7_base.mp4)のビューポイントのバリューに定義されるx座標およびy座標には、第1の実施の形態において説明したように、例えばNULL等の、通常の座標とは明らかに異なる値が設定される。また、各ビューポイントのバリューに定義されるビュータイプの値には、HEVC等の符号化方式がサポートするタイル(Tile)であることを示す値(図20の例の場合「2」)が設定される。
つまり、互いに同じグループに属する複数の部分画像のそれぞれの部分画像情報が、メタデータの互いに異なるアダプテーションセットに格納され、複数の部分画像を含む1つのビットストリームが部分画像毎に分割された複数のファイルのそれぞれが、互いに異なるアダプテーションセットに割り当てられる。
なお、本例のMPDの具体的な記述例を図21に示す。
<例4>
拡張したMPDのさらに他の構成例を図22に示す。図22の例の場合、拡張方法は<例3>と同様である。各タイルが図22に示されるように不均等な大きさに設定されている(図9のBに対応している)。この場合、四角で示されるように、タイルを追加することにより、所望の画サイズの画像が得られる。
また、本例の場合、配信される画像データの各タイルの符号化データがそれぞれ1つのビットストリーム(MP4ファイル)とされている(tile1.mp4乃至tile5.mp4)。そのため、<例3>のようにベーストラックは存在しない。
つまり、ビットストリームに含まれる制御情報についての部分画像情報がさらに生成され、制御情報の部分画像情報が、各部分画像の部分画像情報とは異なるアダプテーションセットに格納され、制御情報のファイルが、アダプテーションセットに割り当てられる。
<例5>
拡張したMPDのさらに他の構成例を図23に示す。図23の例の場合、配信される画像データの各タイルの符号化データがそれぞれ1つのビットストリーム(MP4ファイル)とされている(bitstream3.mp4乃至bitstream6.mp4)。そして、MPDは、リプレゼンテーション(Representation)が拡張され、各タイル画像のビットストリーム(MP4ファイル)が、全体画像のビットストリーム(MP4ファイル)(bitstream1.mp4, bitstream2.mp4)と同一のアダプテーションセットの下の、互いに異なるリプレゼンテーションにおいて定義されている。
タイル用のディスクリプションであるビューポイント(Viewpoint)は、リプレゼンテーションに定義され、そのビューポイントに対応するタイルのビットストリーム(MP4ファイル)のURLが、そのリプレゼンテーションの下のセグメント(Segment)に設定される。
つまり、互いに同じグループに属する複数の部分画像のそれぞれの部分画像情報が、メタデータの全体画像と同じアダプテーションセットに属する互いに異なるリプレゼンテーションに格納され、複数の部分画像のそれぞれのビットストリームが、互いに異なるリプレゼンテーションに割り当てられる。
つまり、図23に示されるように、この例の場合、全体画像(bitstream1.mp4, bitstream2.mp4)のリプレゼンテーションと並べてタイル画像のリプレゼンテーションを設けることができ、全体画像の配信と部分画像の適応的な配信とを一元的に管理することができる。
なお、本例のMPDの具体的な記述例を図24に示す。
<例6>
拡張したMPDのさらに他の構成例を図25に示す。図25の例の場合、配信される画像データの各タイルの符号化データが1本のビットストリームにまとめられている。そして、そのビットストリームは、タイル毎にMP4ファイル化されている(bitstream7_Tile1.mp4乃至bitstream7_Tile4.mp4)。また、図7を参照して説明したように、各タイルのヘッダ情報等を集めたベーストラックが各タイルのビットストリームとは別にファイル化されている(bitstream7_base.mp4)。
そして、MPDは、リプレゼンテーション(Representation)が拡張され、各タイル画像のビットストリーム(MP4ファイル)(bitstream7_Tile1.mp4乃至bitstream7_Tile4.mp4)が、同一のアダプテーションセットの下の互いに異なるリプレゼンテーションにおいて定義されている。
タイル用のディスクリプションであるビューポイント(Viewpoint)は、リプレゼンテーションに定義され、そのビューポイントに対応するタイルのビットストリーム(MP4ファイル)のURLが、そのリプレゼンテーションの下のセグメント(Segment)に設定される。
なお、ベーストラックのビットストリーム(MP4ファイル)(bitstream7_base.mp4)のビューポイントのバリューに定義されるx座標およびy座標には、第1の実施の形態において説明したように、例えばNULL等の、通常の座標とは明らかに異なる値が設定される。また、各ビューポイントのバリューに定義されるビュータイプの値には、HEVC等の符号化方式がサポートするタイル(Tile)であることを示す値(図25の例の場合「2」)が設定される。
つまり、互いに同じグループに属する複数の部分画像を含む1つのビットストリームに含まれる制御情報についての部分画像情報がさらに生成され、複数の部分画像のそれぞれの部分画像情報が、メタデータの1つのアダプテーションセットに属する互いに異なるリプレゼンテーションに格納され、ビットストリームが部分画像毎に分割された複数のファイルのそれぞれが、互いに異なるリプレゼンテーションに割り当てられ、制御情報の部分画像情報が、各部分画像の部分画像情報とは異なるリプレゼンテーションに格納され、制御情報のファイルが、リプレゼンテーションに割り当てられる。
なお、本例のMPDの具体的な記述例を図26に示す。
<例7>
拡張したMPDのさらに他の構成例を図27に示す。図27の例の場合、配信される画像データの各タイルの符号化データがそれぞれ1つのビットストリーム(MP4ファイル)とされている(bitstream3.mp4乃至bitstream6.mp4)。そして、MPDは、サブリプレゼンテーション(Sub-Representation)が拡張され、各タイル画像のビットストリーム(MP4ファイル)が、全体画像のビットストリーム(MP4ファイル)(bitstream1.mp4, bitstream2.mp4)と同一のアダプテーションセットの下の、全体画像のビットストリーム(MP4ファイル)と異なるリプレゼンテーションの下の、互いに異なるサブリプレゼンテーションにおいて定義されている。
タイル用のディスクリプションであるビューポイント(Viewpoint)は、サブリプレゼンテーションに定義され、そのビューポイントに対応するタイルのビットストリーム(MP4ファイル)のURLが、そのサブリプレゼンテーションの下のセグメント(Segment)に設定される。
また、各タイル画像のビットストリーム(MP4ファイル)が定義されるリプレゼンテーションには、サブリプレゼンテーションの下にビットストリームの情報が存在することを示すセグメント情報(@SegmentInSubRepresentation = true)が定義される。
つまり、互いに同じグループに属する複数の部分画像のそれぞれの部分画像情報が、メタデータの1つのアダプテーションセットに属する1つのリプレゼンテーションに属する互いに異なるサブリプレゼンテーションに格納され、複数の部分画像のそれぞれのビットストリームが、互いに異なるサブリプレゼンテーションに割り当てられる。
つまり、図27に示されるように、この例の場合、全体画像(bitstream1.mp4, bitstream2.mp4)のリプレゼンテーションと並べてタイル画像のリプレゼンテーションを設けることができ、全体画像の配信と部分画像の適応的な配信とを一元的に管理することができる。
なお、本例のMPDの具体的な記述例を図28に示す。
<例8>
拡張したMPDのさらに他の構成例を図29に示す。図29の例の場合、配信される画像データの各タイルの符号化データが1本のビットストリームにまとめられている。そして、そのビットストリームは、タイル毎にMP4ファイル化されている(bitstream7_Tile1.mp4乃至bitstream7_Tile4.mp4)。また、図7を参照して説明したように、各タイルのヘッダ情報等を集めたベーストラックが各タイルのビットストリームとは別にファイル化されている(bitstream7_base.mp4)。
そして、MPDは、サブリプレゼンテーション(Sub-Representation)が拡張され、各タイル画像のビットストリーム(MP4ファイル)(bitstream7_Tile1.mp4乃至bitstream7_Tile4.mp4)が、同一のアダプテーションセット(AdaptationSet)の下の同一のリプレゼンテーション(Representation)の下の互いに異なるサブリプレゼンテーションにおいて定義されている。
タイル用のディスクリプションであるビューポイント(Viewpoint)は、サブリプレゼンテーションに定義され、そのビューポイントに対応するタイルのビットストリーム(MP4ファイル)のURLが、そのサブリプレゼンテーションの下のセグメント(Segment)に設定される。
また、ベーストラックのビューポイントは、それらのサブリプレゼンテーションの上のリプレゼンテーションに定義され、そのベーストラックのビットストリーム(MP4ファイル)(bitstream7_base.mp4)のURLが、そのリプレゼンテーションの下のセグメントに設定される。また、各タイル画像のビットストリーム(MP4ファイル)が定義されるリプレゼンテーションには、サブリプレゼンテーションの下にビットストリームの情報が存在することを示すセグメント情報(@SegmentInSubRepresentation = true)が定義される。また、図4で表されるMPDの他の構成要素(例えば、AdaptationSet)で、サブリプレゼンテーションの下にビットストリームの情報が存在することを示すセグメント情報(@SegmentInSubRepresentation = true)が定義されても良い。
なお、ベーストラックのビットストリーム(MP4ファイル)(bitstream7_base.mp4)のビューポイントのバリューに定義されるx座標およびy座標には、第1の実施の形態において説明したように、例えばNULL等の、通常の座標とは明らかに異なる値が設定される。また、各ビューポイントのバリューに定義されるビュータイプの値には、HEVC等の符号化方式がサポートするタイル(Tile)であることを示す値(図29の例の場合「2」)が設定される。
つまり、サブリプレゼンテーション(Sub-Representation)の下にビットストリームの情報が存在することを示すセグメント情報と、互いに同じグループに属する複数の部分画像を含む1つのビットストリームに含まれる制御情報についての部分画像情報とがさらに生成され、制御情報の部分画像情報およびセグメント情報が、メタデータの1つのアダプテーションセットに属する1つのリプレゼンテーションに格納され、制御情報のファイルが、リプレゼンテーションに割り当てられ、複数の部分画像のそれぞれの部分画像情報が、リプレゼンテーションに属する互いに異なるサブリプレゼンテーションに格納され、ビットストリームが部分画像毎に分割された複数のファイルのそれぞれが、互いに異なるサブリプレゼンテーションに割り当てられる。
なお、本例のMPDの具体的な記述例を図30に示す。
<例9>
拡張したMPDのさらに他の構成例を図31に示す。図31の例の場合、配信される画像データの各タイルの符号化データが1本のビットストリームにまとめられている。そして、そのビットストリームは、図8の例のように1つのファイルとなるようにMP4ファイル化されている(bitstream7.mp4)。
そして、MPDは、サブリプレゼンテーション(Sub-Representation)が拡張され、タイル画像のビットストリーム(MP4ファイル)(bitstream7.mp4)が、アダプテーションセット(AdaptationSet)の下のリプレゼンテーション(Representation)の下において定義されている。その上のリプレゼンテーションにおいては、タイル画像のビットストリーム(MP4ファイル)(bitstream7.mp4)に対応するビューポイント(Viewpoint)が定義され、さらに、サブリプレゼンテーションの下にビットストリームの情報が存在することを示すセグメント情報(@SegmentInSubRepresentation = true)が定義される。
そのリプレゼンテーションの下のサブリプレゼンテーションには、各タイルのビューポイントが設定され、その下のセグメントにおいては、(bitstream7.mp4)における各タイルのデータの場所がバイトで指定される。
つまり、サブリプレゼンテーションの下にビットストリームの情報が存在することを示すセグメント情報と、互いに同じグループに属する複数の部分画像を含む1つのビットストリームに含まれる制御情報についての部分画像情報とがさらに生成され、制御情報の部分画像情報およびセグメント情報がメタデータの1つのアダプテーションセットに属する1つのリプレゼンテーションに格納され、ビットストリームがリプレゼンテーションに割り当てられ、複数の部分画像のそれぞれの部分画像情報が、リプレゼンテーションに属する互いに異なるサブリプレゼンテーションに格納され、ビットストリームにおける各部分画像のデータの場所を示す情報が、互いに異なるサブリプレゼンテーションに割り当てられる。
<例10>
拡張したMPDのさらに他の構成例を図32に示す。図32の例の場合、配信される画像データの各タイルの符号化データがそれぞれ1つのビットストリーム(MP4ファイル)とされている(bitstream3.mp4乃至bitstream6.mp4)。そして、MPDは、セグメント(Segment)が拡張され、アダプテーションセットの下のリプレゼンテーションの下に複数のセグメント(Segment)が定義されている。
リプレゼンテーションには、全タイル画像の合成画像のビューポイントが定義され、リプレゼンテーションの下に、同時刻のタイル画像が割り当てられた複数のセグメントが存在することを示すマルチセグメント情報(@multiSegmentInRepresentation = true)が定義される。また、図4で表されるMPDの他の構成要素(例えば、AdaptationSet)で, サブリプレゼンテーションの下にビットストリームの情報が存在することを示すセグメント情報(@SegmentInSubRepresentation = true)が定義されても良い。
各タイル画像のビットストリーム(MP4ファイル)が、全体画像のビットストリーム(MP4ファイル)(bitstream1.mp4, bitstream2.mp4)と同一のアダプテーションセットの下の、全体画像のビットストリーム(MP4ファイル)と異なるリプレゼンテーションの下の、互いに異なるセグメントにおいて定義されている。
タイル用のディスクリプションであるビューポイント(Viewpoint)は、そのセグメントに定義され、そのビューポイントに対応するタイルのビットストリーム(MP4ファイル)のURLが、各セグメント(Segment)に設定される。
つまり、リプレゼンテーションの下に同時刻のビットストリームの情報が複数存在することを示すマルチセグメント情報がさらに生成され、マルチセグメント情報がメタデータの1つのアダプテーションセットに属する1つのリプレゼンテーションに格納され、互いに同じグループに属する複数の部分画像のそれぞれの部分画像情報が、リプレゼンテーションに属する互いに異なるセグメントに格納され、複数の部分画像のそれぞれのビットストリームが、互いに異なるセグメントに割り当てられる。
つまり、図32に示されるように、この例の場合、全体画像(bitstream1.mp4, bitstream2.mp4)のリプレゼンテーションと並べてタイル画像のリプレゼンテーションを設けることができ、全体画像の配信と部分画像の適応的な配信とを一元的に管理することができる。
なお、本例のMPDの具体的な記述例を図33に示す。
<例11>
拡張したMPDのさらに他の構成例を図34に示す。図34の例の場合、配信される画像データの各タイルの符号化データがまとめて1つのビットストリーム(MP4ファイル)とされている(bitstream7.mp4)。そして、MPDは、サブセグメント(Sub-Segment)が拡張され、アダプテーションセットの下のリプレゼンテーションの下のセグメントの下に複数のサブセグメント(Sub-Segment)が定義されている。
リプレゼンテーションには、サブリプレゼンテーションの下にビットストリームの情報が存在しないことを示すセグメント情報(@SegmentInSubRepresentation = false)が定義される。
セグメントには、全タイル画像の合成画像のビューポイントが定義され、その下のサブセグメントにおいて、ssixによって各タイル画像のデータが示される。
つまり、サブリプレゼンテーションの下にビットストリームの情報が存在しないことを示すセグメント情報と、互いに同じグループに属する複数の部分画像を含む1つのビットストリームについての部分画像情報とがさらに生成され、セグメント情報がメタデータの1つのアダプテーションセットに属する1つのリプレゼンテーションに格納され、部分画像情報がリプレゼンテーションに属する1つのセグメントに格納され、ビットストリームがセグメントに割り当てられ、ビットストリームにおける各部分画像のデータの場所を示す情報が、セグメントに属する、互いに異なるサブセグメントに割り当てられる。
もちろん、MPDの拡張方法は、任意であり、上述した例以外のものであってもよい。
<タイル画像配信を利用するアプリケーションの他の例>
次に、以上に説明したタイル画像の適応的な配信(提供)を利用するアプリケーションの他の例について説明する。
例えば、図35の左に示されるようなシステムにおいて、モバイルデバイス221がサーバ220から、全体画像210の4枚のタイル画像211からなる1920x1080サイズの部分画像212を3G回線で取得し、再生中であるとする。
テレビジョン信号受像機(TV)222に表示を切り替えるため、切り替え先のTV222の再生環境(ネットワーク帯域)や再生能力(解像度・デコーダ能力)などの情報をTV222から取得する。この情報の取得方法は任意であり、例えば、モバイルデバイス221が直接TV222と通信することで取得するようにしても良いし、モバイルデバイス221が、サーバ220を介して取得するようにしても良い。
モバイルデバイス221は、MPDの情報から、切り替え先のTV222に最適なタイル画像を選択する。図35の例の場合、5x5のタイル画像211よりなる部分画像213が選択される。
以上のように選択されたタイル画像のビットストリームを、切り替え先のTV222が取得し、再生する。
なお、以上のような最適なストリームの選択や取得をモバイルデバイス221が行って、切り替え先のTV222にプッシュ(Push)するようにしても良いし、TV222がそのような選択や取得を行うようにしても良い。
<タイル画像配信を利用するアプリケーションのさらに他の例>
また、例えば、図36の左に示されるようなシステムにおいて、モバイルデバイス221が、全体画像の一部を再生しているとする(モバイルデバイス221Aの状態)。
再生中の領域をずらして別の領域を再生するために、モバイルデバイス221のユーザが、タッチパネル上で、指を、再生したい方向が画面上に表示されるように、画像を動かすように(矢印233のように)、ずらす。例えば、矢印234のように現在表示されている領域(部分画像231)よりも右上の領域(部分画像232)を表示したい場合、ユーザは、指を、画面の右上から左下の方向になぞる。
このようなユーザ入力が行われると、モバイルデバイス221が、入力された指の動きなどに基づいて、画像の移動先を算出し、MPD情報から、表示するべきタイル画像のストリームを選択する。
そして、モバイルデバイス221は、選択されたビットストリームをサーバ220から取得し、再生・表示する(モバイルデバイス221Bの状態)。
なお、タイル画像の選択は、モバイルデバイス221において実行されるアプリケーションで行っても良いし、指の動きから取得した画像の移動先の方向をサーバ220に送り、サーバ220が画像の選択をするようにしても良い。
画像を実際に移動させる際には、突然、表示領域が切り替わるように行っても良いし、スムーズな切り替えを行うために、表示領域を少しずつずらしながら切り替えても良い。
<4.第4の実施の形態>
<MPD拡張の他の例>
図37は、タイル画像配信を利用するアプリケーションの、さらに他の例を示す図である。
放送など、複数のチャンネルの番組の中から、ユーザに、好きな番組を選んでもらうために、複数のチャンネルの画像を1枚の画像(HD)として符号化することで、メニューのようなものを作成する。このような異なる画像を並べるように合成した合成画像をモザイクビデオと定義する。
例えば、テレビジョン信号受像機のように大きなディスプレイを有するデバイスであれば、ユーザは、容易に、全チャンネルの番組が合成されたモザイクビデオから各番組の内容を把握し、所望の番組を選択して表示させることができる。
しかしながら、モバイルデバイスの場合、そのディスプレイは小さく、例えばHD画像以下のような、画サイズの小さな(低解像度の)画像しか表示することができない。つまり、このようなモバイルデバイスに対しては、1920x1080の画像しか配信することができない。
しかしながら、そのような小さな画サイズでは、モザイクビデオの各チャンネルの番組が表示される領域が小さ過ぎ、ユーザがそのようなモザイクビデオから各番組の内容を把握し、所望の番組を選択することは困難であった。
そこで、上述したような、部分画像のデータを適応的に提供する技術を適用し、ユーザがモザイクビデオの中から気になる番組が映っている場所を選択してズームすると、より少数の番組の画像が表示される別のHD画像に切り替わるようにする。このようなズーム(画像の切り替え)を繰り返すことにより、ユーザが容易に所望の番組のみを表示させることができるようにする。
図37の例の場合、楕円で示される範囲内のタイルをモバイルデバイスが取得し、表示することができるとする。一番左のモザイクビデオにおいては、モザイクビデオ全体を表示させることができる。このとき16チャンネル分の番組の画像が表示される。この状態では、各番組の表示領域(A乃至P)が小さ過ぎて、ユーザが所望の番組を選択することは困難であった。そこで、ユーザが左上の部分をタップする等して選択すると、配信されるファイル(ビットストリーム)が切り替えられ、図37の中央に示されるような、画サイズが1920x1080の、モザイクビデオの左上のタイル画像が表示される。このタイル画像においては、4番組が表示される(A、B、E、F)。つまり、表示される番組数が低減し、1番組当たりの表示領域が広がっている。
さらに、ユーザがそのモザイクビデオの左上の部分をタップする等して選択すると、配信されるファイル(ビットストリーム)が切り替えられ、図37の右に示されるような、画サイズが1920x1080の、モザイクビデオの左上のタイル画像が表示される。このタイル画像においては、1番組が表示される(A)。つまり、表示される番組数がさらに低減し、1番組当たりの表示領域が広がっている。
以上のような配信データの切り替えを、上述したようにDASH規格を拡張することにより実現させる。つまり、例えば、1画面を構成するモザイクビデオの構造をMPDに定義し、モザイクビデオをユーザインタフェース等(UI/UX)として利用できるようにする。
例えば、画面構成と、ユーザが選択した位置情報の関係を求めて、次に切り替えるべきストリームを選択する。画面上でユーザが触った座標と、モザイクビデオ上の座標を求め、その座標位置が含まれる、次のLayer(拡大)のモザイクビデオを求めて、切り替える。
ビューポイントのエレメント(Viewpoint element)を利用し、新しいschemeIdUri(urn:mpeg:DASH:mosaic:2013)を定義する。それに対するバリュー(value)の中身(部分画像情報)には、例えば以下の情報を定義する。
・1画面を構成するモザイク画像の数
・モザイク画像の大きさが均等であるかを表すフラグ
・均等でない場合に、各モザイク画像の左上の原点座標と、横幅(Width),高さ(Height)の情報
より具体的には、以下のようなビューポイントが定義される。そして、このような部分画像情報を用いてMPDを拡張する。
<Viewpoint schemeIdUri=“urn:mpeg:DASH:mosaic:2013” value=“モザイク画像の数, 均等画像フラグ, モザイク画像の位置情報”>
なお、このビューポイントのエレメントは、モザイクビデオに対するものである(urn:mpeg:DASH:mosaic:2013)。上述したように部分画像のデータを適応的に提供するためには、さらに、図10のAに示されるようなタイル用のビューポイントのエレメントを定義する必要がある。つまり、上述のモザイクビデオ用のビューポイントのエレメントは、タイル用のビューポイントのエレメントの拡張エレメントという位置づけとなる。
例えば、図38の上側に示されるような複数番組が表示される状態の場合、タイル用のビューポイントのエレメントと、モザイクビデオ用のビューポイントのエレメントとの両方を、アダプテーションセットにおいて定義する必要がある。
これに対して、ユーザが番組を絞り込んだ結果、図38の下側に示されるような、1番組のみが表示される状態となった場合、モザイクビデオとなっていないので、モザイクビデオ用のビューポイントのエレメントの定義は不要である。ただし、タイル用のビューポイントのエレメントは、全体画像(Full video)であることを示すため、定義する必要がある。
なお、上述したモザイクビデオ用のビューポイントのエレメントのバリューにおいて、もし各タイル画像のサイズが均等である場合、画像の位置情報は、オプション扱いとなる。書いても書かなくてもよい。書くなら全画像を書く必要がある。また、上述した例以外の情報を、バリューとして定義するようにしてもよい。
<5.第5の実施の形態>
<MP4ファイルの構成例とそれに対応するMPDの拡張例>
MP4ファイルの構成例については、第1の実施の形態において、図7や図8を参照して説明した。しかしながら、MP4ファイルの構成例は、これに限らない。以下において、MP4ファイルの構成例とそれに対応するMPDの構成例(拡張例)について説明する。
<1トラックの場合:MP4ファイル>
図39は、例えば図6のBのようなタイル(Tile)構造を有するビットストリーム(bitstream7)をファイル化したMP4ファイルの構成例を示す図である。図39の例の場合、図8のAの例と同様に、各タイルのビットストリームがまとめて1つのファイルとされ、さらに各タイルのデータが1つのトラックとして管理されている。
ビデオパラメータセット(VPS(Video Parameter Set))、シーケンスパラメータセット(SPS(Sequence Parameter Set))、ピクチャパラメータセット(PPS(Picture Parameter Set))等のパラメータセットは、サンプルエントリ(Sample Entry)によりサンプル毎に管理される。また、各タイルについては、サンプルグループディスクリプション(Sample Group Description)においてタイルリージョングループエントリ(TileRegionGroupEntry)により定義される。図39に示されるように、タイルリージョングループエントリ(TileRegionGroupEntry)として、当該タイルを識別する識別情報であるGroupID、当該タイルの水平方向の位置(オフセット)を示すH_offset、当該タイルの垂直方向の位置(オフセット)を示すV_offset、当該タイルの水平方向の大きさ(幅)を示すH_width、当該タイルの垂直方向の大きさ(高さ)を示すV_heightの5つのパラメータの値が定義される。
例えば、タイル1(Tile1)のタイルリージョングループエントリ(TileRegionGroupEntry)では、GroupID = 1, H_offset = 0, V_offset = 0, H_width = 960, V_height = 540が定義されている。また、例えば、タイル2(Tile2)のタイルリージョングループエントリ(TileRegionGroupEntry)では、GroupID = 2, H_offset = 960, V_offset = 0, H_width = 960, V_height = 540が定義されている。さらに、例えば、タイル3(Tile3)のタイルリージョングループエントリ(TileRegionGroupEntry)では、GroupID = 3, H_offset = 0, V_offset = 540, H_width = 960, V_height = 540が定義されている。また、例えば、タイル4(Tile4)のタイルリージョングループエントリ(TileRegionGroupEntry)では、GroupID =4, H_offset = 960, V_offset = 540, H_width = 960, V_height = 540が定義されている。この場合、全体画像(1920x1080)は、縦2枚x横2枚の4枚のタイル(960x540)からなる。
なお、このMP4ファイルのファイル名をbitstream.mp4とする。
<1トラックの場合:MPD>
図39の例のようなタイル構造を有するビットストリームのMP4ファイルを管理するために、従来のMPEG-DASH規格のMPDを、例えば、図40のように拡張する。
図40の例の場合、全体画像並びに各タイルについて、それぞれ、互いに異なるアダプテーションセット(AdaptationSet)において定義されている。そして、図40に示されるように、全体画像について定義する図中一番上のアダプテーションセットにおいては、タイル用のディスクリプションとして、第1の実施の形態において説明したビューポイント(Viewpoint)の代わりに、サプリメンタルプロパティ(SupplementalProperty)が定義されるようにする。
サプリメンタルプロパティ(SupplementalProperty)は既存のエレメントである。既存のエレメントを利用することにより、従来のMPDとの親和性の低減を抑制することができる(従来のデコーダが解析できないディスクリプションの増大を抑制することができる)。また、このサプリメンタルプロパティは、従来のデコーダにおいてもデコード可能なビットストリームを定義するアダプテーションセットにおいて定義される。例えば、図40の場合、従来のデコーダでもデコード可能な全体画像について定義するアダプテーションセットにおいて定義されている。
このサプリメンタルプロパティは、例えば、以下のように拡張されて定義される。
<SupplementalProperty schemeIdUri=" "
value="source id,x,y,width,height,width_all,height_all,stream type">
つまり、サプリメンタルプロパティのエレメントにおいて、画像情報を格納するためのスキーマ(schemeIdUri)が定義される。図40の例の場合、このスキーマとして、「urn:mpeg:dash:srd:2013」が定義されている。
また、このスキーマのバリュー(value)が定義される。「source id」は、当該アダプテーションセットのコンテンツソースが他のアダプテーションセットのコンテンツソースと同一であるか否かを示す識別情報である。図40の場合、各アダプテーションセットのコンテンツソースは共通(bitstream.mp4)であるので、この「source id」として「1」が定義されている。
「x,y」は、当該アダプテーションセットが定義するタイルの位置(左上のx座標とy座標)を示す情報である。図40の場合、当該アダプテーションセットは全体画像を定義するので、この「x,y」として「0,0」が定義されている。
「width,height」は、当該アダプテーションセットが定義するタイルの大きさ(幅と高さ)を示す情報である。図40の場合、当該アダプテーションセットは全体画像を定義するので、この「width,height」として「1920,1080」が定義されている。
「width_all,height_all」は、全体画像の大きさ(幅と高さ)を示す情報である。図40の場合、この「width_all,height_all」として「1920,1080」が定義されている。
「stream type」は、当該アダプテーションセットがビットストリーム全体を定義するのか、ビットストリームの一部を定義するのかを示す識別情報である。図40の場合、この「stream type」として、ビットストリーム全体を定義することを示す「0」が定義されている。
つまり、図40の例の図中一番上のアダプテーションセットの場合、サプリメンタルプロパティは、例えば、以下のように定義される。
<SupplementalProperty schemeIdUri=" urn:mpeg:dash:srd:2013"
value="1,0,0,1920,1080,1920,1080,0">
また、図40に示されるように、タイル1(Tile1)について定義する図中上から2番目のアダプテーションセットにおいては、タイル用のディスクリプションとして、第1の実施の形態において説明したビューポイント(Viewpoint)の代わりに、エッセンシャルプロパティ(EssentialProperty)が定義されるようにする。
エッセンシャルプロパティ(EssentialProperty)は既存のエレメントである。既存のエレメントを利用することにより、従来のMPDとの親和性の低減を抑制することができる(従来のデコーダが解析できないディスクリプションの増大を抑制することができる)。また、このエッセンシャルプロパティは、従来のデコーダではデコード不可能なビットストリームを定義するアダプテーションセットにおいて定義される。例えば、図40の場合、従来のデコーダではデコード不可能な各タイルの画像について定義するアダプテーションセットにおいて定義されている。
つまり、このエッセンシャルプロパティを解釈することができるデコーダのみ、当該アダプテーションセットにより管理されるビットストリームを復号し、このエッセンシャルプロパティを解釈することができないデコーダは、当該アダプテーションセットを読み飛ばす。
このエッセンシャルプロパティは、例えば、以下のように拡張されて定義される。つまり、エッセンシャルプロパティは、サプリメンタルプロパティと同様に定義される。
<EssentialProperty schemeIdUri=" "
value="source id,x,y,width,height,width_all,height_all,stream type">
図40の例の図中上から2番目のアダプテーションセットの場合、このスキーマとして、「urn:mpeg:dash:srd:2013」が定義されている。また、このスキーマのバリュー(value)の「source id」として「1」が定義され、「x,y」として「0,0」が定義され、「width,height」として「960,540」が定義され、「width_all,height_all」として「1920,1080」が定義され、「stream type」として、ビットストリームの一部を定義することを示す「1」が定義されている。
この「stream type」の値が「1」の場合、すなわち、当該アダプテーションセットにおいて、ビットストリームの一部が定義される場合、そのビットストリームの一部を指し示す情報としてエッセンシャルプロパティがさらに拡張される。例えば、当該アダプテーションセットで管理されるMP4ファイルにHEVCのタイル(Tile)が含まれている場合、そのタイルに対応するアダプテーションセットは、ビットストリームの一部に対応することになる。このような場合、そのビットストリームの一部についてのエッセンシャルプロパティが、さらに、例えば、以下のように拡張されて定義される。
<EssentialProperty schemeIdUri=" "
value="Sub-Sample-Type,Sub-Sample-is-extracted,ID">
この場合、エッセンシャルプロパティのエレメントにおいて、ファイルの一部を指し示す情報を格納するためのスキーマ(schemeIdUri)が定義される。図40の例の図中上から2番目のアダプテーションセットの場合、このスキーマとして、「urn:mpeg:dash:hevc:2013」が定義されている。
また、このスキーマのバリュー(value)が定義される。「Sub-Sample-Type」は、当該アダプテーションセットが対応するビットストリームの一部がどのような情報で構成されているかを示す情報である。例えば、この値が「0」の場合、そのビットストリームの一部がナルベースド(Nal based)により構成されていることを示す。また、例えば、この値が「1」の場合、そのビットストリームの一部がデコーディングユニットベースド(Decoding-unit-based)により構成されていることを示す。さらに、例えば、この値が「2」の場合、そのビットストリームの一部がタイルベースド(Tile-based)により構成されていることを示す。また、例えば、この値が「3」の場合、そのビットストリームの一部がCTUローベースド(CTU-row-based)により構成されていることを示す。さらに、例えば、この値が「4」の場合、そのビットストリームの一部がスライスベースド(slice-based)により構成されていることを示す。図40の例の図中上から2番目のアダプテーションセットの場合、この「Sub-Sample-Type」として、「2」が定義されている。
「Sub-Sample-is-extracted」は、当該アダプテーションセットが対応するビットストリームの一部がトラック(track)に分割(extract)されているかどうかを示す情報である。例えば、この値が「0」の場合、そのビットストリームの一部が分割されていない(false)ことを示し、この値が「1」の場合、そのビットストリームの一部がトラックに分割されている(true)ことを示す。図40の例の図中上から2番目のアダプテーションセットの場合、図39を参照して説明したようにトラックは1つである(分割されていない)ので、この「Sub-Sample-is-extracted」として、「0」が定義されている。
「ID」は、識別情報であり、「Sub-Sample-Type」として、「2」が定義されている場合、すなわち、タイルの場合、MP4ファイルのタイルリージョングループエントリ(TileRegionGroupEntry)のGroupIDが定義される。図40の例の図中上から2番目のアダプテーションセットの場合、当該ビットストリームの一部はタイル1(Tile1)のデータであるので、この「ID」として、「1」が定義されている。
つまり、図40の例の図中上から2番目のアダプテーションセットの場合、エッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,0,0,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,0,1">
同様にして、図40の例の図中上から3番目のアダプテーションセットの場合、エッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,960,0,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,0,2">
同様にして、図40の例の図中上から4番目のアダプテーションセットの場合、エッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,0,540,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,0,3">
同様にして、図40の例の図中一番下のアダプテーションセットの場合、エッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,960,540,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,0,4">
<1トラックの場合:MPDの利用>
なお、このような拡張されたMPDの生成は、第1の実施の形態の場合と同様に行うことができる。例えば、配信データ生成装置101(図12)が、配信データ生成処理(図14)を実行し、そのタイル型MPD生成部141(タイル型画像情報生成部124)(図12)が、タイル型MPDファイル生成処理(図15)を実行することにより、このような拡張されたMPDを生成する(MPDを拡張する)ことができる。したがって、この場合も、配信データ生成装置101は、配信サーバ102に、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)させることができる。すなわち、部分画像のデータの適応的な提供を実現することができる。
また、このような拡張されたMPDを利用した配信データの再生も、第1の実施の形態の場合と同様に行うことができる。例えば、端末装置103(図13)が配信データ再生処理(図16)を実行することにより、このような拡張されたMPDを正しく解析し、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、部分画像のデータの適応的な提供を実現することができる。
<1ファイル複数トラック(エクストラクタによる参照)の場合:MP4ファイル>
図41は、例えば図6のBのようなタイル(Tile)構造を有するビットストリーム(bitstream7)をファイル化したMP4ファイルの構成例を示す図である。図41の例の場合、図8のBの例と同様に、各タイルのビットストリームがまとめて1つのファイルとされ、さらに各タイルのデータが互いに異なるトラックとして管理されている。
図41の例の場合、トラック1(Track1)は、全体画像(1920x1080)のデータを管理しており、このトラック1(Track1)を再生することにより、その全体画像を再生することができる。また、トラック2(Track2)は、タイル1(Tile1)のデータを管理しており、このトラック2(Track2)を再生することにより、タイル1(Tile1)の画像を再生することができる。同様に、トラック3(Track3)は、タイル2(Tile2)のデータを管理しており、このトラック3(Track3)を再生することにより、タイル2(Tile2)の画像を再生することができる。同様に、トラック4(Track4)は、タイル3(Tile3)のデータを管理しており、このトラック4(Track4)を再生することにより、タイル3(Tile3)の画像を再生することができる。同様に、トラック5(Track5)は、タイル4(Tile4)のデータを管理しており、このトラック5(Track5)を再生することにより、タイル4(Tile4)の画像を再生することができる。
図41に示されるように、トラック1(Track1)には、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)等のパラメータセットや、SEI(Supplemental Enhancement Information)等の実体(実データとも称する)や、各タイルのビットストリームの参照情報(エクストラクタ(extractor)とも称する)等が格納される。
エクストラクタ(Track2)は、トラック2(Track2)に格納されるタイル1(Tile1)の実データ(Slice1)を参照するのに利用される情報(リファレンス情報)である。例えば、その実データ(Slice1)の格納場所を示す。同様に、エクストラクタ(Track3)は、トラック3(Track3)に格納されるタイル2(Tile2)の実データ(Slice2)のリファレンス情報であり、エクストラクタ(Track4)は、トラック4(Track4)に格納されるタイル3(Tile3)の実データ(Slice3)のリファレンス情報であり、エクストラクタ(Track5)は、トラック5(Track5)に格納されるタイル4(Tile4)の実データ(Slice4)のリファレンス情報である。
各パラメータセットやエクストラクタ等は、サンプルエントリ(Sample Entry)によりサンプル毎に管理される。
また、トラック2(Track2)には、パラメータセット等のエクストラクタ(Track1)や、タイル1(Tile1)の実データ(Slice1)等が格納される。パラメータセットのエクストラクタ(Track1)は、トラック1(Track1)に格納されるパラメータセット等の実データ(VPS,SPS,SEI,PPS等)のリファレンス情報である。例えば、その実データの格納場所を示す。
さらに、トラック3(Track3)には、パラメータセット等のエクストラクタ(Track1)や、タイル2(Tile2)の実データ(Slice2)等が格納される。トラック4(Track4)には、パラメータセット等のエクストラクタ(Track1)や、タイル3(Tile3)の実データ(Slice3)等が格納される。トラック5(Track5)には、パラメータセット等のエクストラクタ(Track1)や、タイル4(Tile4)の実データ(Slice4)等が格納される。
図39の場合と同様に、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいて、タイルリージョングループエントリ(TileRegionGroupEntry)が定義される。つまり、各トラックにおいて1つずつタイルの定義が行われている。
参照関係を示すエクストラクタは、サンプル毎に定義される。つまり、サンプル毎に参照関係を設定することができる。したがって、このエクストラクタを用いることにより、例えば、ビットストリーム中において参照関係を変更する等、より自由な参照関係を構築することができる。より具体的には、例えば、ビットストリーム中において、タイルの大きさや形状を変更すること等を容易に実現することができる。
なお、このMP4ファイルのファイル名をbitstream.mp4とする。
<1ファイル複数トラック(エクストラクタによる参照)の場合:MPD>
この場合のMPDも、上述した1トラックの場合と同様に、アダプテーションセット(AdaptationSet)のサプリメンタルプロパティ(SupplementalProperty)やエッセンシャルプロパティ(EssentialProperty)が拡張される。図42にその例を示す。
つまり、図42の例の場合も、全体画像並びに各タイルについて、それぞれ、互いに異なるアダプテーションセット(AdaptationSet)において定義されており、全体画像について定義する図中一番上のアダプテーションセットにおいては、タイル用のディスクリプションとして、第1の実施の形態において説明したビューポイント(Viewpoint)の代わりに、サプリメンタルプロパティ(SupplementalProperty)が定義される。
図42に示されるように、この場合も、図中一番上のアダプテーションセットのサプリメンタルプロパティは、例えば、以下のように定義される。
<SupplementalProperty schemeIdUri=" urn:mpeg:dash:srd:2013"
value="1,0,0,1920,1080,1920,1080,0">
また、図42の例の場合も、タイル1(Tile1)について定義する図中上から2番目のアダプテーションセットにおいては、タイル用のディスクリプションとして、第1の実施の形態において説明したビューポイント(Viewpoint)の代わりに、エッセンシャルプロパティ(EssentialProperty)が定義される。そして、そのビットストリームの一部についてのエッセンシャルプロパティが、さらに拡張されて定義される。
つまり、図42に示されるように、図中上から2番目のアダプテーションセットのエッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,0,0,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,1,1">
この場合、当該アダプテーションセットが対応するビットストリームの一部がトラック(track)に分割(extract)されている(すなわち、複数のトラックが形成されている)ので、「Sub-Sample-is-extracted」として、「1(true)」が定義されている。
同様にして、図42の例の図中上から3番目のアダプテーションセットのエッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,960,0,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,1,2">
同様にして、図42の例の図中上から4番目のアダプテーションセットのエッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,0,540,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,1,3">
同様にして、図42の例の図中一番下のアダプテーションセットのエッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,960,540,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,1,4">
<1ファイル複数トラック(エクストラクタによる参照)の場合:MPDの利用>
なお、このような拡張されたMPDの生成は、第1の実施の形態の場合と同様に行うことができる。例えば、配信データ生成装置101(図12)が、配信データ生成処理(図14)を実行し、そのタイル型MPD生成部141(タイル型画像情報生成部124)(図12)が、タイル型MPDファイル生成処理(図15)を実行することにより、このような拡張されたMPDを生成する(MPDを拡張する)ことができる。したがって、この場合も、配信データ生成装置101は、配信サーバ102に、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)させることができる。すなわち、部分画像のデータの適応的な提供を実現することができる。
また、このような拡張されたMPDを利用した配信データの再生も、第1の実施の形態の場合と同様に行うことができる。例えば、端末装置103(図13)が配信データ再生処理(図16)を実行することにより、このような拡張されたMPDを正しく解析し、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、部分画像のデータの適応的な提供を実現することができる。
<複数ファイル複数トラック(エクストラクタによる参照)の場合:MP4ファイル>
図43は、例えば図6のBのようなタイル(Tile)構造を有するビットストリーム(bitstream7)をファイル化したMP4ファイルの構成例を示す図である。図43の例の場合、図7の例と同様に、各タイルのビットストリームが互いに異なるファイルとして管理されている。各ファイルのトラックは互いに異なるので、各タイルのビットストリームは、互いに異なるトラックとして管理されているともいえる。
図43の一番上のMP4ファイル(MP4File)(すなわち、トラック1(Track1))は、全体画像(1920x1080)のデータを格納(管理)している。このMP4ファイル(すなわち、トラック1)を再生することにより、その全体画像を再生することができる。
また、図43の上から2番目のMP4ファイル(MP4File)(すなわち、トラック2(Track2))は、タイル1(Tile1)のデータを格納(管理)している。このMP4ファイル(すなわち、トラック2)を再生することにより、タイル1(Tile1)の画像を再生することができる。同様に、図43の上から3番目のMP4ファイル(MP4File)(すなわち、トラック3(Track3))は、タイル2(Tile2)のデータを格納(管理)している。このMP4ファイル(すなわち、トラック3)を再生することにより、タイル2(Tile2)の画像を再生することができる。同様に、図43の上から4番目のMP4ファイル(MP4File)(すなわち、トラック4(Track4))は、タイル3(Tile3)のデータを格納(管理)している。このMP4ファイル(すなわち、トラック4)を再生することにより、タイル3(Tile3)の画像を再生することができる。同様に、図43の一番下のMP4ファイル(MP4File)(すなわち、トラック5(Track5))は、タイル4(Tile4)のデータを格納(管理)している。このMP4ファイル(すなわち、トラック5)を再生することにより、タイル4(Tile4)の画像を再生することができる。
図43に示されるように、図43の一番上のMP4ファイル(トラック1)には、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)等のパラメータセットやSEI等の実データや、各タイルのビットストリームのエクストラクタ(Track2, Track3, Track4, Track5)等が格納される。これらの各パラメータセットやエクストラクタ等は、サンプルエントリ(Sample Entry)によりサンプル毎に管理される。
また、図43の上から2番目のMP4ファイル(トラック2)には、パラメータセット等のエクストラクタ(Track1)や、タイル1(Tile1)の実データ(Slice1)等が格納される。さらに、図43の上から3番目のMP4ファイル(トラック3)には、パラメータセット等のエクストラクタ(Track1)や、タイル2(Tile2)の実データ(Slice2)等が格納される。また、図43の上から4番目のMP4ファイル(トラック4)には、パラメータセット等のエクストラクタ(Track1)や、タイル3(Tile3)の実データ(Slice3)等が格納される。さらに、図43の一番下のMP4ファイル(トラック5)には、パラメータセット等のエクストラクタ(Track1)や、タイル4(Tile4)の実データ(Slice4)等が格納される。
図39の場合と同様に、これらのMP4ファイル(トラック2乃至トラック5)のそれぞれにおいて、タイルリージョングループエントリ(TileRegionGroupEntry)が定義される。つまり、各トラックにおいて1つずつタイルの定義が行われている。
以上のように、この例の場合も、参照関係を示す情報としてエクストラクタが用いられている。したがって、例えば、ビットストリーム中において参照関係を変更する等、より自由な参照関係を構築することができる。
なお、図43の一番上のMP4ファイルのファイル名をbitstream_base.mp4とし、図43の上から2番目のMP4ファイルのファイル名をbitstream_tile1.mp4とし、図43の上から3番目のMP4ファイルのファイル名をbitstream_tile2.mp4とし、図43の上から4番目のMP4ファイルのファイル名をbitstream_tile3.mp4とし、図43の一番下のMP4ファイルのファイル名をbitstream_tile4.mp4とする。
<複数ファイル複数トラック(エクストラクタによる参照)の場合:MPD>
この場合のMPDも、上述した1トラックの場合と同様に、アダプテーションセット(AdaptationSet)のサプリメンタルプロパティ(SupplementalProperty)やエッセンシャルプロパティ(EssentialProperty)が拡張される。図44にその例を示す。
つまり、図44の例の場合も、全体画像並びに各タイルについて、それぞれ、互いに異なるアダプテーションセット(AdaptationSet)において定義されており、全体画像について定義する図中一番上のアダプテーションセットにおいては、タイル用のディスクリプションとして、第1の実施の形態において説明したビューポイント(Viewpoint)の代わりに、サプリメンタルプロパティ(SupplementalProperty)が定義される。
図44に示されるように、この場合も、図中一番上のアダプテーションセットのサプリメンタルプロパティは、例えば、以下のように定義される。
<SupplementalProperty schemeIdUri=" urn:mpeg:dash:srd:2013"
value="1,0,0,1920,1080,1920,1080,0">
なお、この場合、アダプテーションセットに属するリプレゼンテーション(Representation)も拡張され、ファイル(タイル)間の依存関係を示す情報が追加定義される。
図44に示されるように、図中一番上のアダプテーションセットに属するリプレゼンテーションには、例えば、以下のような情報が定義される。
<id="bs" dependencyId="tl1.tl2.tl3.tl4">
また、そのリプレゼンテーションに属するセグメント(Segment)には、bitstream_base.mp4が定義される。
また、図44の例の場合も、タイル1(Tile1)について定義する図中上から2番目のアダプテーションセットにおいては、タイル用のディスクリプションとして、第1の実施の形態において説明したビューポイント(Viewpoint)の代わりに、エッセンシャルプロパティ(EssentialProperty)が定義される。そして、そのビットストリームの一部についてのエッセンシャルプロパティが、さらに拡張されて定義される。
つまり、図44に示されるように、図中上から2番目のアダプテーションセットのエッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,0,0,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,1">
この場合、当該アダプテーションセットが対応するビットストリームがトラック(track)に分割(extract)されたHEVC Tileである(すなわち、複数のトラック(複数のファイル)が形成されている)ので、「Sub-Sample-is-extracted」として、「1(true)」が定義されている。
また、この場合、ファイル分割されており、1ファイルには1トラックしか含まれないので、「ID」は省略される。したがって、その分、情報量の増大が抑制される。
そして、図44に示されるように、このアダプテーションセットに属するリプレゼンテーションには、例えば、以下のような情報が定義される。
<id="tl1" dependencyId="be">
また、そのリプレゼンテーションに属するセグメント(Segment)には、bitstream_tile1.mp4が定義される。
同様にして、図44の例の図中上から3番目のアダプテーションセットのエッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,960,0,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,1">
そして、このアダプテーションセットに属するリプレゼンテーションには、例えば、以下のような情報が定義される。
<id="tl2" dependencyId="be">
また、そのリプレゼンテーションに属するセグメント(Segment)には、bitstream_tile2.mp4が定義される。
同様にして、図44の例の図中上から4番目のアダプテーションセットのエッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,0,540,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,1">
そして、このアダプテーションセットに属するリプレゼンテーションには、例えば、以下のような情報が定義される。
<id="tl3" dependencyId="be">
また、そのリプレゼンテーションに属するセグメント(Segment)には、bitstream_tile3.mp4が定義される。
同様にして、図44の例の図中一番下のアダプテーションセットのエッセンシャルプロパティは、例えば、以下のように定義される。
<EssentialProperty schemeIdUri="urn:mpeg:dash:srd:2013"
value="1,960,540,960,540,1920,1080,1">
<EssentialProperty schemeIdUri="urn:mpeg:dash:hevc:2013" value="2,1">
そして、このアダプテーションセットに属するリプレゼンテーションには、例えば、以下のような情報が定義される。
<id="tl4" dependencyId="be">
また、そのリプレゼンテーションに属するセグメント(Segment)には、bitstream_tile4.mp4が定義される。
<複数ファイル複数トラック(エクストラクタによる参照)の場合:MPDの利用>
なお、このような拡張されたMPDの生成は、第1の実施の形態の場合と同様に行うことができる。例えば、配信データ生成装置101(図12)が、配信データ生成処理(図14)を実行し、そのタイル型MPD生成部141(タイル型画像情報生成部124)(図12)が、タイル型MPDファイル生成処理(図15)を実行することにより、このような拡張されたMPDを生成する(MPDを拡張する)ことができる。したがって、この場合も、配信データ生成装置101は、配信サーバ102に、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)させることができる。すなわち、部分画像のデータの適応的な提供を実現することができる。
また、このような拡張されたMPDを利用した配信データの再生も、第1の実施の形態の場合と同様に行うことができる。例えば、端末装置103(図13)が配信データ再生処理(図16)を実行することにより、このような拡張されたMPDを正しく解析し、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、部分画像のデータの適応的な提供を実現することができる。
<1ファイル複数トラック(トラックリファレンスによる参照)の場合:MP4ファイル>
図45は、例えば図6のBのようなタイル(Tile)構造を有するビットストリーム(bitstream7)をファイル化したMP4ファイルの構成例を示す図である。図45の例の場合、図41の例と同様に、各タイルのビットストリームがまとめて1つのファイルとされ、さらに各タイルのデータが互いに異なるトラックとして管理されている。
ただし、図41の例の場合、トラック間におけるデータの参照関係は、エクストラクタを用いて定義されているが、図45の例の場合、トラックリファレンス(Track Reference)を用いて行う。
トラックリファレンス(Track Reference)は、トラック同士の参照関係(どのトラックがどのトラックを参照するか(若しくはどのトラックから参照されるか))を示す情報である。つまり、トラックリファレンスは、トラック単位の情報であり、1トラックにつき1回定義される。「dpnd」は、当該トラックを参照するトラック(すなわち参照元)を定義する情報であり、「prnt」は、当該トラックが参照するトラック(すなわち参照先)を定義する情報である。
例えば、図45の例の場合、トラック1(Track1)においては、トラックリファレンス(Track Reference)として、「dpnd=2,3,4,5」が定義されている。これは、トラック1が、トラック2乃至トラック5によって参照されることを示す。同様に、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいては、トラックリファレンス(Track Reference)として、「prnt=1」が定義されている。これは、これらのトラックが、トラック1を参照することを示す。つまり、これらのトラックリファレンスによって、トラック2乃至トラック5のいずれか(いずれかのタイル)を再生する際に、トラック1の情報(パラメータセット等)が参照されることが示されている。
上述したように、エクストラクタ(extractor)は、サンプル毎に定義されるため、参照関係の設定の自由度が向上するが、参照関係が固定の場合、そのエクストラクタの冗長性が増大し、情報量が不要に増大する可能性があった。例えば、ビットストリーム中において、各タイルのサイズや形状が一定の場合、参照関係は1度示されれば十分である。
これに対して、トラックリファレンス(Track Reference)は、上述したように、1トラックにつき1回のみ定義される。したがって、このようなトラックリファレンスを用いることにより、参照関係の定義の冗長性を低減させ、不要な情報量の増大を抑制することができる。
なお、この例の場合、トラック1(Track1)は、パラメータセット等を格納するためだけに存在し、このトラック1の再生(全体画像(1920x1080)の再生)を行うことはできない。ただし、トラックリファレンスの順序に従って、トラック2からトラック5の実データを再生することで、全体画像を再生することができる。
また、図39の場合と同様に、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいて、タイルリージョングループエントリ(TileRegionGroupEntry)が定義される。つまり、各トラックにおいて1つずつタイルの定義が行われている。
なお、このMP4ファイルのファイル名をbitstream.mp4とする。
<1ファイル複数トラック(トラックリファレンスによる参照)の場合:MPD>
この場合のMPDも、上述したエクストラクタによる参照の場合と同様に、アダプテーションセット(AdaptationSet)のサプリメンタルプロパティ(SupplementalProperty)やエッセンシャルプロパティ(EssentialProperty)が拡張される。図46にその例を示す。
つまり、図46に示されるように、この場合、図42の例と同様のMPDによりMP4ファイルを管理することができる。
<1ファイル複数トラック(トラックリファレンスによる参照)の場合:MPDの利用>
なお、このような拡張されたMPDの生成は、第1の実施の形態の場合と同様に行うことができる。例えば、配信データ生成装置101(図12)が、配信データ生成処理(図14)を実行し、そのタイル型MPD生成部141(タイル型画像情報生成部124)(図12)が、タイル型MPDファイル生成処理(図15)を実行することにより、このような拡張されたMPDを生成する(MPDを拡張する)ことができる。したがって、この場合も、配信データ生成装置101は、配信サーバ102に、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)させることができる。すなわち、部分画像のデータの適応的な提供を実現することができる。
また、このような拡張されたMPDを利用した配信データの再生も、第1の実施の形態の場合と同様に行うことができる。例えば、端末装置103(図13)が配信データ再生処理(図16)を実行することにより、このような拡張されたMPDを正しく解析し、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、部分画像のデータの適応的な提供を実現することができる。
<複数ファイル複数トラック(トラックリファレンスによる参照)の場合:MP4ファイル>
図47は、例えば図6のBのようなタイル(Tile)構造を有するビットストリーム(bitstream7)をファイル化したMP4ファイルの構成例を示す図である。図47の例の場合、図43の例と同様に、各タイルのビットストリームが互いに異なるファイルとして管理されている。各ファイルのトラックは互いに異なるので、各タイルのビットストリームは、互いに異なるトラックとして管理されているともいえる。
図47の一番上のMP4ファイル(MP4File)(すなわち、トラック1(Track1))は、パラメータセット等(VPS,SPS,PPS,SEI等)を格納(管理)している。
また、図47の上から2番目乃至5番目のMP4ファイル(MP4File)(すなわち、トラック2(Track2)乃至トラック5(Track))は、タイル1(Tile1)乃至タイル4(Tile4)のデータを格納(管理)している。これらの内いずれかのMP4ファイル(すなわち、いずれかのトラック)を再生することにより、いずれかのタイルの画像を再生することができる。
ただし、図43の例の場合、トラック間におけるデータの参照関係は、エクストラクタを用いて定義されているが、図47の例の場合、図45の場合と同様にトラックリファレンス(Track Reference)を用いて行う。
例えば、図47の例の場合、トラック1(Track1)においては、トラックリファレンス(Track Reference)として、「dpnd=2,3,4,5」が定義されている。これは、トラック1が、トラック2乃至トラック5によって参照されることを示す。同様に、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいては、トラックリファレンス(Track Reference)として、「prnt=1」が定義されている。これは、これらのトラックが、トラック1を参照することを示す。つまり、これらのトラックリファレンスによって、トラック2乃至トラック5のいずれか(いずれかのタイル)を再生する際に、トラック1の情報(パラメータセット等)が参照されることが示されている。
なお、図39の場合と同様に、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいて、タイルリージョングループエントリ(TileRegionGroupEntry)が定義される。つまり、各トラックにおいて1つずつタイルの定義が行われている。
以上のように、この例の場合も、参照関係を示す情報としてトラックリファレンスが用いられている。したがって、参照関係の定義の冗長性を低減させ、不要な情報量の増大を抑制することができる。
なお、図47の各MP4ファイルのファイル名を上から順に、bitstream_base.mp4、bitstream_tile1.mp4、bitstream_tile2.mp4、bitstream_tile3.mp4、bitstream_tile4.mp4とする。
<複数ファイル複数トラック(トラックリファレンスによる参照)の場合:MPD>
この場合のMPDも、上述したエクストラクタによる参照の場合と同様に、アダプテーションセット(AdaptationSet)のサプリメンタルプロパティ(SupplementalProperty)やエッセンシャルプロパティ(EssentialProperty)が拡張される。図48にその例を示す。
つまり、図48に示されるように、この場合、図44の例と同様のMPDによりMP4ファイルを管理することができる。
<複数ファイル複数トラック(トラックリファレンスによる参照)の場合:MPDの利用>
なお、このような拡張されたMPDの生成は、第1の実施の形態の場合と同様に行うことができる。例えば、配信データ生成装置101(図12)が、配信データ生成処理(図14)を実行し、そのタイル型MPD生成部141(タイル型画像情報生成部124)(図12)が、タイル型MPDファイル生成処理(図15)を実行することにより、このような拡張されたMPDを生成する(MPDを拡張する)ことができる。したがって、この場合も、配信データ生成装置101は、配信サーバ102に、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)させることができる。すなわち、部分画像のデータの適応的な提供を実現することができる。
また、このような拡張されたMPDを利用した配信データの再生も、第1の実施の形態の場合と同様に行うことができる。例えば、端末装置103(図13)が配信データ再生処理(図16)を実行することにより、このような拡張されたMPDを正しく解析し、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、部分画像のデータの適応的な提供を実現することができる。
<1ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MP4ファイル>
図49は、例えば図6のBのようなタイル(Tile)構造を有するビットストリーム(bitstream7)をファイル化したMP4ファイルの構成例を示す図である。図49の例の場合、図41や図45の例と同様に、各タイルのビットストリームがまとめて1つのファイルとされ、さらに各タイルのデータが互いに異なるトラックとして管理されている。
ただし、図41の例の場合、トラック間におけるデータの参照関係は、エクストラクタを用いて定義され、図45の例の場合、トラック間におけるデータの参照関係は、トラックリファレンスを用いて定義されているが、図49の例の場合、エクストラクタとトラックリファレンスの両方を用いて行う。
より具体的には、トラック1(Track1)は、図41の場合と同様にエクストラクタを用いてトラック2(Track2)乃至トラック5(Track5)の情報を参照し、トラック2(Track2)乃至トラック5(Track5)は、図45の場合と同様にトラックリファレンスを用いてトラック1(Track1)の情報を参照するようになされている。
つまり、図49に示されるように、トラック1(Track1)には、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)等のパラメータセットやSEI等の実データや、トラック2乃至トラック5のタイルのデータを参照するためのエクストラクタ等が格納される。
また、図49に示されるように、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいては、トラックリファレンス(Track Reference)として、「prnt=1」が定義されている。これは、これらのトラックが、トラック1を参照することを示す。つまり、これらのトラックリファレンスによって、トラック2乃至トラック5のいずれか(いずれかのタイル)を再生する際に、トラック1の情報(パラメータセット等)が参照されることが示されている。
このようにすることにより、図45の場合のように冗長性を低減しながら、図41の場合のように、このトラック1の再生(全体画像(1920x1080)の再生)を行うことができるようにすることができる。
また、図39の場合と同様に、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいて、タイルリージョングループエントリ(TileRegionGroupEntry)が定義される。つまり、各トラックにおいて1つずつタイルの定義が行われている。
なお、このMP4ファイルのファイル名をbitstream.mp4とする。
<1ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MPD>
この場合のMPDも、上述したエクストラクタによる参照の場合(図42)やトラックリファレンスによる参照の場合(図46)と同様に、アダプテーションセット(AdaptationSet)のサプリメンタルプロパティ(SupplementalProperty)やエッセンシャルプロパティ(EssentialProperty)が拡張される。図50にその例を示す。
つまり、図50に示されるように、この場合、図42や図46の例と同様のMPDによりMP4ファイルを管理することができる。
<1ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MPDの利用>
なお、このような拡張されたMPDの生成は、第1の実施の形態の場合と同様に行うことができる。例えば、配信データ生成装置101(図12)が、配信データ生成処理(図14)を実行し、そのタイル型MPD生成部141(タイル型画像情報生成部124)(図12)が、タイル型MPDファイル生成処理(図15)を実行することにより、このような拡張されたMPDを生成する(MPDを拡張する)ことができる。したがって、この場合も、配信データ生成装置101は、配信サーバ102に、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)させることができる。すなわち、部分画像のデータの適応的な提供を実現することができる。
また、このような拡張されたMPDを利用した配信データの再生も、第1の実施の形態の場合と同様に行うことができる。例えば、端末装置103(図13)が配信データ再生処理(図16)を実行することにより、このような拡張されたMPDを正しく解析し、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、部分画像のデータの適応的な提供を実現することができる。
<複数ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MP4ファイル>
図51は、例えば図6のBのようなタイル(Tile)構造を有するビットストリーム(bitstream7)をファイル化したMP4ファイルの構成例を示す図である。図51の例の場合、図43や図47の例と同様に、各タイルのビットストリームが互いに異なるファイルとして管理されている。各ファイルのトラックは互いに異なるので、各タイルのビットストリームは、互いに異なるトラックとして管理されているともいえる。
ただし、図43の例の場合、トラック間におけるデータの参照関係は、エクストラクタを用いて定義され、図47の例の場合、トラック間におけるデータの参照関係は、トラックリファレンスを用いて定義されているが、図51の例の場合、エクストラクタとトラックリファレンスの両方を用いて行う。
より具体的には、図51の一番上のMP4ファイル(トラック1(Track1))は、図43の場合と同様にエクストラクタを用いて図51の上から2番目乃至5番目のMP4ファイル(トラック2(Track2)乃至トラック5(Track5))の情報を参照し、図51の上から2番目乃至5番目のMP4ファイル(トラック2(Track2)乃至トラック5(Track5))は、図47の場合と同様にトラックリファレンスを用いて、図51の一番上のMP4ファイル(トラック1(Track1))の情報を参照するようになされている。
つまり、図51に示されるように、一番上のMP4ファイル(トラック1)には、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)等のパラメータセットやSEI等の実データや、各タイルのビットストリームのエクストラクタ(Track2, Track3, Track4, Track5)等が格納される。これらの各パラメータセットやエクストラクタ等は、サンプルエントリ(Sample Entry)によりサンプル毎に管理される。
また、図51に示されるように、上から2番目乃至5番目のMP4ファイル(トラック2(Track2)乃至トラック5(Track5))のそれぞれにおいては、トラックリファレンス(Track Reference)として、「prnt=1」が定義されている。これは、これらのトラックが、トラック1を参照することを示す。つまり、これらのトラックリファレンスによって、トラック2乃至トラック5のいずれか(いずれかのタイル)を再生する際に、トラック1の情報(パラメータセット等)が参照されることが示されている。
このようにすることにより、図47の場合のように冗長性を低減しながら、図43の場合のように、図51の一番上のMP4ファイル(トラック1)の再生(全体画像(1920x1080)の再生)を行うことができるようにすることができる。
また、図39の場合と同様に、上から2番目乃至5番目のMP4ファイル(トラック2(Track2)乃至トラック5(Track5))のそれぞれにおいて、タイルリージョングループエントリ(TileRegionGroupEntry)が定義される。つまり、各トラックにおいて1つずつタイルの定義が行われている。
なお、図51の各MP4ファイルのファイル名を上から順に、bitstream_base.mp4、bitstream_tile1.mp4、bitstream_tile2.mp4、bitstream_tile3.mp4、bitstream_tile4.mp4とする。
<複数ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MPD>
この場合のMPDも、上述したエクストラクタによ る参照の場合と同様に、アダプテーションセット(AdaptationSet)のサプリメンタルプロパティ(SupplementalProperty)やエッセンシャルプロパティ(EssentialProperty)が拡張される。図52にその例を示す。
つまり、図52に示されるように、この場合、図44や図48の例と同様のMPDによりMP4ファイルを管理することができる。
<複数ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MPDの利用>
なお、このような拡張されたMPDの生成は、第1の実施の形態の場合と同様に行うことができる。例えば、配信データ生成装置101(図12)が、配信データ生成処理(図14)を実行し、そのタイル型MPD生成部141(タイル型画像情報生成部124)(図12)が、タイル型MPDファイル生成処理(図15)を実行することにより、このような拡張されたMPDを生成する(MPDを拡張する)ことができる。したがって、この場合も、配信データ生成装置101は、配信サーバ102に、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)させることができる。すなわち、部分画像のデータの適応的な提供を実現することができる。
また、このような拡張されたMPDを利用した配信データの再生も、第1の実施の形態の場合と同様に行うことができる。例えば、端末装置103(図13)が配信データ再生処理(図16)を実行することにより、このような拡張されたMPDを正しく解析し、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、部分画像のデータの適応的な提供を実現することができる。
<1ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MP4ファイル>
以上の図41、図45および図49に示した、1個のMP4ファイルが複数トラックを有する例においては、実データであるスライスsliceを、タイル毎に異なるトラックに格納している。しかし、1個のMP4ファイルが複数トラックを有する場合において、各タイルのsliceを1つのトラックにまとめて配置することもできる。この場合の例を図53を参照して以下に説明する。
図53は、例えば図6のBのようなタイル(Tile)構造を有するビットストリーム(bitstream7)をファイル化したMP4ファイルの構成例を示す図である。図53の例の場合、図41、図45および図49の例と同様に、各タイルのビットストリームがまとめて1つのMP4ファイルとされ、さらに各タイルは互いに異なるトラックで管理されている。ただし、図53のMP4ファイルにおいては、各タイルの実データである各sliceが1つのトラックにまとめて格納されている。
図41の例の場合、トラック間におけるデータの参照関係は、エクストラクタを用いて定義され、図45の例の場合、トラック間におけるデータの参照関係は、トラックリファレンスを用いて定義されている。これに対して図53の例の場合、図49の例と同様に、エクストラクタとトラックリファレンスの両方が用いられる。ただし、エクストラクタとトラックリファレンスを用いる方法が、図49の場合と異なっている。
より具体的には、図53に示されるように、ベーストラックであるトラック1(Track1)には、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)等のパラメータセットやSEI等の実データが格納されている。ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)等のパラメータセットは、サンプルエントリ(Sample Entry)によりサンプル毎に管理される。さらにトラック1(Track1)には、HEVCのタイルの実データであるスライスslice1乃至slice4等が格納されている。
トラック2(Track2)乃至トラック5(Track5)は、トラック1(Track1)の情報を参照するために、エクストラクタとトラックリファレンスの両方を有している。
すなわち、図53に示されるように、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいては、トラックリファレンス(Track Reference)として、「prnt=1」が定義されている。これは、これらのトラックが、トラック1を参照することを示す。つまり、これらのトラックリファレンスによって、トラック2乃至トラック5のいずれか(いずれかのタイル)を再生する際に、トラック1の情報(パラメータセット等)が参照されることになる。
また、トラック2(Track2)乃至トラック5(Track5)のそれぞれには、エクストラクタとして、「ext1」が定義されている。つまり、これらのエクストラクタによって、例えばトラック2のタイルを再生する場合、トラック1のスライスslice1が参照される。同様に、トラック3のタイルを再生する場合、トラック1のスライスslice2が参照される。さらに、トラック4のタイルを再生する場合、トラック1のスライスslice3が参照され、トラック5のタイルを再生する場合、トラック1のスライスslice4が参照される。
このようにすることにより、全体画像(1920x1080)の再生を行う場合、トラック1だけを再生すればよく、全体画像を再生する場合の負荷を軽減することができる。
また、図39、図41、図43、図45、図47、図49、および図51の場合と同様に、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいて、タイルリージョングループエントリ(TileRegionGroupEntry)が定義される。つまり、各トラックにおいて1つずつタイルの定義が行われている。その定義は、図41、図43、図45、図47、図49、および図51の各トラックの場合(図39の各タイルの場合)と同様である。
なお、このMP4ファイルのファイル名をbitstream.mp4とする。
<1ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MPD>
図53のMP4ファイルのMPDが図54に示される。このMPDにおいても、図41、図45および図49のMP4ファイルにそれぞれ対応する図42、図46および図50のMPDと同様の拡張が行われる。すなわち、アダプテーションセット(AdaptationSet)のサプリメンタルプロパティ(SupplementalProperty)やエッセンシャルプロパティ(EssentialProperty)が拡張される。
図54のMPDは、基本的に図42、図46および図50のMPDと同様に構成されているが、図54のMPDにおいては、各RepresentationにIDが格納されている点が、それらのMPDと異なっている。図54において最も上側に位置するRepresentationには、ベーストラックであることを意味するID(bs)が格納されており、上から2番目のRepresentationには、タイル1のIDを意味するID(tl1)が格納されている。以下同様に、3番目乃至5番目のRepresentationには、それぞれタイル2乃至タイル4のIDを意味するID(tl2乃至tl4)が格納されている。
さらに上から2番目のRepresentationには、ベーストラックに依存するトラックであることを意味するID(dependencyid=bs)が格納されている。同様に、3番目乃至5番目のRepresentationにも、それぞれベーストラックに依存するトラックであることを意味するID(dependencyid=bs)が格納されている。
図54のMPDにより図53のMP4ファイルを管理することができる。
<複数ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MPDの利用>
なお、このような拡張されたMPDの生成は、第1の実施の形態の場合と同様に行うことができる。例えば、配信データ生成装置101(図12)が、配信データ生成処理(図14)を実行し、そのタイル型MPD生成部141(タイル型画像情報生成部124)(図12)が、タイル型MPDファイル生成処理(図15)を実行することにより、このような拡張されたMPDを生成する(MPDを拡張する)ことができる。したがって、この場合も、配信データ生成装置101は、配信サーバ102に、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)させることができる。すなわち、部分画像のデータの適応的な提供を実現することができる。
また、このような拡張されたMPDを利用した配信データの再生も、第1の実施の形態の場合と同様に行うことができる。例えば、端末装置103(図13)が配信データ再生処理(図16)を実行することにより、このような拡張されたMPDを正しく解析し、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、部分画像のデータの適応的な提供を実現することができる。
<複数ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MP4ファイル>
図55は、例えば図6のBのようなタイル(Tile)構造を有するビットストリーム(bitstream7)をファイル化したMP4ファイルの構成例を示す図である。図55の例の場合、図43、図47および図51の例と同様に、各タイルのトラックがそれぞれ異なるMP4ファイルとされ、さらに各タイルの実データである各sliceがベーストラックであるトラック1(Track1)にまとめて格納されている。
図41の例の場合、トラック間におけるデータの参照関係は、エクストラクタを用いて定義され、図45の例の場合、トラック間におけるデータの参照関係は、トラックリファレンスを用いて定義されている。これに対して図55の例の場合、図49の例と同様に、エクストラクタとトラックリファレンスの両方が用いられる。ただし、エクストラクタとトラックリファレンスを用いる方法が、図53の場合と同様に、図49の場合と異なっている。
具体的には、図55に示されるように、トラック1(Track1)には、ビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)等のパラメータセットやSEI等の実データが格納されている。さらにトラック1(Track1)には、HEVCのタイルの実データであるスライスslice1乃至slice4等が格納されている。トラック2(Track2)乃至トラック5(Track5)は、トラック1(Track1)の情報を参照するために、エクストラクタとトラックリファレンスの両方を有している。
すなわち、図55に示されるように、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいては、トラックリファレンス(Track Reference)として、「prnt=1」が定義されている。これは、これらのトラックが、トラック1を参照することを示す。つまり、これらのトラックリファレンスによって、トラック2乃至トラック5のいずれか(いずれかのタイル)を再生する際に、トラック1の情報(パラメータセット等)が参照されることになる。
また、トラック2(Track2)乃至トラック5(Track5)のそれぞれには、エクストラクタとして、「ext1」が定義されている。つまり、これらのエクストラクタによって、例えばトラック2のタイルを再生する場合、トラック1のスライスslice1が参照される。同様に、トラック3のタイルを再生する場合、トラック1のスライスslice2が参照される。さらに、トラック4のタイルを再生する場合、トラック1のスライスslice3が参照され、トラック5のタイルを再生する場合、トラック1のスライスslice4が参照される。
このようにすることにより、全体画像(1920x1080)の再生を行う場合、トラック1だけを再生すればよく、全体画像を再生する場合の負荷を軽減することができる。
また、図55においても、図39、図41、図43、図45、図47、図49、図51および図53の場合と同様に、トラック2(Track2)乃至トラック5(Track5)のそれぞれにおいて、タイルリージョングループエントリ(TileRegionGroupEntry)が定義される。つまり、各トラックにおいて1つずつタイルの定義が行われている。その内容は、図39等と同様である。
このように、図55のMP4ファイルは、図53の例では個別とされていたMP4ファイルを1つのMP4ファイルとしてまとめた点を除き、その基本的構成が図53のMP4ファイルと同様である。
なお、図55の各MP4ファイルのファイル名を上から順に、bitstream_base.mp4、bitstream_tile1.mp4、bitstream_tile2.mp4、bitstream_tile3.mp4、bitstream_tile4.mp4とする。
<複数ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MPD>
図55のMP4ファイルのMPDも、上述したエクストラクタによる参照の場合と同様に、アダプテーションセット(AdaptationSet)のサプリメンタルプロパティ(SupplementalProperty)やエッセンシャルプロパティ(EssentialProperty)が拡張される。図56にその例を示す。図56のMPDは、図54のMPDと同様に構成されている。
図56のMPDにより図55のMP4ファイルを管理することができる。
<複数ファイル複数トラック(トラックリファレンスとエクストラクタによる参照)の場合:MPDの利用>
なお、このような拡張されたMPDの生成は、第1の実施の形態の場合と同様に行うことができる。例えば、配信データ生成装置101(図12)が、配信データ生成処理(図14)を実行し、そのタイル型MPD生成部141(タイル型画像情報生成部124)(図12)が、タイル型MPDファイル生成処理(図15)を実行することにより、このような拡張されたMPDを生成する(MPDを拡張する)ことができる。したがって、この場合も、配信データ生成装置101は、配信サーバ102に、部分画像のデータを、DASH規格に準拠して適応的に配信(提供)させることができる。すなわち、部分画像のデータの適応的な提供を実現することができる。
また、このような拡張されたMPDを利用した配信データの再生も、第1の実施の形態の場合と同様に行うことができる。例えば、端末装置103(図13)が配信データ再生処理(図16)を実行することにより、このような拡張されたMPDを正しく解析し、配信サーバ102による部分画像のデータのDASH規格に準拠した適応的な配信(提供)を受けることができる。つまり、配信サーバ102から正しく部分画像のデータを取得し、再生することができる。つまり、部分画像のデータの適応的な提供を実現することができる。
このように、図53乃至図56の例においては、部分画像情報がトラックリファレンスとエクストラクタを含み、トラックリファレンスとエクストラクタは、複数の部分画像のそれぞれに対応する各トラックに格納され、部分画像のスライスを格納するトラックを参照する。
本技術の適用範囲は、部分画像を提供したり、または、受け取ったりすることができるあらゆる情報処理装置に適用することができる。
<6.第6の実施の形態>
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
図57は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
図57に示されるコンピュータ500において、CPU(Central Processing Unit)501、ROM(Read Only Memory)502、RAM(Random Access Memory)503は、バス504を介して相互に接続されている。
バス504にはまた、入出力インタフェース510も接続されている。入出力インタフェース510には、入力部511、出力部512、記憶部513、通信部514、およびドライブ515が接続されている。
入力部511は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部512は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部513は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部514は、例えば、ネットワークインタフェースよりなる。ドライブ515は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア521を駆動する。
以上のように構成されるコンピュータでは、CPU501が、例えば、記憶部513に記憶されているプログラムを、入出力インタフェース510およびバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。RAM503にはまた、CPU501が各種の処理を実行する上において必要なデータなども適宜記憶される。
コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア521に記録して適用することができる。その場合、プログラムは、リムーバブルメディア521をドライブ515に装着することにより、入出力インタフェース510を介して、記憶部513にインストールすることができる。
また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部514で受信し、記憶部513にインストールすることができる。
その他、このプログラムは、ROM502や記憶部513に、あらかじめインストールしておくこともできる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
<7.第7の実施の形態>
<多視点画像符号化・多視点画像復号の適用>
上述した一連の処理に関わる画像符号化・画像復号の方式として、多視点画像符号化・多視点画像復号を適用することができる。図58は、多視点画像符号化方式の一例を示す。
図58に示されるように、多視点画像は、複数の視点(ビュー(view))の画像を含む。この多視点画像の複数のビューは、他のビューの画像を利用せずに自身のビューの画像のみを用いて符号化・復号を行うベースビューと、他のビューの画像を利用して符号化・復号を行うノンベースビューとによりなる。ノンベースビューは、ベースビューの画像を利用するようにしても良いし、他のノンベースビューの画像を利用するようにしてもよい。
図58のような多視点画像の配信において、上述した各実施の形態の方法を適用するようにしてもよい。このようにすることにより、多視点画像についても、部分画像のデータの適応的な提供を実現することができる。
さらに、上述した各実施の形態の方法で使用されるフラグやパラメータ(例えば、符号化情報としてのVPS,SPS等)等の符号化・復号に必要な情報を、各ビューの符号化・復号において共有するようにしてもよい。このようにすることにより、冗長な情報の伝送を抑制し、符号化効率の低減を抑制することができる。
<多視点画像符号化装置>
図59は、上述した多視点画像符号化を行う多視点画像符号化装置を示す図である。図59に示されるように、多視点画像符号化装置600は、符号化部601、符号化部602、および多重化部603を有する。
符号化部601は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部602は、ノンベースビュー画像を符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部603は、符号化部601において生成されたベースビュー画像符号化ストリームと、符号化部602において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。
このような多視点画像符号化装置600を、例えば、配信データ生成装置101(図11)の画像符号化部122(の符号化処理部の1つ)(図12)として適用するようにしてもよい。このようにすることにより、多視点画像の配信においても、上述した各実施の形態の方法を適用することができ、部分画像のデータの適応的な提供を実現することができる。
<多視点画像復号装置>
図60は、上述した多視点画像復号を行う多視点画像復号装置を示す図である。図60に示されるように、多視点画像復号装置610は、逆多重化部611、復号部612、および復号部613を有する。
逆多重化部611は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部612は、逆多重化部611により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部613は、逆多重化部611により抽出されたノンベースビュー画像符号化ストリームを復号し、ノンベースビュー画像を得る。
このような多視点画像復号装置610を、例えば、端末装置103(図11)の画像復号部155(の復号処理部の1つ)として適用するようにしてもよい。このようにすることにより、多視点画像の配信においても、上述した各実施の形態の方法を適用することができ、部分画像のデータの適応的な提供を実現することができる。
<8.第8の実施の形態>
<階層画像符号化・階層画像復号の適用>
上述した一連の処理に関わる画像符号化・画像復号の方式として、階層画像符号化・階層画像復号(スケーラブル符号化・スケーラブル復号)を適用することができる。図61は、階層画像符号化方式の一例を示す。
階層画像符号化(スケーラブル符号化)は、画像データを、所定のパラメータについてスケーラブル(scalable)機能を有するように、画像を複数レイヤ化(階層化)し、レイヤ毎に符号化するものである。階層画像復号(スケーラブル復号)は、その階層画像符号化に対応する復号である。
画像の階層化は、画像に関するパラメータであって、スケーラブル機能を有する所定のパラメータを変化させることにより行われる。つまり、図61に示されるように、階層化された画像(階層画像)は、スケーラブル機能を有する所定のパラメータの値が互いに異なる複数の画像により構成される。それらの複数の画像の各画像がそれぞれ階層(レイヤ)とされる。
階層画像の複数のレイヤは、符号化・復号の際に他のレイヤの情報を利用せずに自身のレイヤの情報のみを用いるベースレイヤと、符号化・復号の際に他のレイヤの情報を利用することができるノンベースレイヤ(エンハンスメントレイヤとも称する)とによりなる。ノンベースレイヤは、ベースレイヤの情報を利用することもできるし、他のノンベースレイヤの情報を利用することもできる。
階層画像符号化は、このような階層画像を符号化する処理である。例えば、ベースレイヤの画像がベースレイヤの情報のみを用いて符号化され、ベースレイヤの符号化データが生成される。また、例えば、ノンベースレイヤの画像がベースレイヤの情報とノンベースレイヤの情報を用いて符号化され、ノンベースレイヤの符号化データが生成される。
階層画像復号は、階層画像符号化された符号化データを復号し、任意のレイヤの復号画像を生成する処理である。例えば、ベースレイヤの符号化データが復号され、ベースレイヤの復号画像が生成される。また、例えば、ベースレイヤの符号化データが復号され、そのベースレイヤの情報を用いてノンベースレイヤの符号化データが復号され、ノンベースレイヤの復号画像が生成される。
このように、階層符号化により符号化データがレイヤ毎に分けて生成されるので、復号の際には、必ずしも全てのレイヤの符号化データが必要では無く、所望の復号画像を得るために必要なレイヤの符号化データのみが得られればよい。したがって、符号化側から復号側へのデータ伝送量の増大を抑制することができる。
なお、このような符号化・復号に用いられる他のレイヤの情報は任意であるが、例えば、画像(例えば復号画像)であってもよい。例えば、他のレイヤの画像を用いてレイヤ間での予測を行うようにしてもよい。このようにすることにより、レイヤ間の冗長性を低減させることができる。特にノンベースレイヤの符号量の増大を抑制することができる。なお、このようなレイヤ間の情報の利用(例えば、レイヤ間予測等)は、動画像の全てのピクチャにおいて行われるようにしてもよいし、図61に示されるように、一部のピクチャにおいて行われるようにしてもよい。
上述したように、階層画像の各レイヤの画像は、スケーラブル機能を有する所定のパラメータについて品質が互いに異なる。つまり、階層画像を階層画像符号化・階層画像復号することにより、状況に応じて多様な品質の画像を容易に得ることができる。各レイヤの品質の設定は任意であるが、一般的には、ベースレイヤの画像の方が、そのベースレイヤの情報を利用するエンハンスメントレイヤの画像よりも低品質に設定される。
例えば携帯電話のような、処理能力の低い端末に対しては、ベースレイヤ(base layer)のみの画像圧縮情報(符号化データ)を伝送するようにし、テレビやパーソナルコンピュータのような、処理能力の高い端末に対しては、ベースレイヤ(base layer)に加えて、エンハンスメントレイヤ(enhancement layer)の画像圧縮情報(符号化データ)を伝送するようにしてもよい。
一般的に、低品質の画像を再生する処理の方が、高品質の画像を再生する処理よりも負荷が小さい。したがって、このように伝送することにより、例えば、処理能力の低い端末に低品質の動画像を再生させ、処理能力の高い端末に高品質の動画像を再生させる等、各端末に対して、その能力に応じた再生処理を実行させることができる。つまり、より多様な処理能力の端末に対して、動画像の再生を正常に(破綻しないように)実行させることができる。また、上述したように、各端末に対して必要なレイヤの符号化データのみを伝送すれば良いので、伝送する符号化データのデータ量(伝送量)の増大を抑制することができる。さらに、上述したように、他のレイヤの情報を利用することにより、符号量の増大を抑制することができる。そして、階層符号化・階層復号の場合、このような端末に応じたデータ配信を、トランスコード処理を必要とせずに実現することができる。
図61のような階層画像の配信において、上述した各実施の形態の方法を適用するようにしてもよい。このようにすることにより、階層画像についても、部分画像のデータの適応的な提供を実現することができる。
さらに、上述した各実施の形態の方法で使用されるフラグやパラメータ(例えば、符号化情報としてのVPS,SPS等)等の符号化・復号に必要な情報を、各レイヤの符号化・復号において共有するようにしてもよい。このようにすることにより、冗長な情報の伝送を抑制し、符号化効率の低減を抑制することができる。
<スケーラブルなパラメータ>
このような階層画像符号化・階層画像復号(スケーラブル符号化・スケーラブル復号)において、スケーラブル(scalable)機能を有するパラメータは、任意である。例えば、図62に示されるような空間解像度をそのパラメータとしてもよい(spatial scalability)。このスペーシャルスケーラビリティ(spatial scalability)の場合、レイヤ毎の空間的な解像度(すなわちピクチャの画素数)が異なる。図62の例では、各ピクチャが、低解像度のベースレイヤと、高解像度のエンハンスメントレイヤの2階層に階層化されている。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。
また、このようなスケーラブル性を持たせるパラメータとして、例えば、図63に示されるような、時間解像度を適用しても良い(temporal scalability)。このテンポラルスケーラビリティ(temporal scalability)の場合、レイヤ毎に時間的な解像度(すなわちフレームレート)が異なる。図63の例の場合、低フレームレート(7.5fps)のレイヤ、中フレームレート(15fps)のレイヤ、高フレームレートのレイヤ(30fps)の3階層に階層化されている。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。
さらに、このようなスケーラブル性を持たせるパラメータとして、例えば、図64に示されるような、信号雑音比(SNR(Signal to Noise ratio))を適用しても良い(SNR scalability)。このSNRスケーラビリティ(SNR scalability)の場合、レイヤ毎にSN比が異なる。図64の例の場合、各ピクチャが、SNRが低いベースレイヤと、SNRが高いエンハンスメントレイヤの2階層に階層化されている。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。
スケーラブル性を持たせるパラメータは、上述した例以外であっても、もちろんよい。例えば、スケーラブル性を持たせるパラメータとして、ビット深度を用いることもできる(bit-depth scalability)。このビット深度スケーラビリティ(bit-depth scalability)の場合、レイヤ毎にビット深度が異なる。例えば、ベースレイヤ(base layer)が8ビット(bit)画像よりなり、エンハンスメントレイヤ(enhancement layer)が10ビット(bit)画像よりなるようにしてもよい。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。また、各階層のビット深度も任意であり、上述した例に限らない。
例えば、ベースレイヤを標準的なダイナミックレンジを持つSDR(Standard Dynamic Range)画像とし、エンハンスメントレイヤをより幅広いダイナミックレンジを持つHDR(High Dynamic Range)画像としてもよい。このSDR画像を、例えば、8ビットや16ビットの整数精度の画像データとし、HDR画像を、例えば、32ビットの浮動小数点精度の画像データとしてもよい。
また、スケーラブル性を持たせるパラメータとして、例えば、クロマフォーマットを用いることもできる(chroma scalability)。このクロマスケーラビリティ(chroma scalability)の場合、レイヤ毎にクロマフォーマットが異なる。例えば、ベースレイヤ(base layer)が4:2:0フォーマットのコンポーネント画像よりなり、エンハンスメントレイヤ(enhancement layer)が4:2:2フォーマットのコンポーネント画像よりなるようにしてもよい。もちろん、この階層数は一例であり、任意の階層数に階層化することができる。また、各階層のクロマフォーマットも任意であり、上述した例に限らない。
さらに、スケーラブル性を持たせるパラメータとして、例えば、色域を用いるようにしてもよい。例えば、エンハンスメントレイヤの色域が、ベースレイヤの色域を包含する(すなわち、ベースレイヤの色域よりも広い)ようにしてもよい。
<階層画像符号化装置>
図65は、上述した階層画像符号化を行う階層画像符号化装置を示す図である。図65に示されるように、階層画像符号化装置620は、符号化部621、符号化部622、および多重化部623を有する。
符号化部621は、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。符号化部622は、ノンベースレイヤ画像を符号化し、ノンベースレイヤ画像符号化ストリームを生成する。多重化部623は、符号化部621において生成されたベースレイヤ画像符号化ストリームと、符号化部622において生成されたノンベースレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。
このような階層画像符号化装置620を、例えば、配信データ生成装置101(図11)の画像符号化部122(の符号化処理部の1つ)(図12)として適用するようにしてもよい。このようにすることにより、階層画像の配信においても、上述した各実施の形態の方法を適用することができ、部分画像のデータの適応的な提供を実現することができる。
<階層画像復号装置>
図66は、上述した階層画像復号を行う階層画像復号装置を示す図である。図66に示されるように、階層画像復号装置630は、逆多重化部631、復号部632、および復号部633を有する。
逆多重化部631は、ベースレイヤ画像符号化ストリームとノンベースレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを逆多重化し、ベースレイヤ画像符号化ストリームと、ノンベースレイヤ画像符号化ストリームとを抽出する。復号部632は、逆多重化部631により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。復号部633は、逆多重化部631により抽出されたノンベースレイヤ画像符号化ストリームを復号し、ノンベースレイヤ画像を得る。
このような階層画像復号装置630を、例えば、端末装置103(図11)の画像復号部155(の復号処理部の1つ)として適用するようにしてもよい。このようにすることにより、階層画像の配信においても、上述した各実施の形態の方法を適用することができ、部分画像のデータの適応的な提供を実現することができる。
上述した実施形態に係る画像符号化装置及び画像復号装置は、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、2つの応用例について説明する。
<9.応用例>
<第1の応用例:テレビジョン受像機>
図67は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、およびスピーカ908を有する。また、テレビジョン装置900は、外部インタフェース(I/F)部909、制御部910、ユーザインタフェース(I/F)部911、およびバス912を有する。さらに、テレビジョン装置900は、MP4処理部914およびMPEG-DASH処理部915を有する。
チューナ902は、アンテナ901を介して受信される放送波信号から所望のチャンネル(選局したチャンネル)の信号を抽出し、抽出した信号を復調する。チューナ902は、復調して得られた符号化ビットストリームをデマルチプレクサ903に出力する。
デマルチプレクサ903は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ904へ出力する。また、デマルチプレクサ903は、符号化ビットストリームからEPG(Electronic Program Guide)などの補助的なデータを抽出し、抽出したデータを制御部910に供給する。なお、符号化ビットストリームにスクランブルが施されている場合、デマルチプレクサ903が、その符号化ビットストリームに対してデスクランブルを行うようにしてもよい。
デコーダ904は、デマルチプレクサ903から入力される映像ストリーム及び音声ストリームを復号する。デコーダ904は、必要に応じて、MP4処理部914やMPEG-DASH処理部915を利用して復号を行う。そして、デコーダ904は、復号処理により生成される映像データを映像信号処理部905へ出力する。また、デコーダ904は、復号処理により生成される音声データを音声信号処理部907へ出力する。
映像信号処理部905は、デコーダ904から入力される映像データを再生し、表示部906に画像を表示させる。また、映像信号処理部905は、例えば受信部913を介して外部から供給された映像データを再生し、その画像を表示部906に表示させることもできる。さらに、映像信号処理部905は、例えば受信部913を介して外部から供給されたアプリケーションを実行して画像を生成し、その画像を表示部906に表示させることもできる。
これらのような映像データの再生や画像の生成において、映像信号処理部905は、表示部906に表示させる画像に対して例えばノイズ除去などの追加的な処理を行うこともできる。また、映像信号処理部905は、例えばメニュー、ボタン又はカーソルなどのGUI(Graphical User Interface)の画像を生成し、その画像を表示部906に表示させる画像に重畳することもできる。
音声信号処理部907は、デコーダ904から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ908から音声を出力させる。また、音声信号処理部907は、例えば受信部913を介して外部から供給された音声データを再生し、その音声をスピーカ908から出力させることもできる。さらに、音声信号処理部907は、例えば受信部913を介して外部から供給されたアプリケーションを実行して音声を生成し、その音声をスピーカ908から出力させることもできる。
これらのような音声データの再生や音声の生成において、音声信号処理部907は、スピーカ908から出力させる音声に対して例えばノイズ除去などの追加的な処理を行うこともできる。
外部インタフェース部909は、テレビジョン装置900と外部機器又はネットワークとを接続するためのインタフェースである。外部機器は、例えば、コンピュータ、USB(Universal Serial Bus)やIEEE1394等の所定の規格の通信ケーブルを介して接続される外付けHDD(Hard Disk Drive)や外付け光ディスクドライブ、またはNAS(Network Attached Storage)等、テレビジョン装置900と情報を授受することができるものであればどのような電子機器であってもよい。
また、ネットワークは、通信媒体となる通信網である。このネットワークは、どのような通信網であってもよく、有線通信網であってもよいし、無線通信網であってもよいし、それらの両方であってもよい。例えば、有線LAN(Local Area Network)、無線LAN、公衆電話回線網、所謂3G回線や4G回線等の無線移動体用の広域通信網、またはインターネット等であってもよいし、それらの組み合わせであってもよい。また、このネットワークは、単数の通信網であってもよいし、複数の通信網であってもよい。例えば、このネットワークが、サーバや中継装置等を介して互いに接続される複数の通信網により構成されるようにしてもよい。また、例えば、このネットワークは、その一部若しくは全部が、例えばUSB(Universal Serial Bus)ケーブルやHDMI(登録商標)(High-Definition Multimedia Interface)ケーブル等のような、所定の規格の通信ケーブルにより構成されるようにしてもよい。さらに、例えば、このネットワークは、その一部若しくは全部が、IEEE(Institute of Electrical and Electronic Engineers)802.11無線LANのアドホックモード、IrDA(InfraRed Data Association)のような赤外線等の光通信、またはBluetooth(登録商標)等の所定の規格に準拠する方法であっても良いし、独自の通信方式の無線通信により構成されるようにしてもよい。
このネットワークには、テレビジョン装置900の他、他の装置(外部機器)等が接続され、テレビジョン装置900は、このネットワークを介してその外部機器と通信を行う(情報を授受する)ことができる。
外部インタフェース部909は、外部機器から通信ケーブルやネットワークを介して供給される符号化ビットストリームを受信することができる。外部インタフェース部909は、符号化ビットストリームを受信すると、その符号化ビットストリームを、バス912を介してデマルチプレクサ903に供給する。
デマルチプレクサ903は、その符号化ビットストリームを、チューナ902から供給される符号化ビットストリームと同様に処理し、映像ストリームと音声ストリームとを分離したり、EPG等の補助的なデータを抽出したり、デスクランブルを行ったりする。このように、テレビジョン装置900は、符号化ビットストリームを含む放送波信号を受信するだけでなく、ネットワークを介して伝送される符号化ビットストリームを受信し、その符号化ビットストリームを復号して、その映像や音声を出力することができる。
つまり、アンテナ901や外部インタフェース部909は、テレビジョン装置900における受信部として機能する。
なお、テレビジョン装置900は、外部インタフェース部909を介して外部機器に情報を送信することもできる。この情報は任意である。例えば、映像や音声等のコンテンツの要求であってもよいし、通信を確立するために必要なテレビジョン装置900の通信機能に関する情報であってもよいし、テレビジョン装置900が有する復号機能や画像表示機能や音声出力機能等に関する情報であってもよい。また、テレビジョン装置900が、アンテナ901を介して受信された符号化ビットストリームを、この外部インタフェース部909を介して外部機器に送信することができるようにしてもよい。つまり、外部インタフェース部909が、テレビジョン装置900における送信部として機能するようにしてもよい。
制御部910にはユーザインタフェース部911が接続されている。ユーザインタフェース部911は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部910に供給する。
制御部910は、CPUやメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータ、EPGデータ、外部インタフェース部909を介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置900の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、テレビジョン装置900がユーザ操作に応じた動作となるように各部を制御する。
なお、テレビジョン装置900では、チューナ902、デマルチプレクサ903、映像信号処理部905、音声信号処理部907、外部インタフェース部909等と制御部910を接続するためバス912が設けられている。
アンテナ901若しくは外部インタフェース部909を介して受信された映像ストリームがMP4ファイルの場合、デコーダ904は、そのMP4ファイルをMP4処理部914に供給する。MP4処理部914は、供給されたMP4ファイルを解析し、MP4ファイルに含まれる符号化データを復号する。MP4処理部914は、復号して得られた画像データをデコーダ904に供給する。デコーダ904は、その画像データを映像信号処理部905に供給する。
このようなMP4処理部914の処理として、上述した各実施の形態の方法を適用するようにしてもよい。つまり、MP4処理部914が、端末装置103(図11)のファイル取得部154、画像復号部155、およびタイル画像合成部156(図13)を有するようにしてもよい。この場合、MP4処理部914は、所望の範囲に含まれるタイルのデータを含むMP4ファイルをデコーダ904等を介して取得し、そのタイルの符号化データを抽出して復号し、得られたタイルの画像データ(タイル画像)を適宜合成して所望の範囲の画像データを生成し、その画像データをデコーダ904に供給する。このようにすることにより、MP4処理部914が、各実施の形態において上述した各種のMP4ファイルを処理し、所望の画像データを得ることができる。つまり、テレビジョン装置900は、部分画像のデータの適応的な提供を実現することができる。
また、アンテナ901若しくは外部インタフェース部909を介して受信された映像ストリームがMPDファイルの場合、デコーダ904は、そのMPDファイルをMPEG-DASH処理部915に供給する。MPEG-DASH処理部915は、供給されたMPDを解析し、そのMPDに基づいて、所望の画像データを取得する。例えば、画像データが符号化された符号化データを含むMP4ファイルがMPDにより管理されている場合、MPEG-DASH処理部915は、そのMPDに基づいて所望の画像に対応するMP4ファイルを取得し、そのMP4ファイルに含まれる符号化データを復号し、復号して得られた画像データをデコーダ904に供給する。デコーダ904は、その画像データを映像信号処理部905に供給する。
このようなMPEG-DASH処理部915の処理として、上述した各実施の形態の方法を適用するようにしてもよい。つまり、MPEG-DASH処理部915が、端末装置103(図11)のMPD取得部151乃至タイル画像合成部156(図13の表示部157以外の各処理部)を有するようにしてもよい。MPEG-DASH処理部915は、MPDを解析して、所望の範囲に含まれるタイルのデータを含むMP4ファイルをデコーダ904等を介して取得し、そのタイルの符号化データを抽出して復号し、得られたタイルの画像データ(タイル画像)を適宜合成して所望の範囲の画像データを生成し、その画像データをデコーダ904に供給する。このようにすることにより、MPEG-DASH処理部915が、各実施の形態において上述した各種のMPDを処理し、所望の画像データを得ることができる。つまり、テレビジョン装置900は、部分画像のデータの適応的な提供を実現することができる。
<第2の応用例:携帯電話機>
図68は、本開示を適用した携帯電話機の概略構成を例示している。携帯電話機920は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931を有している。これらは、バス933を介して互いに接続されている。
また、通信部922にはアンテナ921が接続されており、音声コーデック923には、スピーカ924とマイクロホン925が接続されている。さらに制御部931には、操作部932が接続されている。
さらに、携帯電話機920は、MP4処理部934およびMPEG-DASH処理部935を有する。MP4処理部934およびMPEG-DASH処理部935は、バス933に接続されている。
通信部922は、アンテナ921を介した無線信号の送受信に関する処理を行う。音声コーデック923は、音声データの符号化や、音声データが符号化された音声符号化データの復号等に関する処理を行う。カメラ部926は、被写体を撮像し、画像データを生成する等の、撮像に関する処理を行う。
画像処理部927は、画像データに対する処理を行う。例えば、画像処理部927は、画像データに対して任意の画像処理を行うことができる。また画像処理部927は、画像データを符号化したり、画像データが符号化された符号化データを復号したりすることもできる。
多重分離部928は、例えば画像データと音声データ等、複数データの多重化や、多重化されたデータの分離等に関する処理を行う。
記録再生部929は、読み書き可能な任意の記憶媒体を有し、その記憶媒体へのデータの書き込み(記録)や、その記憶媒体に記憶されているデータの読み出し(再生)等に関する処理を行う。この記憶媒体は、例えば、RAMやフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカードなどの外部装着型の記憶媒体であってもよい。
表示部930は、表示デバイス(例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD(Organic ElectroLuminescence Display)(有機ELディスプレイ)など)を有し、画像表示に関する処理を行う。
制御部931は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、携帯電話機920の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えば操作部932から入力される操作信号に応じて、携帯電話機920の各処理部の動作を制御する。
MP4処理部934は、MP4ファイルに関する処理を行う。MPEG-DASH処理部935は、MPDやMP4ファイルの生成等、MPEG-DASHの規格に準拠した方法で配信される配信データやその制御情報の生成に関する処理を行う。また、MPEG-DASH処理部935は、MPDの解析やMP4ファイルの処理等、MPEG-DASHの規格に準拠した方法で配信される配信データの再生に関する処理も行う。
携帯電話機920は、音声通話モード、データ通信モード、撮影モード、テレビ電話モード等、様々な動作モードで、音声信号の送受信、電子メールや画像データの送受信、画像の撮像、データの記録などの各種動作を行う。
例えば、音声通話モードの場合、マイクロホン925により生成されるアナログ音声信号は、音声コーデック923に供給される。音声コーデック923は、アナログ音声信号をデジタルの音声データへA/D変換し、符号化(圧縮)する。そして、音声コーデック923は、圧縮後の音声データ(音声符号化データ)を通信部922へ出力する。通信部922は、その音声符号化データをさらに符号化したり変調したりして送信信号を生成する。そして、通信部922は、生成した送信信号を、アンテナ921を介して基地局(図示せず)へ送信する。
また、通信部922は、アンテナ921を介して受信される無線信号を増幅したり周波数変換したりして受信信号を取得し、その受信信号を復調したり復号したりして音声符号化データを生成し、それを音声コーデック923へ出力する。音声コーデック923は、供給された音声符号化データを復号(伸張)したり、D/A変換したりしてアナログ音声信号を生成する。そして、音声コーデック923は、そのアナログ音声信号をスピーカ924に供給してその音声を出力させる。
また、例えば、データ通信モードにおいてメール送信を行う場合、制御部931は、ユーザによる操作部932を介した文字入力を受け付け、その入力された文字を表示部930に表示させる。また、制御部931は、操作部932を介してユーザからのメール送信指示を受け付け、その指示に応じて電子メールデータを生成し、それを通信部922に供給する。通信部922は、供給された電子メールデータを符号化したり変調したりして送信信号を生成し、それを周波数変換したり増幅したりして、アンテナ921を介して基地局(図示せず)へ送信する。
また、例えば、データ通信モードにおいてメール受信を行う場合、通信部922は、アンテナ921を介して受信される無線信号を増幅したり周波数変換したりして受信信号を取得し、その受信信号を復調したり復号したりして電子メールデータを復元し、復元した電子メールデータを制御部931に供給する。制御部931は、表示部930に電子メールの内容を表示させると共に、電子メールデータを記録再生部929の記憶媒体に記憶させる。
また、例えば、撮影モードの場合、カメラ部926は、被写体を撮像して画像データを生成する。カメラ部926は、生成した画像データを、バス933を介して画像処理部927に供給する。画像処理部927は、その画像データに対して画像処理を行う。カメラ部926は、画像処理した画像データを、バス933を介して表示部930に供給し、その画像を表示させる。また、画像処理部927は、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、画像処理した画像データを符号化して符号化データを生成し、その符号化データ(画像符号化データ)を、バス933を介して記録再生部929に供給し、その記憶媒体に記憶させる。
なお、撮影モードにおいて撮影とともに集音も行う場合、カメラ部926が被写体を撮像して画像データを生成するとともに、マイクロホン925が集音してアナログ音声信号を生成する。画像処理部927は、カメラ部926が生成した画像データに対して画像処理を行い、その画像処理した画像データの画像を表示部930に表示させる。音声コーデック923は、マイクロホン925が生成したアナログ音声信号の音声をスピーカ924から出力させる。
そして、画像処理部927は、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、画像データを符号化して画像符号化データを生成し、その画像符号化データを、バス933を介して多重分離部928に供給する。音声コーデック923は、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、アナログ音声信号をA/D変換して音声データを生成し、さらにそれを符号化して音声符号化データを生成し、その音声符号化データを、バス933を介して多重分離部928に供給する。多重分離部928は、供給された画像符号化データと音声符号化データとを多重化して多重化データを生成する。多重分離部928は、その多重化データを、バス933を介して記録再生部929に供給し、その記憶媒体に記憶させる。
また、例えば、データ通信モードにおいて画像データを送信する場合、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、通信部922は、バス933を介して画像処理部927や記録再生部929等から画像符号化データを取得し、それを符号化したり変調したりしてその送信信号を生成し、それを周波数変換したり増幅したりして、アンテナ921を介して基地局(図示せず)へ送信する。
例えば、テレビ電話のように、画像と音声を送信する場合、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、通信部922は、バス933を介して多重分離部928から画像と音声のデータ(例えば画像符号化データと音声符号化データと)が多重化された多重化データを取得し、それを符号化したり変調したりしてその送信信号を生成し、それを周波数変換したり増幅したりして、アンテナ921を介して基地局(図示せず)へ送信する。
また、例えば、画像データを符号化してMP4ファイルを生成し、そのMP4ファイルを送信する場合、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、MP4処理部934は、バス933を介してカメラ部926、画像処理部927、若しくは記録再生部929等から画像データを取得し(多重分離部928から多重化データを取得してもよい)、それを符号化して符号化データを生成し、さらにその符号化データを格納するMP4ファイルを生成し、そのMP4ファイルを、バス933を介して通信部922に供給する。通信部922は、制御部931の制御に基づいて、供給されたMP4ファイルを符号化したり変調したりしてその送信信号を生成し、それを周波数変換したり増幅したりして、アンテナ921を介して基地局(図示せず)へ送信する。
このようなMP4処理部934の処理として、上述した各実施の形態の方法を適用するようにしてもよい。つまり、MP4処理部934が、配信データ生成装置101(図11)の画面分割処理部121、画像符号化部122、ファイル生成部123、およびサーバアップロード処理部126(図12)を有するようにしてもよい。この場合、MP4処理部934は、画像をタイル毎に分割して符号化し、タイル毎のデータを格納するMP4ファイルを生成し、それを配信サーバ102にアップロードする。このようにすることにより、MP4処理部934が、各実施の形態において上述した各種のMP4ファイルを生成することができる。つまり、携帯電話機920は、部分画像のデータの適応的な提供を実現することができる。
また、例えば、画像データの情報を管理するMPDを生成し、そのMPDを送信する場合、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、MPEG-DASH処理部935は、バス933を介してカメラ部926、画像処理部927、若しくは記録再生部929等から画像データを取得し(多重分離部928から多重化データを取得してもよい)、その画像データを管理するMPDを生成し、そのMPDファイルを、バス933を介して通信部922に供給する。通信部922は、制御部931の制御に基づいて、供給されたMPDファイルを符号化したり変調したりしてその送信信号を生成し、それを周波数変換したり増幅したりして、アンテナ921を介して基地局(図示せず)へ送信する。その際、MPEG-DASH処理部935は、その画像データを、MPDファイルとともに通信部922を介して送信するようにしてもよい。
また、MPEG-DASH処理部935は、画像データを符号化し、その符号化データを管理するMPDを生成し、そのMPDファイルを、通信部922を介して送信するようにしてもよい。さらに、MPEG-DASH処理部935は、その符号化データを、MPDファイルとともに通信部922を介して送信するようにしてもよい。
また、MPEG-DASH処理部935は、画像データを符号化し、その符号化データを格納するMP4ファイルを生成し、そのMP4ファイルを管理するMPDを生成し、そのMPDファイルを、通信部922を介して送信するようにしてもよい。さらに、MPEG-DASH処理部935は、そのMP4ファイルを、MPDファイルとともに通信部922を介して送信するようにしてもよい。
このようなMPEG-DASH処理部935の処理として、上述した各実施の形態の方法を適用するようにしてもよい。つまり、MPEG-DASH処理部935が、配信データ生成装置101(図11)の画面分割処理部121乃至サーバアップロード処理部126(図12のタイル型MPD生成部141を含む)を有するようにしてもよい。この場合、MPEG-DASH処理部935は、画像をタイル毎に分割して符号化し、タイル毎のデータを格納するMP4ファイルを生成し、そのMP4ファイルを管理するMPDを生成し、それらを配信サーバ102にアップロードする。このようにすることにより、MPEG-DASH処理部935が、各実施の形態において上述した各種のMPD(やMP4ファイル)を生成することができる。つまり、携帯電話機920は、部分画像のデータの適応的な提供を実現することができる。
また、例えば、データ通信モードにおいて画像データを受信する場合、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、通信部922は、アンテナ921を介して無線信号を受信し、それを増幅したり周波数変換したりして受信信号を生成し、それを復調したり復号したりして画像符号化データを生成し、それを、バス933を介して画像処理部927や記録再生部929等に供給する。例えば、画像処理部927は、供給された画像符号化データを復号し、得られた画像データを表示部930に供給してその画像を表示させる。また、例えば、記録再生部929は、供給された画像符号化データを記憶媒体に記憶する。
例えば、テレビ電話のように、画像と音声を受信する場合、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、通信部922は、アンテナ921を介して無線信号を受信し、それを増幅したり周波数変換したりして受信信号を生成し、それを復調したり復号したりして、画像と音声のデータ(例えば画像符号化データと音声符号化データと)が多重化された多重化データを生成する。通信部922は、それを、バス933を介して多重分離部928に供給する。例えば、多重分離部928は、供給された多重データに含まれる画像符号化データと音声符号化データを分離し、画像符号化データを、バス933を介して画像処理部927や記録再生部929等に供給し、音声符号化データを、バス933を介して音声コーデック923に供給する。例えば、画像処理部927は、供給された画像符号化データを復号し、得られた画像データを表示部930に供給してその画像を表示させる。また、例えば、記録再生部929は、供給された画像符号化データを記憶媒体に記憶する。また、例えば、音声コーデック923は、供給された音声符号化データを復号し、得られた音声データをD/A変換してアナログ音声信号を生成し、そのアナログ音声信号の音声をスピーカ924から出力させる。
また、例えば、通信部922が画像データの符号化データを格納するMP4ファイルを受信する場合、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、MP4処理部934は、通信部922からバス933を介してそのMP4ファイルを取得し、それを解析して符号化データを抽出し、さらにその符号化データを復号し、得られた画像データを、バス933を介して画像処理部927、記録再生部929、表示部930等に供給する。なお、MP4ファイルから多重化データが抽出される場合、または、符号化データを復号して多重化データが得られる場合、MP4処理部934は、得られた多重化データを多重分離部928に供給する。
このようなMP4処理部934の処理として、上述した各実施の形態の方法を適用するようにしてもよい。つまり、MP4処理部934が、端末装置103(図11)のファイル取得部154、画像復号部155、およびタイル画像合成部156(図13)を有するようにしてもよい。この場合、MP4処理部934は、所望の範囲に含まれるタイルのデータを含むMP4ファイルを、通信部922等を介して取得し、そのタイルの符号化データを抽出して復号し、得られたタイルの画像データ(タイル画像)を適宜合成して所望の範囲の画像データを生成し、その画像データを、バス933を介して画像処理部927、記録再生部929、表示部930等に供給する。このようにすることにより、MP4処理部934が、各実施の形態において上述した各種のMP4ファイルを処理し、所望の画像データを得ることができる。つまり、携帯電話機920は、部分画像のデータの適応的な提供を実現することができる。
また、例えば、通信部922が画像データの情報を管理するMPDファイルを受信する場合、制御部931の制御(操作部932を介して入力されたユーザ指示等)に基づいて、MPEG-DASH処理部935は、通信部922からバス933を介してそのMPDファイルを取得し、それを解析し、そのMPDに基づいて、所望の画像データを取得する。例えば、画像データが符号化された符号化データを含むMP4ファイルがMPDにより管理されている場合、MPEG-DASH処理部935は、通信部922を介して、そのMPDに基づいて所望の画像に対応するMP4ファイルを取得し、そのMP4ファイルに含まれる符号化データを復号し、復号して得られた画像データをバス933を介して画像処理部927、記録再生部929、表示部930等に供給する。なお、MP4ファイルから多重化データが抽出される場合、または、符号化データを復号して多重化データが得られる場合、MPEG-DASH処理部935は、得られた多重化データを多重分離部928に供給する。
このようなMPEG-DASH処理部935の処理として、上述した各実施の形態の方法を適用するようにしてもよい。つまり、MPEG-DASH処理部935が、端末装置103(図11)のMPD取得部151乃至タイル画像合成部156(図13の表示部157以外の各処理部)を有するようにしてもよい。MPEG-DASH処理部935は、MPDを解析して、所望の範囲に含まれるタイルのデータを含むMP4ファイルを、通信部922等を介して取得し、そのタイルの符号化データを抽出して復号し、得られたタイルの画像データ(タイル画像)を適宜合成して所望の範囲の画像データを生成し、その画像データを画像処理部927、記録再生部929、表示部930等に供給する。このようにすることにより、MPEG-DASH処理部935が、各実施の形態において上述した各種のMPDを処理し、所望の画像データを得ることができる。つまり、携帯電話機920は、部分画像のデータの適応的な提供を実現することができる。
<10.第10の実施の形態>
<実施のその他の例>
以上において本技術を適用する装置やシステム等の例を説明したが、本技術は、これに限らず、このような装置またはシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI(Large Scale Integration)等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等(すなわち、装置の一部の構成)として実施することもできる。
<ビデオセット>
本技術をセットとして実施する場合の例について、図69を参照して説明する。図69は、本技術を適用したビデオセットの概略的な構成の一例を示している。
近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、1機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する1セットとして実施を行う場合も多く見られるようになってきた。
図69に示されるビデオセット1300は、このような多機能化された構成であり、画像の符号化や復号(いずれか一方でもよいし、両方でも良い)に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。
図69に示されるように、ビデオセット1300は、ビデオモジュール1311、外部メモリ1312、パワーマネージメントモジュール1313、およびフロントエンドモジュール1314等のモジュール群と、コネクティビティ1321、カメラ1322、およびセンサ1323等の関連する機能を有するデバイスとを有する。
モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。
図69の例の場合、ビデオモジュール1311は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ、ビデオプロセッサ、ブロードバンドモデム1333、およびRFモジュール1334を有する。
プロセッサは、所定の機能を有する構成をSoC(System On a Chip)により半導体チップに集積したものであり、例えばシステムLSI(Large Scale Integration)等と称されるものもある。この所定の機能を有する構成は、論理回路(ハードウエア構成)であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム(ソフトウエア構成)であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路(ハードウエア構成)により実現し、その他の機能をCPUにおいて実行されるプログラム(ソフトウエア構成)により実現するようにしてもよい。
図69のアプリケーションプロセッサ1331は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ1331において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ1332等、ビデオモジュール1311内外の構成を必要に応じて制御することもできる。
ビデオプロセッサ1332は、画像の符号化・復号(その一方若しくは両方)に関する機能を有するプロセッサである。
ブロードバンドモデム1333は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線(またはその両方)の広帯域通信に関する処理を行うプロセッサ(若しくはモジュール)である。例えば、ブロードバンドモデム1333は、送信するデータ(デジタル信号)をデジタル変調する等してアナログ信号に変換したり、受信したアナログ信号を復調してデータ(デジタル信号)に変換したりする。例えば、ブロードバンドモデム1333は、ビデオプロセッサ1332が処理する画像データや画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報をデジタル変調・復調することができる。
RFモジュール1334は、アンテナを介して送受信されるRF(Radio Frequency)信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール1334は、ブロードバンドモデム1333により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール1334は、フロントエンドモジュール1314を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。
なお、図69において点線1341に示されるように、アプリケーションプロセッサ1331とビデオプロセッサ1332を、一体化し、1つのプロセッサとして構成されるようにしてもよい。
外部メモリ1312は、ビデオモジュール1311の外部に設けられた、ビデオモジュール1311により利用される記憶デバイスを有するモジュールである。この外部メモリ1312の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM(Dynamic Random Access Memory)のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。
パワーマネージメントモジュール1313は、ビデオモジュール1311(ビデオモジュール1311内の各構成)への電力供給を管理し、制御する。
フロントエンドモジュール1314は、RFモジュール1334に対してフロントエンド機能(アンテナ側の送受信端の回路)を提供するモジュールである。図38に示されるように、フロントエンドモジュール1314は、例えば、アンテナ部1351、フィルタ1352、および増幅部1353を有する。
アンテナ部1351は、無線信号を送受信するアンテナおよびその周辺の構成を有する。アンテナ部1351は、増幅部1353から供給される信号を無線信号として送信し、受信した無線信号を電気信号(RF信号)としてフィルタ1352に供給する。フィルタ1352は、アンテナ部1351を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール1334に供給する。増幅部1353は、RFモジュール1334から供給されるRF信号を増幅し、アンテナ部1351に供給する。
コネクティビティ1321は、外部との接続に関する機能を有するモジュールである。コネクティビティ1321の物理構成は、任意である。例えば、コネクティビティ1321は、ブロードバンドモデム1333が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。
例えば、コネクティビティ1321が、Bluetooth(登録商標)、IEEE 802.11(例えばWi-Fi(Wireless Fidelity、登録商標))、NFC(Near Field Communication)、IrDA(InfraRed Data Association)等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ1321が、USB(Universal Serial Bus)、HDMI(登録商標)(High-Definition Multimedia Interface)等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ1321が、アナログ入出力端子等のその他のデータ(信号)伝送機能等を有するようにしてもよい。
なお、コネクティビティ1321が、データ(信号)の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ1321が、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ(リムーバブルメディアのドライブだけでなく、ハードディスク、SSD(Solid State Drive)、NAS(Network Attached Storage)等も含む)を有するようにしてもよい。また、コネクティビティ1321が、画像や音声の出力デバイス(モニタやスピーカ等)を有するようにしてもよい。
カメラ1322は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ1322の撮像により得られた画像データは、例えば、ビデオプロセッサ1332に供給されて符号化される。
センサ1323は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ1323により検出されたデータは、例えば、アプリケーションプロセッサ1331に供給されてアプリケーション等により利用される。
以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。
以上のような構成のビデオセット1300において、後述するようにビデオプロセッサ1332に本技術を適用することができる。したがって、ビデオセット1300は、本技術を適用したセットとして実施することができる。
例えば、ビデオプロセッサ1332が、MP4ファイルに関する処理や、MPEG-DASHの規格に準拠した方法で配信される配信データやその制御情報の生成や再生に関する処理を行うようにしてもよい。ビデオプロセッサ1332の詳細については後述する。
また、アプリケーションプロセッサ1331が、アプリケーションを実行することにより、MP4ファイルに関する処理や、MPEG-DASHの規格に準拠した方法で配信される配信データやその制御情報の生成や再生に関する処理を行うようにしてもよい。そして、このようなアプリケーションプロセッサ1331の処理として、上述した各実施の形態の方法を適用するようにしてもよい。
つまり、例えば、アプリケーションプロセッサ1331が、アプリケーションを実行することにより、配信データ生成装置101(図11)の画面分割処理部121乃至サーバアップロード処理部126(図12のタイル型MPD生成部141を含む)の機能を有するようにしてもよい。この場合、アプリケーションプロセッサ1331は、画像をタイル毎に分割して符号化し、タイル毎のデータを格納するMP4ファイルを生成し、それを配信サーバ102にアップロードすることができる。また、アプリケーションプロセッサ1331は、生成したMP4ファイルを管理するMPDを生成し、それらを配信サーバ102にアップロードすることもできる。このようにすることにより、アプリケーションプロセッサ1331は、各実施の形態において上述した各種のMPDやMP4ファイルを生成することができる。つまり、ビデオセット1300は、部分画像のデータの適応的な提供を実現することができる。
また、例えば、アプリケーションプロセッサ1331が、アプリケーションを実行することにより、端末装置103(図11)のMPD取得部151乃至タイル画像合成部156(図13の表示部157以外の各処理部)の機能を有するようにしてもよい。この場合、アプリケーションプロセッサ1331は、ユーザ指示等に基づいて、所望の範囲に含まれるタイルのデータを含むMP4ファイルを取得し、そのタイルの符号化データを抽出して復号し、得られたタイルの画像データ(タイル画像)を適宜合成して所望の範囲の画像データを生成することができる。また、アプリケーションプロセッサ1331は、MPDを取得し、取得したMPDを解析し、その解析結果に基づいて、所望の範囲に含まれるタイルのデータを含むMP4ファイルを取得し、そのタイルの符号化データを抽出して復号し、得られたタイルの画像データ(タイル画像)を適宜合成して所望の範囲の画像データを生成することもできる。このようにすることにより、アプリケーションプロセッサ1331は、各実施の形態において上述した各種のMPDやMP4ファイルを処理し、所望の画像データを得ることができる。つまり、ビデオセット1300は、部分画像のデータの適応的な提供を実現することができる。
<ビデオプロセッサの構成例>
図70は、本開示を適用したビデオプロセッサ1332(図69)の概略的な構成の一例を示している。
図70に示されるように、ビデオプロセッサ1332は、ビデオ入力処理部1401、第1画像拡大縮小部1402、第2画像拡大縮小部1403、ビデオ出力処理部1404、フレームメモリ1405、およびメモリ制御部1406を有する。また、ビデオプロセッサ1332は、エンコード・デコードエンジン1407、ビデオES(Elementary Stream)バッファ1408Aおよび1408B、並びに、オーディオESバッファ1409Aおよび1409Bを有する。さらに、ビデオプロセッサ1332は、オーディオエンコーダ1410、オーディオデコーダ1411、多重化部(MUX(Multiplexer))1412、逆多重化部(DMUX(Demultiplexer))1413、およびストリームバッファ1414を有する。さらに、ビデオプロセッサ1332は、MP4処理部1415およびMPEG-DASH処理部1416を有する。
ビデオ入力処理部1401は、例えばコネクティビティ1321等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第1画像拡大縮小部1402は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第2画像拡大縮小部1403は、画像データに対して、ビデオ出力処理部1404を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第1画像拡大縮小部1402と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部1404は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ1321等に出力する。
フレームメモリ1405は、ビデオ入力処理部1401、第1画像拡大縮小部1402、第2画像拡大縮小部1403、ビデオ出力処理部1404、およびエンコード・デコードエンジン1407によって共用される画像データ用のメモリである。フレームメモリ1405は、例えばDRAM等の半導体メモリとして実現される。
メモリ制御部1406は、エンコード・デコードエンジン1407からの同期信号を受けて、アクセス管理テーブル1406Aに書き込まれたフレームメモリ1405へのアクセススケジュールに従ってフレームメモリ1405に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル1406Aは、エンコード・デコードエンジン1407、第1画像拡大縮小部1402、第2画像拡大縮小部1403等で実行される処理に応じて、メモリ制御部1406により更新される。
エンコード・デコードエンジン1407は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン1407は、フレームメモリ1405から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ1408Aに順次書き込む。また、例えば、ビデオESバッファ1408Bからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ1405に順次書き込む。エンコード・デコードエンジン1407は、これらの符号化や復号において、フレームメモリ1405を作業領域として使用する。また、エンコード・デコードエンジン1407は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部1406に対して同期信号を出力する。さらに、エンコード・デコードエンジン1407は、必要に応じて、MP4処理部1415やMPEG-DASH処理部1416を利用して画像データの符号化や、画像データが符号化された符号化データの復号を行う。
ビデオESバッファ1408Aは、エンコード・デコードエンジン1407によって生成されたビデオストリームをバッファリングして、多重化部(MUX)1412に供給する。ビデオESバッファ1408Bは、逆多重化部(DMUX)1413から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン1407に供給する。
オーディオESバッファ1409Aは、オーディオエンコーダ1410によって生成されたオーディオストリームをバッファリングして、多重化部(MUX)1412に供給する。オーディオESバッファ1409Bは、逆多重化部(DMUX)1413から供給されたオーディオストリームをバッファリングして、オーディオデコーダ1411に供給する。
オーディオエンコーダ1410は、例えばコネクティビティ1321等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3(AudioCode number 3)方式等の所定の方式で符号化する。オーディオエンコーダ1410は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ1409Aに順次書き込む。オーディオデコーダ1411は、オーディオESバッファ1409Bから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ1321等に供給する。
多重化部(MUX)1412は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法(すなわち、多重化により生成されるビットストリームのフォーマット)は任意である。また、この多重化の際に、多重化部(MUX)1412は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部(MUX)1412は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部(MUX)1412は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部(MUX)1412は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ(ファイルデータ)に変換する。
逆多重化部(DMUX)1413は、多重化部(MUX)1412による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部(DMUX)1413は、ストリームバッファ1414から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する(ビデオストリームとオーディオストリームとを分離する)。つまり、逆多重化部(DMUX)1413は、逆多重化によりストリームのフォーマットを変換(多重化部(MUX)1412による変換の逆変換)することができる。例えば、逆多重化部(DMUX)1413は、例えばコネクティビティ1321やブロードバンドモデム1333等から供給されたトランスポートストリームを、ストリームバッファ1414を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部(DMUX)1413は、例えばコネクティビティ1321により各種記録媒体から読み出されたファイルデータを、ストリームバッファ1414を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。
ストリームバッファ1414は、ビットストリームをバッファリングする。例えば、ストリームバッファ1414は、多重化部(MUX)1412から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ1321やブロードバンドモデム1333等に供給する。
また、例えば、ストリームバッファ1414は、多重化部(MUX)1412から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ1321等に供給し、各種記録媒体に記録させる。
さらに、ストリームバッファ1414は、例えばコネクティビティ1321やブロードバンドモデム1333等を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部(DMUX)1413に供給する。
また、ストリームバッファ1414は、例えばコネクティビティ1321等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部(DMUX)1413に供給する。
MP4処理部1415は、MP4ファイルの生成や再生等、MP4ファイルに関する処理を行う。MPEG-DASH処理部1416は、MPDやMP4ファイルの生成や再生等、MPEG-DASHの規格に準拠した方法で配信される配信データやその制御情報の生成や再生に関する処理を行う。
次に、このような構成のビデオプロセッサ1332の動作の例について説明する。例えば、コネクティビティ1321等からビデオプロセッサ1332に入力されたビデオ信号は、ビデオ入力処理部1401において4:2:2Y/Cb/Cr方式等の所定の方式のデジタル画像データに変換され、フレームメモリ1405に順次書き込まれる。このデジタル画像データは、第1画像拡大縮小部1402または第2画像拡大縮小部1403に読み出されて、4:2:0Y/Cb/Cr方式等の所定の方式へのフォーマット変換および拡大縮小処理が行われ、再びフレームメモリ1405に書き込まれる。この画像データは、エンコード・デコードエンジン1407によって符号化され、ビデオストリームとしてビデオESバッファ1408Aに書き込まれる。
また、コネクティビティ1321等からビデオプロセッサ1332に入力されたオーディオ信号は、オーディオエンコーダ1410によって符号化され、オーディオストリームとして、オーディオESバッファ1409Aに書き込まれる。
ビデオESバッファ1408Aのビデオストリームと、オーディオESバッファ1409Aのオーディオストリームは、多重化部(MUX)1412に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部(MUX)1412により生成されたトランスポートストリームは、ストリームバッファ1414にバッファされた後、例えばコネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークに出力される。また、多重化部(MUX)1412により生成されたファイルデータは、ストリームバッファ1414にバッファされた後、例えばコネクティビティ1321等に出力され、各種記録媒体に記録される。
また、例えばコネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークからビデオプロセッサ1332に入力されたトランスポートストリームは、ストリームバッファ1414にバッファされた後、逆多重化部(DMUX)1413により逆多重化される。また、例えばコネクティビティ1321等において各種記録媒体から読み出され、ビデオプロセッサ1332に入力されたファイルデータは、ストリームバッファ1414にバッファされた後、逆多重化部(DMUX)1413により逆多重化される。つまり、ビデオプロセッサ1332に入力されたトランスポートストリームまたはファイルデータは、逆多重化部(DMUX)1413によりビデオストリームとオーディオストリームとに分離される。
オーディオストリームは、オーディオESバッファ1409Bを介してオーディオデコーダ1411に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ1408Bに書き込まれた後、エンコード・デコードエンジン1407により順次読み出されて復号されてフレームメモリ1405に書き込まれる。復号された画像データは、第2画像拡大縮小部1403によって拡大縮小処理されて、フレームメモリ1405に書き込まれる。そして、復号された画像データは、ビデオ出力処理部1404に読み出されて、4:2:2Y/Cb/Cr方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。
MP4処理部1415は、例えばフレームメモリ1405に記憶されている画像データを、エンコード・デコードエンジン1407を介して取得し、それを符号化して符号化データを生成し、さらにその符号化データを格納するMP4ファイルを生成する。MP4処理部1415は、生成したMP4ファイルをエンコード・デコードエンジン1407に供給する。エンコード・デコードエンジン1407は、供給されたMP4ファイルを、例えば、ビデオESバッファ1408A、多重化部(MUX)1412、ストリームバッファ1414等を介して、ビデオプロセッサ1332の外部に出力し、コネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークに出力させる。
また、MP4処理部1415は、例えば、コネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークから取得され、ビデオESバッファ1408Bに記憶されているMP4ファイルを、エンコード・デコードエンジン1407を介して取得し、それを解析して符号化データを抽出し、さらにその符号化データを復号する。MP4処理部1415は、得られた画像データをエンコード・デコードエンジン1407に供給する。エンコード・デコードエンジン1407は、供給された画像データを、フレームメモリ1405を介してビデオ出力処理部1404に供給し、ビデオ信号としてビデオプロセッサ1332の外部に出力させる。
このようなMP4処理部1415の処理として、上述した各実施の形態の方法を適用するようにしてもよい。つまり、MP4処理部1415が、配信データ生成装置101(図11)の画面分割処理部121、画像符号化部122、ファイル生成部123、およびサーバアップロード処理部126(図12)を有するようにしてもよい。この場合、MP4処理部1415は、画像をタイル毎に分割して符号化し、タイル毎のデータを格納するMP4ファイルを生成し、それを、コネクティビティ1321等を介して配信サーバ102にアップロードする。このようにすることにより、MP4処理部1415が、各実施の形態において上述した各種のMP4ファイルを生成することができる。
また、MP4処理部1415が、端末装置103(図11)のファイル取得部154、画像復号部155、およびタイル画像合成部156(図13)を有するようにしてもよい。この場合、MP4処理部1415は、所望の範囲に含まれるタイルのデータを含むMP4ファイルを、コネクティビティ1321等を介して配信サーバ102からダウンロードし、そのMP4ファイルからそのタイルの符号化データを抽出して復号し、得られたタイルの画像データ(タイル画像)を適宜合成して所望の範囲の画像データを生成し、その画像データをビデオ信号としてビデオプロセッサ1332の外部に出力させる。このようにすることにより、MP4処理部1415が、各実施の形態において上述した各種のMP4ファイルを処理し、所望の画像データを得ることができる。
つまり、ビデオプロセッサ1332(すなわち、ビデオセット1300)は、部分画像のデータの適応的な提供を実現することができる。
MPEG-DASH処理部1416は、例えばフレームメモリ1405に記憶されている画像データを、エンコード・デコードエンジン1407を介して取得し、その画像データを管理するMPDを生成し、そのMPDファイルを、エンコード・デコードエンジン1407に供給する。エンコード・デコードエンジン1407は、供給されたMPDファイルを、例えば、ビデオESバッファ1408A、多重化部(MUX)1412、ストリームバッファ1414等を介して、ビデオプロセッサ1332の外部に出力し、コネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークに出力させる。
また、MPEG-DASH処理部1416は、画像データを符号化し、その符号化データを格納するMP4ファイルを生成し、そのMP4ファイルを管理するMPDを生成し、そのMPDファイルを、外部ネットワークに出力させるようにしてもよい。さらに、MPEG-DASH処理部1416は、そのMP4ファイルを、MPDファイルとともに外部ネットワークに出力させるようにしてもよい。
また、MPEG-DASH処理部1416は、例えば、コネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークから取得され、ビデオESバッファ1408Bに記憶されているMPDファイルを、エンコード・デコードエンジン1407を介して取得し、それを解析し、そのMPDに基づいて、所望の画像データを取得する。例えば、画像データが符号化された符号化データを含むMP4ファイルがMPDにより管理されている場合、MPEG-DASH処理部1416は、そのMPDに基づいて所望の画像に対応するMP4ファイルを外部ネットワークから取得し、そのMP4ファイルに含まれる符号化データを復号し、復号して得られた画像データをエンコード・デコードエンジン1407に供給する。エンコード・デコードエンジン1407は、供給された画像データを、フレームメモリ1405を介してビデオ出力処理部1404に供給し、ビデオ信号としてビデオプロセッサ1332の外部に出力させる。
このようなMPEG-DASH処理部1416の処理として、上述した各実施の形態の方法を適用するようにしてもよい。つまり、MPEG-DASH処理部1416が、配信データ生成装置101(図11)の画面分割処理部121乃至サーバアップロード処理部126(図12のタイル型MPD生成部141を含む)を有するようにしてもよい。この場合、MPEG-DASH処理部1416は、画像をタイル毎に分割して符号化し、タイル毎のデータを格納するMP4ファイルを生成し、そのMP4ファイルを管理するMPDを生成し、それらを、コネクティビティ1321等を介して配信サーバ102にアップロードする。このようにすることにより、MPEG-DASH処理部1416が、各実施の形態において上述した各種のMPDを生成することができる。
また、MPEG-DASH処理部1416が、端末装置103(図11)のMPD取得部151乃至タイル画像合成部156(図13の表示部157以外の各処理部)を有するようにしてもよい。この場合、MPEG-DASH処理部1416は、MPDを解析して、所望の範囲に含まれるタイルのデータを含むMP4ファイルを、コネクティビティ1321等を介して配信サーバ102からダウンロードし、そのMP4ファイルからそのタイルの符号化データを抽出して復号し、得られたタイルの画像データ(タイル画像)を適宜合成して所望の範囲の画像データを生成し、その画像データをビデオ信号としてビデオプロセッサ1332の外部に出力させる。このようにすることにより、MPEG-DASH処理部1416が、各実施の形態において上述した各種のMPDを処理し、所望の画像データを得ることができる。
つまり、ビデオプロセッサ1332(すなわち、ビデオセット1300)は、部分画像のデータの適応的な提供を実現することができる。
なお、MP4処理部1415やMPEG-DASH処理部1416において、本技術(すなわち、上述した配信データ生成装置101や端末装置103の機能)は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。
<ビデオプロセッサの他の構成例>
図71は、本開示を適用したビデオプロセッサ1332の概略的な構成の他の例を示している。図71の例の場合、ビデオプロセッサ1332は、ビデオデータを所定の方式で符号化・復号する機能を有する。
より具体的には、図71に示されるように、ビデオプロセッサ1332は、制御部1511、ディスプレイインタフェース1512、ディスプレイエンジン1513、画像処理エンジン1514、および内部メモリ1515を有する。また、ビデオプロセッサ1332は、コーデックエンジン1516、メモリインタフェース1517、多重化・逆多重化部(MUX DMUX)1518、ネットワークインタフェース1519、およびビデオインタフェース1520を有する。
制御部1511は、ディスプレイインタフェース1512、ディスプレイエンジン1513、画像処理エンジン1514、およびコーデックエンジン1516等、ビデオプロセッサ1332内の各処理部の動作を制御する。
図71に示されるように、制御部1511は、例えば、メインCPU1531、サブCPU1532、およびシステムコントローラ1533を有する。メインCPU1531は、ビデオプロセッサ1332内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU1531は、そのプログラム等に従って制御信号を生成し、各処理部に供給する(つまり、各処理部の動作を制御する)。サブCPU1532は、メインCPU1531の補助的な役割を果たす。例えば、サブCPU1532は、メインCPU1531が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ1533は、メインCPU1531およびサブCPU1532が実行するプログラムを指定する等、メインCPU1531およびサブCPU1532の動作を制御する。
ディスプレイインタフェース1512は、制御部1511の制御の下、画像データを例えばコネクティビティ1321等に出力する。例えば、ディスプレイインタフェース1512は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、またはデジタルデータの画像データのまま、コネクティビティ1321のモニタ装置等に出力する。
ディスプレイエンジン1513は、制御部1511の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。
画像処理エンジン1514は、制御部1511の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。
内部メモリ1515は、ディスプレイエンジン1513、画像処理エンジン1514、およびコーデックエンジン1516により共用される、ビデオプロセッサ1332の内部に設けられたメモリである。内部メモリ1515は、例えば、ディスプレイエンジン1513、画像処理エンジン1514、およびコーデックエンジン1516の間で行われるデータの授受に利用される。例えば、内部メモリ1515は、ディスプレイエンジン1513、画像処理エンジン1514、またはコーデックエンジン1516から供給されるデータを格納し、必要に応じて(例えば、要求に応じて)、そのデータを、ディスプレイエンジン1513、画像処理エンジン1514、またはコーデックエンジン1516に供給する。この内部メモリ1515は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM(Static Random Access Memory)のような比較的(例えば外部メモリ1312と比較して)小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。
コーデックエンジン1516は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン1516が対応する符号化・復号の方式は任意であり、その数は1つであってもよいし、複数であってもよい。例えば、コーデックエンジン1516は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化若しくは符号化データの復号を行うようにしてもよい。
図71に示される例において、コーデックエンジン1516は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video1541、AVC/H.2641542、HEVC/H.2651543、HEVC/H.265(Scalable)1544、およびHEVC/H.265(Multi-view)1545、並びに、MPEG-DASH1551およびMP4処理部1552を有する。
MPEG-2 Video1541は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.2641542は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.2651543は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)1544は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)1545は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。
MPEG-DASH1551は、MPDやMP4ファイルの生成や再生等、MPEG-DASHの規格に準拠した方法で配信される配信データやその制御情報の生成や再生に関する処理を行う。MP4処理部1552は、MP4ファイルの生成や再生等、MP4ファイルに関する処理を行う。なお、MPEG-DASH1551およびMP4処理部1552は、画像データの符号化・復号を行う場合、上述したMPEG-2 Video1541乃至HEVC/H.265(Multi-view)1545を利用する。
メモリインタフェース1517は、外部メモリ1312用のインタフェースである。画像処理エンジン1514やコーデックエンジン1516から供給されるデータは、メモリインタフェース1517を介して外部メモリ1312に供給される。また、外部メモリ1312から読み出されたデータは、メモリインタフェース1517を介してビデオプロセッサ1332(画像処理エンジン1514若しくはコーデックエンジン1516)に供給される。
多重化・逆多重化部(MUX DMUX)1518は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部(MUX DMUX)1518は、複数のデータを1つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部(MUX DMUX)1518は、1つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部(MUX DMUX)1518は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部(MUX DMUX)1518は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ(ファイルデータ)に変換することができる。もちろん、逆多重化によりその逆変換も可能である。
ネットワークインタフェース1519は、例えばブロードバンドモデム1333やコネクティビティ1321等向けのインタフェースである。ビデオインタフェース1520は、例えばコネクティビティ1321やカメラ1322等向けのインタフェースである。
次に、このようなビデオプロセッサ1332の動作の例について説明する。例えば、コネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース1519を介して多重化・逆多重化部(MUX DMUX)1518に供給されて逆多重化され、コーデックエンジン1516により復号される。コーデックエンジン1516の復号により得られた画像データは、例えば、画像処理エンジン1514により所定の画像処理が施され、ディスプレイエンジン1513により所定の変換が行われ、ディスプレイインタフェース1512を介して例えばコネクティビティ1321等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン1516の復号により得られた画像データは、コーデックエンジン1516により再符号化され、多重化・逆多重化部(MUX DMUX)1518により多重化されてファイルデータに変換され、ビデオインタフェース1520を介して例えばコネクティビティ1321等に出力され、各種記録媒体に記録される。
さらに、例えば、コネクティビティ1321等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース1520を介して多重化・逆多重化部(MUX DMUX)1518に供給されて逆多重化され、コーデックエンジン1516により復号される。コーデックエンジン1516の復号により得られた画像データは、画像処理エンジン1514により所定の画像処理が施され、ディスプレイエンジン1513により所定の変換が行われ、ディスプレイインタフェース1512を介して例えばコネクティビティ1321等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン1516の復号により得られた画像データは、コーデックエンジン1516により再符号化され、多重化・逆多重化部(MUX DMUX)1518により多重化されてトランスポートストリームに変換され、ネットワークインタフェース1519を介して例えばコネクティビティ1321やブロードバンドモデム1333等に供給され図示せぬ他の装置に伝送される。
なお、ビデオプロセッサ1332内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ1515や外部メモリ1312を利用して行われる。また、パワーマネージメントモジュール1313は、例えば制御部1511への電力供給を制御する。
コーデックエンジン1516のMP4処理部1552は、例えば外部メモリ1312から読み出された画像データを取得し、それをMPEG-2 Video1541乃至HEVC/H.265(Multi-view)1545のいずれかを用いて符号化して符号化データを生成し、さらにその符号化データを格納するMP4ファイルを生成する。MP4処理部1552は、生成したMP4ファイルを、例えばメモリインタフェース1517を介して外部メモリ1312に供給し、記憶させる。このMP4ファイルは、例えば、メモリインタフェース1517により読み出され、多重化・逆多重化部(MUX DMUX)1518やネットワークインタフェース1519を介して、ビデオプロセッサ1332の外部に出力し、コネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークに出力させる。
また、MP4処理部1552は、例えば、コネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークから取得され、ネットワークインタフェース1519、多重化・逆多重化部(MUX DMUX)1518、メモリインタフェース1517等を介して外部メモリ1312に供給され、記憶されているMP4ファイルを、メモリインタフェース1517を介して取得する。MP4処理部1552は、取得したMP4ファイルを解析して符号化データを抽出し、さらにその符号化データを、MPEG-2 Video1541乃至HEVC/H.265(Multi-view)1545のいずれかを用いて復号する。MP4処理部1552は、得られた画像データを、例えばメモリインタフェース1517を介して外部メモリ1312に供給し、記憶させる。この画像データは、例えば、メモリインタフェース1517により読み出され、画像処理エンジン1514、ディスプレイエンジン1513、およびディスプレイインタフェース1512等を介して、例えばコネクティビティ1321等に供給され、その画像がモニタに表示される。
このようなMP4処理部1552の処理として、上述した各実施の形態の方法を適用するようにしてもよい。つまり、MP4処理部1552が、配信データ生成装置101(図11)の画面分割処理部121、画像符号化部122、ファイル生成部123、およびサーバアップロード処理部126(図12)を有するようにしてもよい。この場合、MP4処理部1552は、画像をタイル毎に分割して符号化し、タイル毎のデータを格納するMP4ファイルを生成し、それを、コネクティビティ1321等を介して配信サーバ102にアップロードする。このようにすることにより、MP4処理部1552が、各実施の形態において上述した各種のMP4ファイルを生成することができる。
また、MP4処理部1552が、端末装置103(図11)のファイル取得部154、画像復号部155、およびタイル画像合成部156(図13)を有するようにしてもよい。この場合、MP4処理部1552は、所望の範囲に含まれるタイルのデータを含むMP4ファイルを、コネクティビティ1321等を介して配信サーバ102からダウンロードし、そのMP4ファイルからそのタイルの符号化データを抽出して復号し、得られたタイルの画像データ(タイル画像)を適宜合成して所望の範囲の画像データを生成し、その画像データをビデオ信号としてビデオプロセッサ1332の外部に出力させる。このようにすることにより、MP4処理部1552が、各実施の形態において上述した各種のMP4ファイルを処理し、所望の画像データを得ることができる。
つまり、ビデオプロセッサ1332(すなわち、ビデオセット1300)は、部分画像のデータの適応的な提供を実現することができる。
MPEG-DASH1551は、例えば外部メモリ1312から読み出された画像データを取得し、その画像データを管理するMPDを生成する。MPEG-DASH1551は、生成したMPDファイルを、例えばメモリインタフェース1517を介して外部メモリ1312に供給し、記憶させる。このMP4ファイルは、例えば、メモリインタフェース1517により読み出され、多重化・逆多重化部(MUX DMUX)1518やネットワークインタフェース1519を介して、ビデオプロセッサ1332の外部に出力し、コネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークに出力させる。
また、MPEG-DASH1551は、画像データを符号化し、その符号化データを格納するMP4ファイルを生成し、そのMP4ファイルを管理するMPDを生成し、そのMPDファイルを、外部ネットワークに出力させるようにしてもよい。さらに、MPEG-DASH1551は、そのMP4ファイルを、MPDファイルとともに外部ネットワークに出力させるようにしてもよい。
また、MPEG-DASH1551は、例えば、コネクティビティ1321やブロードバンドモデム1333等を介して外部ネットワークから取得され、ネットワークインタフェース1519、多重化・逆多重化部(MUX DMUX)1518、メモリインタフェース1517等を介して外部メモリ1312に供給され、記憶されているMPDファイルを、メモリインタフェース1517を介して取得する。MPEG-DASH1551は、取得したMPDを解析し、そのMPDに基づいて、所望の画像データを取得する。例えば、画像データが符号化された符号化データを含むMP4ファイルがMPDにより管理されている場合、MPEG-DASH1551は、そのMPDに基づいて所望の画像に対応するMP4ファイルを外部ネットワークから取得し、そのMP4ファイルに含まれる符号化データを抽出し、さらにその符号化データを、MPEG-2 Video1541乃至HEVC/H.265(Multi-view)1545のいずれかを用いて復号する。MPEG-DASH1551は、得られた画像データを、例えばメモリインタフェース1517を介して外部メモリ1312に供給し、記憶させる。この画像データは、例えば、メモリインタフェース1517により読み出され、画像処理エンジン1514、ディスプレイエンジン1513、およびディスプレイインタフェース1512等を介して、例えばコネクティビティ1321等に供給され、その画像がモニタに表示される。
このようなMPEG-DASH1551の処理として、上述した各実施の形態の方法を適用するようにしてもよい。つまり、MPEG-DASH1551が、配信データ生成装置101(図11)の画面分割処理部121乃至サーバアップロード処理部126(図12のタイル型MPD生成部141を含む)を有するようにしてもよい。この場合、MPEG-DASH1551は、画像をタイル毎に分割して符号化し、タイル毎のデータを格納するMP4ファイルを生成し、そのMP4ファイルを管理するMPDを生成し、それらを、コネクティビティ1321等を介して配信サーバ102にアップロードする。このようにすることにより、MPEG-DASH1551が、各実施の形態において上述した各種のMPDを生成することができる。
また、MPEG-DASH1551が、端末装置103(図11)のMPD取得部151乃至タイル画像合成部156(図13の表示部157以外の各処理部)を有するようにしてもよい。この場合、MPEG-DASH1551は、MPDを解析して、所望の範囲に含まれるタイルのデータを含むMP4ファイルを、コネクティビティ1321等を介して配信サーバ102からダウンロードし、そのMP4ファイルからそのタイルの符号化データを抽出して復号し、得られたタイルの画像データ(タイル画像)を適宜合成して所望の範囲の画像データを生成し、その画像データをビデオ信号としてビデオプロセッサ1332の外部に出力させる。このようにすることにより、MPEG-DASH1551が、各実施の形態において上述した各種のMPDを処理し、所望の画像データを得ることができる。
つまり、ビデオプロセッサ1332(すなわち、ビデオセット1300)は、部分画像のデータの適応的な提供を実現することができる。
なお、MPEG-DASH1551やMP4処理部1552において、本技術(すなわち、上述した配信データ生成装置101や端末装置103の機能)は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。
以上にビデオプロセッサ1332の構成を2例示したが、ビデオプロセッサ1332の構成は任意であり、上述した2例以外のものであってもよい。また、このビデオプロセッサ1332は、1つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する3次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。
<装置への適用例>
ビデオセット1300は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット1300は、テレビジョン装置900(図67)や携帯電話機920(図68)等に組み込むことができる。ビデオセット1300を組み込むことにより、その装置は、図1乃至図66を参照して上述した効果と同様の効果を得ることができる。
なお、上述したビデオセット1300の各構成の一部であっても、ビデオプロセッサ1332を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ1332のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線1341により示されるプロセッサやビデオモジュール1311等を本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール1311、外部メモリ1312、パワーマネージメントモジュール1313、およびフロントエンドモジュール1314を組み合わせ、本技術を適用したビデオユニット1361として実施することもできる。いずれの構成の場合であっても、図1乃至図66を参照して上述した効果と同様の効果を得ることができる。
つまり、ビデオプロセッサ1332を含むものであればどのような構成であっても、ビデオセット1300の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ1332、点線1341により示されるプロセッサ、ビデオモジュール1311、または、ビデオユニット1361を、テレビジョン装置900(図67)や携帯電話機920(図68)等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット1300の場合と同様に、図1乃至図66を参照して上述した効果と同様の効果を得ることができる。
本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
また、以上において、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
上述した実施形態に係る情報処理装置は、例えば、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。
また、本明細書では、各種メタデータが、ビットストリームに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、ビットストリームに多重化されることなく、ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像(スライス若しくはブロックなど、画像の一部であってもよい)と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像のビットストリームとは別の伝送路上で伝送されてもよい。また、情報は、画像のビットストリームとは別の記録媒体(又は同一の記録媒体の別の記録エリア)に記録されてもよい。さらに、情報と画像のビットストリームとは、例えば、複数フレーム、1フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。
なお、本技術は以下のような構成も取ることができる。
(1) 全体画像の一部である部分画像に関する情報である部分画像情報を生成する部分画像情報生成部と、
前記部分画像情報生成部により生成された前記部分画像情報を用いて、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを生成するメタデータ生成部と
を備える情報処理装置。
(2) 前記部分画像情報は、
前記部分画像情報に対応する画像が部分画像であるかを示すビュータイプと、
前記全体画像のサイズに関する情報と、
前記全体画像における前記部分画像の位置を示す情報と、
前記部分画像が属する、1画像として表示可能な部分画像のグループを識別するグループ識別情報と
を含む
(1)に記載の情報処理装置。
(3) 前記メタデータ生成部は、互いに同じ前記グループに属する複数の部分画像のそれぞれの部分画像情報を、前記メタデータの互いに異なるアダプテーションセット(AdaptationSet)に格納し、前記複数の部分画像のそれぞれのビットストリームを、互いに異なるアダプテーションセットに割り当てる
(1)または(2)に記載の情報処理装置。
(4) 前記メタデータ生成部は、互いに同じ前記グループに属する複数の部分画像のそれぞれの部分画像情報を、前記メタデータの1つのアダプテーションセット(AdaptationSet)に属する互いに異なるリプレゼンテーション(Representation)に格納し、前記複数の部分画像のそれぞれのビットストリームを、互いに異なるリプレゼンテーションに割り当てる
(1)乃至(3)のいずれかに記載の情報処理装置。
(5) 前記メタデータ生成部は、互いに同じ前記グループに属する複数の部分画像のそれぞれの部分画像情報を、前記メタデータの互いに異なるアダプテーションセット(AdaptationSet)に格納し、前記複数の部分画像を含む1つのビットストリームが部分画像毎に分割された複数のファイルのそれぞれを、互いに異なるアダプテーションセットに割り当てる
(1)乃至(4)のいずれかに記載の情報処理装置。
(6) 前記部分画像情報生成部は、前記ビットストリームに含まれる制御情報についての前記部分画像情報をさらに生成し、
前記メタデータ生成部は、前記制御情報の部分画像情報を、各部分画像の部分画像情報とは異なるアダプテーションセットに格納し、前記制御情報のファイルを、前記アダプテーションセットに割り当てる
(1)乃至(5)のいずれかに記載の情報処理装置。
(7) 前記メタデータ生成部は、互いに同じ前記グループに属する複数の部分画像のそれぞれの部分画像情報を、前記メタデータの全体画像と同じアダプテーションセット(AdaptationSet)に属する互いに異なるリプレゼンテーション(Representation)に格納し、前記複数の部分画像のそれぞれのビットストリームを、互いに異なるリプレゼンテーションに割り当てる
(1)乃至(6)のいずれかに記載の情報処理装置。
(8) 前記部分画像情報生成部は、互いに同じ前記グループに属する複数の部分画像を含む1つのビットストリームに含まれる制御情報についての前記部分画像情報をさらに生成し、
前記メタデータ生成部は、
前記複数の部分画像のそれぞれの部分画像情報を、前記メタデータの1つのアダプテーションセット(AdaptationSet)に属する互いに異なるリプレゼンテーション(Representation)に格納し、前記ビットストリームが部分画像毎に分割された複数のファイルのそれぞれを、互いに異なるリプレゼンテーションに割り当て、
前記制御情報の部分画像情報を、各部分画像の部分画像情報とは異なるリプレゼンテーションに格納し、前記制御情報のファイルを、前記リプレゼンテーションに割り当てる
(1)乃至(7)のいずれかに記載の情報処理装置。
(9) 前記メタデータ生成部は、互いに同じ前記グループに属する複数の部分画像のそれぞれの部分画像情報を、前記メタデータの1つのアダプテーションセット(AdaptationSet)に属する1つのリプレゼンテーション(Representation)に属する互いに異なるサブリプレゼンテーション(Sub-Representation)に格納し、前記複数の部分画像のそれぞれのビットストリームを、互いに異なるサブリプレゼンテーションに割り当てる
(1)乃至(8)のいずれかに記載の情報処理装置。
(10) 前記部分画像情報生成部は、サブリプレゼンテーション(Sub-Representation)の下にビットストリームの情報が存在することを示すセグメント情報と、互いに同じ前記グループに属する複数の部分画像を含む1つのビットストリームに含まれる制御情報についての前記部分画像情報とをさらに生成し、
前記メタデータ生成部は、
前記制御情報の部分画像情報および前記セグメント情報を、前記メタデータの1つのアダプテーションセット(AdaptationSet)に属する1つのリプレゼンテーション(Representation)に格納し、前記制御情報のファイルを、前記リプレゼンテーションに割り当て、
前記複数の部分画像のそれぞれの部分画像情報を、前記リプレゼンテーションに属する互いに異なるサブリプレゼンテーションに格納し、前記ビットストリームが部分画像毎に分割された複数のファイルのそれぞれを、互いに異なるサブリプレゼンテーションに割り当てる
(1)乃至(9)のいずれかに記載の情報処理装置。
(11) 前記部分画像情報生成部は、サブリプレゼンテーション(Sub-Representation)の下にビットストリームの情報が存在することを示すセグメント情報と、互いに同じ前記グループに属する複数の部分画像を含む1つのビットストリームに含まれる制御情報についての前記部分画像情報とをさらに生成し、
前記メタデータ生成部は、
前記制御情報の部分画像情報および前記セグメント情報を前記メタデータの1つのアダプテーションセット(AdaptationSet)に属する1つのリプレゼンテーション(Representation)に格納し、前記ビットストリームを前記リプレゼンテーションに割り当て、
前記複数の部分画像のそれぞれの部分画像情報を、前記リプレゼンテーションに属する互いに異なるサブリプレゼンテーションに格納し、前記ビットストリームにおける各部分画像のデータの場所を示す情報を、互いに異なるサブリプレゼンテーションに割り当てる
(1)乃至(10)のいずれかに記載の情報処理装置。
(12) 前記部分画像情報生成部は、リプレゼンテーション(Representation)の下に同時刻のビットストリームの情報が複数存在することを示すマルチセグメント情報をさらに生成し、
前記メタデータ生成部は、
前記マルチセグメント情報を前記メタデータの1つのアダプテーションセット(AdaptationSet)に属する1つのリプレゼンテーション(Representation)に格納し、
互いに同じ前記グループに属する複数の部分画像のそれぞれの部分画像情報を、前記リプレゼンテーションに属する互いに異なるセグメント(Segment)に格納し、前記複数の部分画像のそれぞれのビットストリームを、互いに異なるセグメントに割り当てる
(1)乃至(11)のいずれかに記載の情報処理装置。
(13) 前記部分画像情報生成部は、サブリプレゼンテーション(Sub-Representation)の下にビットストリームの情報が存在しないことを示すセグメント情報と、互いに同じ前記グループに属する複数の部分画像を含む1つのビットストリームについての前記部分画像情報とをさらに生成し、
前記メタデータ生成部は、
前記セグメント情報を前記メタデータの1つのアダプテーションセット(AdaptationSet)に属する1つのリプレゼンテーション(Representation)に格納し、
前記部分画像情報を前記リプレゼンテーションに属する1つのセグメント(Segment)に格納し、前記ビットストリームを前記セグメントに割り当て、
前記ビットストリームにおける各部分画像のデータの場所を示す情報を、前記セグメントに属する、互いに異なるサブセグメント(Sub-Segment)に割り当てる
(1)乃至(12)のいずれかに記載の情報処理装置。
(14) 前記全体画像および前記部分画像の画像データを符号化し、ビットストリームを生成する符号化部をさらに備える
(1)乃至(13)のいずれかに記載の情報処理装置。
(15) 前記全体画像の画像データから各部分画像の画像データを生成する画面分割処理部をさらに備える
(1)乃至(14)のいずれかに記載の情報処理装置。
(16) 全体画像の一部である部分画像に関する情報である部分画像情報を生成し、
生成された前記部分画像情報を用いて、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを生成する
情報処理方法。
(17) 全体画像の一部である部分画像に関する情報である部分画像情報を含み、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを解析し、前記部分画像情報を得る解析部と、
前記解析部により得られた前記部分画像情報を用いて、所望の部分画像のビットストリームを選択する選択部と、
前記選択部により選択されたビットストリームを取得するビットストリーム取得部と
を備える情報処理装置。
(18) 前記メタデータを取得するメタデータ取得部をさらに備える
(17)に記載の情報処理装置。
(19) 前記ビットストリーム取得部により取得された前記ビットストリームを復号する復号部をさらに備える
(17)または(18)に記載の情報処理装置。
(20) 全体画像の一部である部分画像に関する情報である部分画像情報を含み、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを解析し、前記部分画像情報を得て、
得られた前記部分画像情報を用いて、所望の部分画像のビットストリームを選択し、
選択されたビットストリームを取得する
情報処理方法。
(21) 全体画像の一部である部分画像に関する情報である部分画像情報を生成する部分画像情報生成部と、
前記部分画像情報生成部により生成された前記部分画像情報を用いて、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを生成するメタデータ生成部と
を備え、
前記部分画像情報は、前記部分画像情報が格納されるアダプテーションセット(AdaptationSet)のコンテンツソースが他のアダプテーションセットのコンテンツソースと同一であるか否かを示す識別情報を含む
情報処理装置。
(22) 前記部分画像情報は、
前記全体画像における前記部分画像の位置を示す情報と、
前記部分画像のサイズに関する情報と、
前記全体画像のサイズに関する情報と
をさらに含む
(21)に記載の情報処理装置。
(23) 前記部分画像情報は、前記部分画像情報が格納されるアダプテーションセットがビットストリーム全体を定義するのか、ビットストリームの一部を定義するのかを示す識別情報をさらに含む
(21)または(22)に記載の情報処理装置。
(24) 前記部分画像情報は、前記部分画像情報が格納されるアダプテーションセットが対応するビットストリームの一部がどのような情報で構成されているかを示す情報をさらに含む
(21)乃至(23)のいずれかに記載の情報処理装置。
(25) 前記部分画像情報は、前記部分画像情報が格納されるアダプテーションセットが対応するビットストリームの一部がトラックに分割されているかを示す情報をさらに含む
(21)乃至(24)のいずれかに記載の情報処理装置。
(26) 前記部分画像情報は、前記部分画像情報が格納されるアダプテーションセットが対応する前記部分画像の識別情報をさらに含む
(21)乃至(25)のいずれかに記載の情報処理装置。
(27)前記部分画像情報は、トラックリファレンスとエクストラクタを含み、
前記トラックリファレンスとエクストラクタは、複数の前記部分画像のそれぞれに対応する各トラックに格納され、前記部分画像のスライスを格納するベーストラックを参照する
(21)乃至(26)のいずれかに記載の情報処理装置。
(28) 全体画像の一部である部分画像に関する情報であり、前記部分画像情報が格納されるアダプテーションセット(AdaptationSet)のコンテンツソースが他のアダプテーションセットのコンテンツソースと同一であるか否かを示す識別情報を含む部分画像情報を生成し、
生成された前記部分画像情報を用いて、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを生成する
情報処理方法。
(29) 全体画像の一部である部分画像に関する情報である部分画像情報を含み、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを解析し、前記部分画像情報を得る解析部と、
前記解析部により得られた前記部分画像情報を用いて、所望の部分画像のビットストリームを選択する選択部と、
前記選択部により選択されたビットストリームを取得するビットストリーム取得部と
を備え、
前記部分画像情報は、前記部分画像情報が格納されるアダプテーションセット(AdaptationSet)のコンテンツソースが他のアダプテーションセットのコンテンツソースと同一であるか否かを示す識別情報を含む
情報処理装置。
(30) 全体画像の一部である部分画像に関する情報であり、前記部分画像情報が格納されるアダプテーションセット(AdaptationSet)のコンテンツソースが他のアダプテーションセットのコンテンツソースと同一であるか否かを示す識別情報を含む部分画像情報を含み、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを解析し、前記部分画像情報を得て、
得られた前記部分画像情報を用いて、所望の部分画像のビットストリームを選択し、
選択されたビットストリームを取得する
情報処理方法。
(41) 全体画像の一部である部分画像に関する情報である部分画像情報を生成する部分画像情報生成部と、
前記部分画像情報生成部により生成された前記部分画像情報を用いて、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを生成するメタデータ生成部と
を備える情報処理装置。
(42) 前記部分画像情報は、前記部分画像の前記全体画像内の位置を示す位置情報を含む
(41)に記載の情報処理装置。
(43) 前記位置情報は、前記部分画像の左上の位置を示す
(42)に記載の情報処理装置。
(44) 前記メタデータ生成部は、複数の部分画像のそれぞれの部分画像情報を、前記メタデータの互いに異なるアダプテーションセット(AdaptationSet)に格納し、前記複数の部分画像のそれぞれのビットストリームを、互いに異なるアダプテーションセットに割り当てる
(41)乃至(43)のいずれかに記載の情報処理装置。
(45) 前記メタデータ生成部は、複数の部分画像のそれぞれの部分画像情報を、前記メタデータの互いに異なるアダプテーションセット(AdaptationSet)に格納し、前記複数の部分画像を含む1つのビットストリームが部分画像毎に分割された複数のファイルのそれぞれを、互いに異なるアダプテーションセットに割り当てる
(41)乃至(44)のいずれかに記載の情報処理装置。
(46) 前記メタデータ生成部は、複数の部分画像のそれぞれの部分画像情報を、前記メタデータの1つのアダプテーションセット(AdaptationSet)に属する1つのリプレゼンテーション(Representation)に属する互いに異なるサブリプレゼンテーション(Sub-Representation)に格納し、前記複数の部分画像のそれぞれのビットストリームを、互いに異なるサブリプレゼンテーションに割り当てる
(41)乃至(45)のいずれかに記載の情報処理装置。
(47) 前記部分画像情報生成部は、サブリプレゼンテーション(Sub-Representation)の下にビットストリームの情報が存在することを示す情報をさらに生成する
(46)に記載の情報処理装置。
(48) 前記複数の部分画像のそれぞれのビットストリームは、1つのMP4ファイルのそれぞれのTRACKに格納される
(46)または(47)に記載の情報処理装置。
(49) 前記メタデータ生成部は、前記1つのMP4ファイルのデータの場所を示す情報をさらに生成する
(48)に記載の情報処理装置。
(50) 前記部分画像情報は、前記全体画像のサイズに関する情報をさらにを含む
(41)乃至(49)のいずれかに記載の情報処理装置。
(51) 前記部分画像情報は、前記部分画像が属する、1画像として表示可能な部分画像のグループを識別するグループ識別情報をさらに含む
(41)乃至(50)のいずれかに記載の情報処理装置。
(52) 前記全体画像および前記部分画像の画像データを符号化し、ビットストリームを生成する符号化部をさらに備える
(41)乃至(51)のいずれかに記載の情報処理装置。
(53) 前記全体画像の画像データから各部分画像の画像データを生成する画面分割処理部をさらに備える
(41)乃至(52)のいずれかに記載の情報処理装置。
(54) 前記部分画像情報は、
前記全体画像を構成する前記部分画像の数を示す情報と、
前記部分画像の大きさが均等であるかを表す識別情報と、
前記部分画像の大きさが均等で無い場合、各部分画像の位置および大きさを示す情報と
を含む
(41)乃至(53)のいずれかに記載の情報処理装置。
(55) 全体画像の一部である部分画像に関する情報である部分画像情報を生成し、
生成された前記部分画像情報を用いて、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを生成する
情報処理方法。
(56) 全体画像の一部である部分画像に関する情報である部分画像情報を含み、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを解析し、前記部分画像情報を得る解析部と、
前記解析部により得られた前記部分画像情報を用いて、所望の部分画像のビットストリームを選択する選択部と、
前記選択部により選択されたビットストリームを取得するビットストリーム取得部と
を備える情報処理装置。
(57) 前記部分画像情報は、前記部分画像の前記全体画像内の位置を示す位置情報を含む
(56)に記載の情報処理装置。
(58) 前記位置情報は、前記部分画像の左上の位置を示す
(57)に記載の情報処理装置。
(59) 前記解析部は、複数の部分画像のそれぞれの部分画像情報が、互いに異なるアダプテーションセット(AdaptationSet)に格納され、前記複数の部分画像のそれぞれのビットストリームが、互いに異なるアダプテーションセットに割り当てられた前記メタデータを解析する
(56)乃至(58)のいずれかに記載の情報処理装置。
(60) 前記解析部は、複数の部分画像のそれぞれの部分画像情報が、互いに異なるアダプテーションセット(AdaptationSet)に格納され、前記複数の部分画像を含む1つのビットストリームが部分画像毎に分割された複数のファイルのそれぞれが、互いに異なるアダプテーションセットに割り当てられた前記メタデータを解析する
(56)乃至(59)のいずれかに記載の情報処理装置。
(61) 前記解析部は、複数の部分画像のそれぞれの部分画像情報が、1つのアダプテーションセット(AdaptationSet)に属する1つのリプレゼンテーション(Representation)に属する互いに異なるサブリプレゼンテーション(Sub-Representation)に格納され、前記複数の部分画像のそれぞれのビットストリームが、互いに異なるサブリプレゼンテーションに割り当てられた前記メタデータを解析する
(56)乃至(60)のいずれかに記載の情報処理装置。
(62) 前記部分画像情報は、サブリプレゼンテーション(Sub-Representation)の下にビットストリームの情報が存在することを示す情報を含む
(61)に記載の情報処理装置。
(63) 前記複数の部分画像のそれぞれのビットストリームは、1つのMP4ファイルのそれぞれのTRACKに格納される
(61)または(62)に記載の情報処理装置。
(64) 前記メタデータは、前記1つのMP4ファイルのデータの場所を示す情報を含む
(63)に記載の情報処理装置。
(65) 前記部分画像情報は、前記全体画像のサイズに関する情報をさらにを含む
(56)乃至(64)のいずれかに記載の情報処理装置。
(66) 前記部分画像情報は、前記部分画像が属する、1画像として表示可能な部分画像のグループを識別するグループ識別情報をさらに含む
(56)乃至(65)のいずれかに記載の情報処理装置。
(67) 前記ビットストリーム取得部により取得された前記ビットストリームを復号する復号部をさらに備える
(56)乃至(66)のいずれかに記載の情報処理装置。
(68) 前記復号部により前記ビットストリームが復号されて得られた前記部分画像の画像データから全体画像の画像データを生成する画面合成処理部をさらに備える
(67)に記載の情報処理装置。
(69) 前記部分画像情報は、
前記全体画像を構成する前記部分画像の数を示す情報と、
前記部分画像の大きさが均等であるかを表す識別情報と、
前記部分画像の大きさが均等で無い場合、各部分画像の位置および大きさを示す情報と
を含む
(56)乃至(68)のいずれかに記載の情報処理装置。
(70) 全体画像の一部である部分画像に関する情報である部分画像情報を含み、前記全体画像のビットストリームの提供および前記部分画像のビットストリームの提供に利用されるメタデータを解析し、前記部分画像情報を得て、
得られた前記部分画像情報を用いて、所望の部分画像のビットストリームを選択し、
選択されたビットストリームを取得する
情報処理方法。