WO2017169891A1

WO2017169891A1 - 情報処理装置および方法

Info

Publication number: WO2017169891A1
Application number: PCT/JP2017/010872
Authority: WO
Inventors: 俊也浜田; 充勝股; 平林　光浩
Original assignee: ソニー株式会社
Priority date: 2016-03-31
Filing date: 2017-03-17
Publication date: 2017-10-05
Also published as: JPWO2017169891A1; US20200314163A1; CN109155867A

Abstract

本開示は、コンテンツデータをより安定的に伝送することができるようにする情報処理装置および方法に関する。コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を設定するようにする。本開示は、例えば、情報処理装置、ファイル生成装置、配信サーバ、または再生端末等に適用することができる。

Description

情報処理装置および方法

　本開示は、情報処理装置および方法に関し、特に、コンテンツデータをより安定的に伝送することができるようにした情報処理装置および方法に関する。

　従来、映像や音楽のデータを、インターネットを介したストリーミング配信するために、MPEG-DASH（Moving Picture Experts Group phase － Dynamic Adaptive Streaming over HTTP）が開発された（例えば、非特許文献１参照）。さらに、高品位な映像と音楽をユーザに送る手段として、ISO/IEC14496-12で規定されたISO（International Organization for Standardization） Base Media File Format(ISOBMFF)形式のファイルを使い、MPEG-DASHでストリーミング配信することが考えられた。映像や音楽のデータは高品質化が進み、それとともに、配信においてもより高品質なデータの配信が求められている。

　例えば、音楽の高品位符号化についてはDSD（Direct Stream Digital）が高品質な符号化方式として知られている。DSDデータは高レートであるため、ロスレスで圧縮する方式（DSD可逆圧縮方式）が考えられた。近年、より負荷の小さい新たなDSD可逆圧縮符号化方式も考えられた。

MPEG－DASH(Dynamic Adaptive Streaming over HTTP)（URL:http://mpeg.chiariglione.org/standards/mpeg－dash/media－presentation－description－and－segment－formats/text－isoiec－23009－12012－dam－1）

　このように高品位なデータの配信が行われるようになっても、伝送帯域や互換性の観点から、従来の低品位なデータの配信も併用することが求められている。つまり、符号化方式が異なるデータ間でのスイッチング（配信データの切り替え）を行うことが求められる。

　しかしながら、MPEG-DASHのMPD（Media Presentation Description）においては、符号化方式が異なるデータは異なるアダプテーションセット（Adaptation Set）で管理される。そして、従来のMPEG-DASH規格においては、このアダプテーションセットを越えたスイッチングは考慮されておらず、このようなスイッチングを実現することは困難であった。そのため、より高品位のコンテンツデータの配信を安定的に行うことが困難であった。

　本開示は、このような状況に鑑みてなされたものであり、コンテンツデータをより安定的に伝送することができるようにするものである。

　本技術の一側面の情報処理装置は、コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を設定する設定部を備える情報処理装置である。

　前記切り替えに関する情報は、再生するデータの前記第１の管理単位を越える切り替えの、切り替え先として許可する管理単位を指定する情報であるようにすることができる。

　前記管理単位を指定する情報は、前記切り替え先として許可する、他の前記第１の管理単位を指定する情報、または、他の前記第１の管理単位内の各データを管理する第２の管理単位を指定する情報であるようにすることができる。

　前記設定部は、前記管理単位を指定する情報を、前記管理情報の前記第１の管理単位、または、前記管理情報の前記第１の管理単位内の各データを管理する第２の管理単位に設定することができる。

　前記切り替えに関する情報は、再生するデータの前記第１の管理単位を越える切り替えを許可するタイミングを指定する情報であるようにすることができる。

　前記タイミングは、前記データの再生時間方向の管理単位である第２の管理単位の境界であり、前記タイミングを指定する情報は、再生するデータの前記第１の管理単位を越える切り替えを許可する前記第２の管理単位の境界を指定する情報であるようにすることができる。

　前記タイミングを指定する情報は、前記タイミングを、次のタイミングまでの前記第２の管理単位の数で指定する情報であるようにすることができる。

　前記タイミングにおいて、切り替え元のデータと切り替え先のデータとの間で再生時刻が一致しているようにすることができる。

　前記設定部は、前記タイミングを指定する情報を、前記管理情報の前記第１の管理単位、または、前記管理情報の前記第１の管理単位内の各データを管理する第２の管理単位に設定することができる。

　前記切り替えに関する情報は、再生するデータの前記第１の管理単位を越える切り替えの、優先順に関する情報であるようにすることができる。

　前記優先順に関する情報は、前記第１の管理単位の優先順を示す情報であるようにすることができる。

　前記優先順に関する情報は、前記第１の管理単位のグループの優先順を示す情報であるようにすることができる。

　前記設定部は、前記優先順に関する情報を前記第１の管理単位に設定することができる。

　前記データは、オーディオアナログ信号がΔΣ変調されたDSD（Direct Stream Digital）データが可逆符号化されて得られたDSDロスレスストリームを格納する、ISO/IEC14496に準拠したファイルフォーマットのファイルであるようにすることができる。

　前記設定部の設定に基づいて前記管理情報のファイルを生成するファイル生成部をさらに備えるようにすることができる。

　前記データを生成するデータ生成部をさらに備え、前記ファイル生成部は、前記データ生成部により生成されたデータの前記管理情報のファイルを生成するように構成されるようにすることができる。

　前記ファイル生成部により生成された前記ファイルを、サーバに送信する送信部をさらに備えるようにすることができる。

　本技術の一側面の情報処理方法は、コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を設定する情報処理方法である。

　本技術の他の側面の情報処理装置は、コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を解析する解析部と、前記解析部の解析結果に基づいて、再生するデータの切り替えを制御する制御部とを備える情報処理装置である。

　本技術の他の側面の情報処理方法は、コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を解析し、その解析結果に基づいて、再生するデータの切り替えを制御する情報処理方法である。

　本技術の一側面の情報処理装置および方法においては、コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報が設定される。

　本技術の他の側面の情報処理装置および方法においては、コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報が解析され、その解析結果に基づいて、再生するデータの切り替えが制御される。

　本開示によれば、情報を処理することができる。特に、コンテンツデータをより安定的に伝送することができる。

MPEG-DASHを用いたデータ伝送の様子の例を説明する図である。 MPDの構成例を示す図である。コンテンツの時間的区切りを説明する図である。 MPDにおけるPeriod以下の階層構造の例を示す図である。 MPDファイルの構成例を時間軸上で説明する図である。 DSD方式を説明する図である。ストリーミング配信のビットレート変動の様子の例を説明する図である。圧縮符号化装置の主な構成例を示すブロック図である。データ発生カウントテーブルpretableの作成方法を説明する図である。変換テーブルtable1を説明する図である。エンコード部の構成例を示すブロック図である。圧縮符号化処理を説明するフローチャートである。復号装置の主な構成例を示ブロック図である。復号処理を説明するフローチャートである。 DSDロスレスストリームの主な構成例を示す図である。 DSDロスレスストリームのシンタクスの例を示す図である。 MPDの構成例を示す図である。 MPDの構成例を示す図である。 @ContentSwitchingAlignmentCycleについて説明する図である。 MPDの構成例を示す図である。 MPDの記述例を示す図である。 MPDの記述例を示す図である。 MPDの構成例を示す図である。 MPDの記述例を示す図である。 MPDの構成例を示す図である。 MPDの記述例を示す図である。 MPDの記述例を示す図である。 MPDの構成例を示す図である。 MPDの記述例を示す図である。配信システムの主な構成例を示すブロック図である。ファイル生成装置の主な構成例を示すブロック図である。配信用データ生成処理の流れの例を説明するフローチャートである。 MPDファイル生成処理の流れの例を説明するフローチャートである。再生端末の主な構成例を示すブロック図である。再生処理の流れの例を説明するフローチャートである。パース処理の流れの例を説明するフローチャートである。コンテンツファイル取得処理の流れの例を説明するフローチャートである。スイッチングの制限の例を示す図である。 @stabilityRankingの例を示す図である。 @stabilityRankingを用いたスイッチングの制御例を示す図である。 MPDの記述例を示す図である。 @stabilityRankingを用いたスイッチングの制御例を示す図である。ファイル生成装置の主な構成例を示すブロック図である。 MPDファイル生成処理の流れの例を説明するフローチャートである。再生端末の主な構成例を示すブロック図である。パース処理の流れの例を説明するフローチャートである。コンテンツファイル取得処理の流れの例を説明するフローチャートである。スイッチング処理の流れの例を説明するフローチャートである。 @stabilityRankingと@stabilityRankingGroupの例を示す図である。 @stabilityRankingと@stabilityRankingGroupとを用いたスイッチングの制御例を示す図である。 @stabilityRankingと@stabilityRankingGroupとを用いたスイッチングの制御例を示す図である。 @stabilityRankingと@stabilityRankingGroupとを用いたスイッチングの制御例を示す図である。 @stabilityRankingと@stabilityRankingGroupとを用いたスイッチングの制御例を示す図である。ファイル生成装置の主な構成例を示すブロック図である。 MPDファイル生成処理の流れの例を説明するフローチャートである。グループ化と優先順付加の様子の例を説明する図である。再生端末の主な構成例を示すブロック図である。パース処理の流れの例を説明するフローチャートである。コンテンツファイル取得処理の流れの例を説明するフローチャートである。スイッチング処理の流れの例を説明するフローチャートである。コンピュータの主な構成例を示すブロック図である。

　以下、本開示を実施するための形態（以下実施の形態とする）について説明する。なお、説明は以下の順序で行う。
　１．アダプテーションセットを越えたスイッチング
　２．第１の実施の形態（配信システム：スイッチング先指定情報とタイミング指定情報）
　３．第２の実施の形態（配信システム：選択優先順情報）
　４．第３の実施の形態（配信システム：グループ情報）
　５．その他

　＜１．アダプテーションセットを越えたスイッチング＞
　　＜映像や音声の配信＞
　近年、映像と音楽を消費者に届ける手段として、インターネットを介したストリーミング配信が期待されている。しかしながら、伝送手段としてのインターネットは、放送や光ディスクと比べて伝送が不安定である。まずユーザの環境によって伝送帯域の最高レートが大きく変わる。さらに同一ユーザであっても常に一定の伝送帯域が確保されていることはなく、時間の経過で変動する。また伝送帯域が変動するということは、クライアントからの要求に対する応答時間が一定ではないということでもある。

　このようなインターネットを介した伝送のための規格として、MPEG-DASH（Moving Picture Experts Group - Dynamic Adaptive Streaming over HTTP）が開発されている。サーバ側にデータサイズが異なる複数のファイルを置いておき、クライアントがMPD（Media Presentation Description）を参照して最適なファイルを選択するというプル型のモデルである。特殊なプロトコルを使わずhttpを用いることで、一般的なHTTP（HyperText Transfer Protocol）サーバが利用できる。ファイル形式は、MPEG-TS（Moving Picture Experts Group - Transport Stream）だけでなく、ISOBMFF（International Organization for Standardization Base Media File Format）形式のファイルが使われている。

　　＜MPEG-DASH＞
　MPEG-DASHを用いたデータ伝送の様子の例を図１に示す。図１の情報処理システム１において、ファイル生成装置２は、動画コンテンツとして、ビデオデータやオーディオデータを生成し、符号化し、伝送用のファイルフォーマットでファイル化する。例えば、ファイル生成装置２は、これらのデータを１０秒程度の時間毎にファイル化する（セグメント化する）。ファイル生成装置２は、生成したセグメントファイルを、Webサーバ３にアップロードする。また、ファイル生成装置２は、動画コンテンツを管理するMPDファイル（管理ファイル）を生成し、それをWebサーバ３にアップロードする。

　DASHサーバとしてのWebサーバ３は、ファイル生成装置２により生成された動画コンテンツのファイルを、MPEG－DASHに準ずる方式で、インターネット４を介して再生端末５にライブ配信する。例えば、Webサーバ３は、ファイル生成装置２からアップロードされたセグメントファイルやMPDファイルを格納する。また、Webサーバ３は、再生端末５からの要求に応じて、格納しているセグメントファイルやMPDファイルを再生端末５に送信する。

　再生端末５（再生装置）は、ストリーミングデータの制御用ソフトウエア（以下、制御用ソフトウエアとも称する）６、動画再生ソフトウエア７、HTTPアクセス用のクライアント・ソフトウエア(以下、アクセス用ソフトウエアという)８等を実行する。

　制御用ソフトウエア６は、Webサーバ３からストリーミングするデータを制御するソフトウエアである。例えば、制御用ソフトウエア６は、Webサーバ３からMPDファイルを取得する。また、制御用ソフトウエア６は、例えば、そのMPDファイルや動画再生ソフトウエア７により指定される再生時刻等を表す再生時刻情報、およびインターネット４のネットワーク帯域に基づいて、再生対象のセグメントファイルの送信要求を、アクセス用ソフトウエア８に指令する。

　動画再生ソフトウエア７は、インターネット４を介してWebサーバ３から取得された符号化ストリームを再生するソフトウエアである。例えば、動画再生ソフトウエア７は、再生時刻情報を制御用ソフトウエア６に指定する。また、動画再生ソフトウエア７は、アクセス用ソフトウエア８から受信開始の通知を取得すると、アクセス用ソフトウエア８から供給される符号化ストリームを復号する。動画再生ソフトウエア７は、復号の結果得られるビデオデータやオーディオデータを出力する。

　アクセス用ソフトウエア８は、HTTPを用いたWebサーバ３との通信を制御するソフトウエアである。例えば、アクセス用ソフトウエア８は、受信開始の通知を動画再生ソフトウエア７に供給する。また、アクセス用ソフトウエア８は、制御用ソフトウエア６の指令に応じて、再生対象のセグメントファイルの符号化ストリームの送信要求をWebサーバ３に送信する。さらに、アクセス用ソフトウエア８は、その送信要求に応じてWebサーバ３から送信されてくる、通信環境等に応じたビットレートのセグメントファイルを受信する。そして、アクセス用ソフトウエア８は、その受信したファイルから符号化ストリームを抽出し、動画再生ソフトウエア７に供給する。

　　＜MPD＞
　次に、MPDについて説明する。MPDは、例えば図２に示されるような構成を有する。MPDの解析（パース）においては、クライアント（図１の例の場合、再生端末５）は、MPD（図２のMedia Presentation）のピリオド（Period）に含まれるリプレゼンテーション（Representation）の属性から最適なものを選択する。

　クライアントは、選択したリプレゼンテーション（Representation）の先頭のセグメント（Segment）を読んでイニシャライズセグメント（Initialization Segment）を取得し、処理する。続いて、クライアントは、後続のセグメント（Segment）を取得し、再生する。

　なお、MPDにおける、ピリオド（Period）、リプレゼンテーション（Representation）、およびセグメント（Segment）の関係は、図３のようになる。つまり、１つのメディアコンテンツは、時間方向のデータ単位であるピリオド（Period）毎に管理することができ、各ピリオド（Period）は、時間方向のデータ単位であるセグメント（Segment）毎に管理することができる。また、各ピリオド（Period）について、ビットレート等の属性の異なる複数のリプレゼンテーション（Representation）を構成することができる。

　したがって、このMPDのファイル（MPDファイルとも称する）は、ピリオド（Period）以下において、図４に示されるような階層構造を有する。また、このMPDの構造を時間軸上に並べると図５の例のようになる。図５の例から明らかなように、同一のセグメント（Segment）に対して複数のリプレゼンテーション（Representation）が存在している。クライアントは、これらのうちのいずれかを適応的に選択することにより、通信環境や自己のデコード能力などに応じて適切なストリームデータを取得し、再生することができる。

　　＜DSD＞
　ところで、映像や音楽のデータは高品質化が進み、それとともに、配信においてもより高品質なデータの配信が求められている。例えば、音声信号の高品位な変調方式としてDSD（Direct Stream Digital）が知られている（図６）。図６に示されるように、PCM（Pulse Code Modulation）の場合、オーディオアナログ信号の各サンプリング時刻の信号値が固定数ビットのデジタルデータに変換されるのに対して、DSDの場合、オーディオアナログ信号がΔΣ変調され、１ビットのデジタルデータに変換される。

　DSDの場合、サンプリング周波数が例えば2.8MHz、5.6MHz、11.2MHzと高いため、ビットレートも2chでそれぞれ、5.6Mbps、11.2Mbps、22.4Mbps になる。そこで、このような高レートのDSDデータをロスレスで圧縮する方式が考案された。

　　＜DST＞
　例えば、DSDデータの可逆圧縮符号化方式として、SACD（Super Audio Compact Disc）向けに開発しMPEG4 AAC（Advanced Audio Coding）（IEC/ISO（International Organization for Standardization / International Electrotechnical Commission） 14496-3）で規格化されているDST（Direct Stream Transfer）がある。しかしながら、このDSTは負荷が大き過ぎて、ソフトウエアでの処理には適さない。

　　＜新たなDSD可逆圧縮符号化方式＞
　そこで、DSTとは異なる手法で、組み込み系プロセッサでのソフトウエア処理でも実現できる新たなDSD可逆圧縮符号化方式も開発された。この新たなDSD可逆圧縮符号化方式で生成したDSDロスレスストリームを配信に用いることで、伝送に必要な帯域を抑えることが可能になるとともに、PCやモバイル端末のようなクライアントでのソフトウエア処理でのリアルタイムデコードが期待できる。

　例えば、図７のＡに示されるように、オーディオデータの符号化方式にAACを用いる通常のライブストリーミングの場合、ビットレートが一定であるので、ビデオデータは、伝送路の帯域変動に応じてビットレートを選択する。これに対して、オーディオデータの符号化方式にDSDの可逆符号化方式を採用したライブストリーミング（４Ｋ＋DSD）の場合、図７のＢに示されるように、DSDロスレスストリームは、局所的なレート変動が大きい。つまり、このレート変動により生じる帯域の余裕をビデオデータの伝送に割り当てることができ、より高品位なビデオデータ伝送を可能にする。

　　　＜圧縮符号化装置の構成例＞
　次に、この新たなDSD可逆圧縮符号化方式について説明する。この新たなDSD可逆圧縮符号化方式に対応する圧縮符号化装置の主な構成例を図８に示す。図８に示される圧縮符号化装置１０は、アナログのオーディオ信号をΣ△（シグマデルタ）変調によりデジタル信号に変換し、変換後のオーディオ信号を圧縮符号化して出力する装置である。つまり、圧縮符号化装置１０は、オーディオ信号をDSD方式で変調してデジタル化し、そのデジタルデータ（DSDデータ）を上述した新たなDSD可逆圧縮符号化方式で符号化し、DSDロスレスストリームを生成する装置である。

　アナログのオーディオ信号は、入力部１１から入力されて、ADC（Analog Digital Converter）１２へ供給される。ADC１２は、供給されたアナログのオーディオ信号を、ΣΔ変調によりデジタル化して、入力バッファ１３に出力する。

　ADC１２は、加算器２１、積分器２２、比較器２３、１サンプル遅延回路２４、及び、１ビットDAC（Digital Analog Converter）２５により構成される。入力部１１から供給されたオーディオ信号は、加算器２１に供給される。加算器２１は、１ビットDAC２５から供給された１サンプル期間前のアナログのオーディオ信号と、入力部１１からのオーディオ信号を加算して、積分器２２に出力する。積分器２２は、加算器２１からのオーディオ信号を積分して比較器２３に出力する。比較器２３は、入力オーディオ信号の中点電位と比較されて１サンプル期間ごとに１ビット量子化する。サンプル期間の周波数（サンプリング周波数）は、従来の４８ｋHz、４４．１ｋHzに対して、その６４倍あるいは１２８倍の周波数が用いられる。比較器２３は、１ビット量子化したオーディオ信号を、入力バッファ１３に出力するとともに、１サンプル遅延回路２４に供給する。１サンプル遅延回路２４は、比較器２３からのオーディオ信号を１サンプル期間分遅延させて１ビットDAC２５に出力する。１ビットDAC２５は、１サンプル遅延回路２４からのデジタル信号をアナログ信号に変換して加算器２１に出力する。

　以上のように構成されるADC１２は、入力部１１から供給されたオーディオ信号を、１ビットのデジタル信号に変換（A/D変換）して、入力バッファ１３に出力する。このΣΔ変調のA/D変換によれば、サンプル期間の周波数（サンプリング周波数）を充分高くすることによって、例えば１ビットの少ないビット数でも広いダイナミックレンジのデジタル音声信号を得ることができる。例えば、ADC１２には、入力部１１からステレオ（２チャンネル）のオーディオ信号が入力され、ADC１２は、それを４４．１ｋHzの１２８倍のサンプリング周波数で１ビットの信号にAD変換して入力バッファ１３に出力する。なお、ΣΔ変調では、量子化のビット数を２ビットあるいは４ビットとすることもできる。

　入力バッファ１３は、ADC１２から供給される１ビットデジタルのオーディオ信号を、一時蓄積し、１フレーム単位で後段の制御部１４、エンコード部１５、及び、データ量比較部１７に供給する。ここで、１フレームとは、オーディオ信号を所定の時間（期間）に区切って１まとまりとみなす単位である。例えば３秒を１フレームとしてもよい。換言するに、入力バッファ１３は、オーディオ信号を、３秒単位で、制御部１４、エンコード部１５、及び、データ量比較部１７に供給する。上述したように、入力部１１から入力されるオーディオ信号は、ステレオ（２チャンネル）の信号であり、４４．１ｋHzの１２８倍のサンプリング周波数で１ビットの信号にA/D変換するため、１フレーム当たりのデータ量は、44100(Hz)＊128＊2(ch)＊3(sec)＝5.6Mビットとなる。以下においては、入力バッファ１３から供給される△Σ変調されたデジタル信号を、DSDデータとも称する。

　制御部１４は、圧縮符号化装置１全体の動作を制御する。また、制御部１４は、エンコード部１５が圧縮符号化を行うために必要となる変換テーブルtable1を作成して、エンコード部１５に供給する機能を有する。例えば、制御部１４は、入力バッファ１３から供給される１フレームのDSDデータを用いて、データ発生カウントテーブルpretableを作成し、データ発生カウントテーブルpretableからさらに変換テーブルtable1を作成する。制御部１４は、作成した変換テーブルtable1を、エンコード部１５とデータ送信部１８に供給する。変換テーブルtable1は、１フレーム単位で作成（更新）され、エンコード部１５に供給される。

　エンコード部１５は、制御部１４から供給された変換テーブルtable1を用いて、入力バッファ１３から供給されるDSDデータを４ビット単位で圧縮符号化する。したがって、エンコード部１５には入力バッファ１３から、制御部１４に供給されるタイミングと同時にDSDデータが供給されるが、エンコード部１５では、制御部１４から変換テーブルが供給されるまで処理は待機される。エンコード部１５は、４ビットのDSDデータを、２ビットのデータに符号化するか、または、６ビットのデータに符号化して、符号化データバッファ１６に出力する。

　符号化データバッファ１６は、エンコード部１５で圧縮符号化されたDSDデータである圧縮データを一時的にバッファリングし、データ量比較部１７とデータ送信部１８に供給する。

　データ量比較部１７は、入力バッファ１３から供給されるDSDデータ（以下、非圧縮データともいう。）と、符号化データバッファ１６から供給される圧縮データのデータ量を、フレーム単位で比較する。エンコード部１５は、上述したように、４ビットのDSDデータを、２ビットのデータか、または６ビットのデータに符号化するため、アルゴリズム上、圧縮後のデータ量が、圧縮前のデータ量を超えてしまう場合もあり得るためである。そこで、データ量比較部１７は、圧縮データと非圧縮データのデータ量を比較して、データ量の少ない方を選択し、どちらを選択したかを示す選択制御データをデータ送信部１８に供給する。なお、データ量比較部１７は、非圧縮データを選択したことを示す選択制御データをデータ送信部１８に供給する場合には、非圧縮データもデータ送信部１８に供給する。選択制御データは、送信データを受け取る受信側の装置から見れば、データ送信部１８から送信されてくるオーディオデータが、エンコード部１５で圧縮符号化されたデータか否かを表すフラグであるといえる。

　データ送信部１８は、データ量比較部１７から供給される選択制御データに基づいて、符号化データバッファ１６から供給される圧縮データか、または、データ量比較部１７から供給される非圧縮データのどちらかを選択し、選択制御データとともに、出力部１９を介して相手装置に送信する。また、データ送信部１８は、圧縮データを送信する場合には、制御部１４から供給される変換テーブルtable1のデータも、圧縮データに付加して相手装置に送信する。データ送信部１８は、送信データとして、所定数のサンプルごとのデジタル信号に同期信号と誤り訂正符号（ECC）を付加して送信することができる。

　　＜データ発生カウントテーブルの作成方法＞
　次に、制御部１４によるデータ発生カウントテーブルpretableの作成方法について説明する。

　制御部１４は、１フレームのDSDデータに対して、データ発生カウントテーブルpretableを作成するが、入力バッファ１３から供給されるDSDデータを、４ビット単位で以下のように表す。
　　...D4[n-3],D4[n-2],D4[n-1],D4[n],D4[n+1],D4[n+2],D4[n+3],...
　ここで、D4[n]は、４ビットの連続データを表し、以下では、D4データともいう（ｎ＞３）。

　制御部１４は、過去の３つのD4データ（過去の１２ビットデータ）の次のD4データの発生回数をカウントし、図９に示されるデータ発生カウントテーブルpretable[4096][16]を作成する。ここで、データ発生カウントテーブルpretable[4096][16]の[4096]と[16]は、データ発生カウントテーブルが４０９６行１６列のテーブル（行列）であることを表し、[0]乃至[4095]の各行は、過去の３つのD4データがとり得る値（過去のビットパターン）に対応し、[0]乃至[15]の各列は、次のD4データがとり得る値に対応する。

　例えば、データ発生カウントテーブルpretableの１行目であるpretable[0][0]乃至[0][15]は、過去の３つのD4データD4[n-3],D4[n-2],D4[n-1]が“０”=｛0000,0000,0000｝だった時の次のデータの発生回数を示しており、過去３つのデータが“０”だった次の４ビットは“０”であった回数が369a(HEX表記)であって、他のデータはなかったことを示している。データ発生カウントテーブルpretableの２行目であるpretable[1][0]乃至[1][15]は、過去の３つのD4データD4[n-3],D4[n-2],D4[n-1]が“１”=｛0000,0000,0001｝だった時の次のデータの発生回数を示している。データ発生カウントテーブルpretableの２行目の全ての要素が“０”であるのは、過去データとして３つのD4データが“１”となるデータが、この１フレーム内に存在しなかったことを示している。また、図９では、データ発生カウントテーブルpretableの１１８行目であるpretable[117][0]乃至[117][15]は、過去の３つのD4データD4[n-3],D4[n-2],D4[n-1]が“１１７”=｛0000,0111,0101｝だった時の次のデータの発生回数を示している。このデータでは、過去３つのデータが“１１７”だった次の４ビットが“０”であった回数が０回であり、“１”であった回数が１回であり、“２”であった回数が１０回であり、“３”であった回数が１８回であり、“４”であった回数が２０回であり、“５”であった回数が３１回であり、“６”であった回数が１１回であり、“７”であった回数が０回であり、“８”であった回数が４回であり、“９”であった回数が１２回であり、“１０”であった回数が５回であり、“１１”乃至“１５”であった回数が０回であったことを示している。

　制御部１４は、以上のようにして、１フレームのDSDデータに対して、過去の３つのD4データ（過去の１２ビットデータ）の次のD4データの発生回数をカウントし、データ発生カウントテーブルpretableを作成する。

　　　＜変換テーブルの作成方法＞
　次に、制御部１４による変換テーブルtable1の作成方法について説明する。

　制御部１４は、先に作成したデータ発生カウントテーブルpretableに基づいて、４０９６行３列の変換テーブルtable1[4096][3]を作成する。ここで、変換テーブルtable1[4096][3]の各行[0]乃至[4095]は、過去の３つのD4データがとり得る値に対応し、各列[0]乃至[2]には、次のD4データがとり得る１６個の値のうち、発生頻度が大きかった３つの値が格納される。変換テーブルtable1[4096][3]の第１列[0]には、発生頻度が最も大きい（１番目の）値が格納され、第２列[1]には、発生頻度が２番目の値が格納され、第３列[2]には、発生頻度が３番目の値が格納される。

　図１０は、図９に示したデータ発生カウントテーブルpretableに対応する変換テーブルtable1[4096][3]の例を示している。変換テーブルtable1[4096][3]の１１８行目であるtable1[117][0]乃至[117][2]は、{05,04,03}となっている。これは、図９のデータ発生カウントテーブルpretableの１１８行目のpretable[117][0]乃至[117][15]の内容と対応している。図９におけるデータ発生カウントテーブルpretableの１１８行目のpretable[117][0]乃至[117][15]では、発生頻度が最も大きい（１番目の）値は、３１回発生した“５”であり、発生頻度が２番目の値は、２０回発生した“４”であり、発生頻度が３番目の値は、１８回発生した“３”である。これにより、図１０の変換テーブルtable1[4096][3]の第１１８行第１列table1[117][0]には、｛05｝が格納され、第１１８行第２列table1[117][1]には、｛04｝が格納され、第１１８行第３列table1[117][2]には、｛03｝が格納されている。同様に、図１０の変換テーブルtable1[4096][3]の１行目のtable1[0][0]乃至[0][2]は、図９のデータ発生カウントテーブルpretableの１行目のpretable[0][0]乃至[0][15]の内容と対応している。

　図９のデータ発生カウントテーブルpretableの１行目のpretable[0][0]乃至[0][15]では、発生頻度が最も大きい（１番目の）値は、３６９ａ(HEX表記)回発生した“０”であり、それ以外の値は発生していない。そこで、図１０の変換テーブルtable1[4096][3]の第１行第１列table1[0][0]には、｛00｝が格納され、第１行第２列table1[0][1]と第１行第３列table1[0][2]には、データが存在しないことを表す｛ff｝が格納されている。データが存在しないことを表す値は、｛ff｝に限られず、適宜決定することができる。変換テーブルtable1の各要素に格納される値は、“０”から“１５”までのいずれかであるので、４ビットで表現できるが、コンピュータ処理上、扱いを容易にするために８ビットで表現されている。

　以上のようにして、先に作成したデータ発生カウントテーブルpretableに基づいて、４０９６行３列の変換テーブルtable1[4096][3]が作成され、エンコード部１５に供給される。

　　　＜エンコード部１５による圧縮符号化方法＞
　次に、エンコード部１５による、変換テーブルtable1を用いた圧縮符号化方法について説明する。例えば、入力バッファ１３から供給されるDSDデータ
　　...D4[n-3],D4[n-2],D4[n-1],D4[n],D4[n+1],D4[n+2],D4[n+3],...
　のうち、エンコード部１５が、D4[n]を符号化する場合について説明する。

　D4[n]を符号化する場合、エンコード部１５は、その直前の過去の１２ビットのデータであるD4[n-3],D4[n-2],D4[n-1]を一塊の１２ビットのデータとみなして、変換テーブルtable1[4096][3]の、D4[n-3],D4[n-2],D4[n-1]が示すアドレス（行）の３つの値、table1[D4[n-3],D4[n-2],D4[n-1]][0],table1[D4[n-3],D4[n-2],D4[n-1]][1],table1[D4[n-3],D4[n-2],D4[n-1]][2]を検索する。

　エンコード部１５は、変換テーブルtable1[4096][3]の、D4[n-3],D4[n-2],D4[n-1]が示すアドレス（行）の３つの値、table1[D4[n-3],D4[n-2],D4[n-1]][0],table1[D4[n-3],D4[n-2],D4[n-1]][1],table1[D4[n-3],D4[n-2],D4[n-1]][2]のなかにD4[n]と同じものがあり、table1[D4[n-3],D4[n-2],D4[n-1]][0]と同じ場合は、D4[n]を“01b”と２ビットに変換し、table1[D4[n-3],D4[n-2],D4[n-1]][1]と同じ場合は、D4[n]を“10b”と２ビットに変換し、table1[D4[n-3],D4[n-2],D4[n-1]][2]と同じ場合は、D4[n]を“11b”と２ビットに変換する。また、エンコード部１５は、変換テーブルtable1[4096][3]の、D4[n-3],D4[n-2],D4[n-1]が示すアドレス（行）の３つの値のなかに同じものが無ければ、“00b+ D4[n]”のように、D4[n]の前に“00b”をつけて６ビットに変換する。ここで、“01b”、“10b”、“11b”、“00b+ D4[n]”のbは、２進表記であることを表す。

　以上のようにして、エンコード部１５は、変換テーブルtable1を用いて、４ビットのDSDデータD4[n]を、２ビットのデータ“01b”、“10b”若しくは“11b”に変換するか、または、６ビットのデータ“00b+D4[n]”に変換して、符号化データバッファ１６に出力する。

　　　＜エンコード部１５の詳細構成＞
　図１１は、上述した圧縮符号化を行うエンコード部１５の構成例を示す図である。

　入力バッファ１３から供給された４ビットのDSDデータ（例えば、D4[n]）は、４ビットを格納するレジスタ５１に記憶される。また、レジスタ５１の出力は、セレクタ５５の１つの入力端子５６ａと、１２ビットを格納するレジスタ５２とつながっており、レジスタ５２には、レジスタ５１に記憶されている４ビットのDSDデータの直前の過去の１２ビットのデータ（例えば、D4[n-3],D4[n-2],D4[n-1]）が格納されている。

　変換テーブル処理部５３は、制御部１４から供給された変換テーブルtable1を有している。変換テーブル処理部５３は、レジスタ５２に格納されている１２ビットのデータ（例えば、D4[n-3],D4[n-2],D4[n-1]）が示すアドレスの３つの値、table1[D4[n-3],D4[n-2],D4[n-1]][0],table1[D4[n-3],D4[n-2],D4[n-1]][1],table1[D4[n-3],D4[n-2],D4[n-1]][2]のなかに、レジスタ５１に格納されている４ビットのデータ（例えば、D4[n]）があるか否かを検索し、ある場合には、同じ値が格納されている列に対応する値、即ち、“01b”、“10b”、または“11b”のいずれかを、２ビットのレジスタ５４に記憶させる。２ビットのレジスタ５４に記憶されたデータは、セレクタ５５の１つの入力端子５６ｃに供給される。また、変換テーブル処理部５３は、レジスタ５２に格納されている１２ビットのデータ（例えば、D4[n-3],D4[n-2],D4[n-1]）が示すアドレスの３つの値のなかに、レジスタ５１に格納されている４ビットのデータ（例えば、D4[n]）がない場合には、変換をしないことを示す信号（以下、変換無信号という。）を、セレクタ５５に出力する。

　セレクタ５５は、３つの入力端子５６ａ乃至５６ｃのなかの１つを選択し、その選択された入力端子５６から取得されるデータを出力端子５７から出力する。入力端子５６ａには、レジスタ５１に記憶された４ビットのDSDデータ（例えば、D4[n]）が供給され、入力端子５６ｂには、“00b”が供給され、入力端子５６ｃには、レジスタ５４に記憶された２ビットの変換データが供給される。セレクタ５５は、変換テーブル処理部５３から、変換しないことを示す変換無信号が供給された場合には、入力端子５６ｂを選択して“00b”を出力端子５７から出力した後、入力端子５６ａを選択して、レジスタ５１に記憶された４ビットのDSDデータ（例えば、D4[n]）を出力端子５７から出力する。これにより、変換テーブルtable1にD4[n]と同じものがない場合に出力される６ビット“00b+ D4[n]”が出力端子５７から出力される。また、変換しないことを示す変換無信号が供給されない場合（変換したことを示す変換有信号が供給された場合）には、セレクタ５５は、入力端子５６ｃを選択して、レジスタ５４から供給された２ビットの変換データを出力端子５７から出力する。これにより、変換テーブルtable1にD4[n]と同じものがあった場合に出力される２ビット、即ち、“01b”、“10b”、または“11b”のいずれかが出力端子５７から出力される。

　　　＜圧縮符号化処理フロー＞
　図１２のフローチャートを参照して、圧縮符号化装置１０による圧縮符号化処理について説明する。

　なお、図１２の処理フローでは、ADC１２の処理は省略されており、ADC１２で△Σ変調された１フレームのDSDデータが入力バッファ１３から出力された後の処理について説明する。

　初めに、ステップＳ１において、制御部１４は、１フレームのDSDデータに対して、過去の３つのD4データ（過去の１２ビットデータ）の次のD4データの発生回数をカウントし、データ発生カウントテーブルpretableを作成する。

　ステップＳ２において、制御部１４は、作成したデータ発生カウントテーブルpretableに基づいて、４０９６行３列の変換テーブルtable1を作成する。制御部１４は、作成した変換テーブルtable1を、エンコード部１５とデータ送信部１８に供給する。

　ステップＳ３において、エンコード部１５は、１フレーム期間のDSDデータに対して、変換テーブルtable1を用いて、圧縮符号化を実行する。具体的には、エンコード部１５は、４ビットのDSDデータD4[n]を、２ビットのデータ“01b”、“10b”若しくは“11b”に変換するか、または、６ビットのデータ“00b+D4[n]”に変換する処理を１フレーム期間のDSDデータに対して行う。圧縮符号化されて得られた圧縮データは、符号化データバッファ１６とデータ量比較部１７に供給される。

　ステップＳ４において、データ量比較部１７は、入力バッファ１３から供給された１フレームの非圧縮データと、符号化データバッファ１６から供給された１フレームの圧縮データのデータ量を比較し、データ量が圧縮前よりも削減されたかを判定する。

　ステップＳ４で、データ量が圧縮前よりも削減されたと判定された場合、処理はステップＳ５に進み、データ量比較部１７は、圧縮データを選択したことを示す選択制御データをデータ送信部１８に供給する。

　ステップＳ６において、データ送信部１８は、圧縮データを選択したことを示す選択制御データ（圧縮符号化されたデータを示すフラグ）と、エンコード部１５から供給された圧縮データに、制御部１４から供給された変換テーブルtable1のデータ（変換テーブルデータ）を付加して、相手装置に送信する。

　また、ステップＳ４で、データ量が圧縮前よりも削減されていないと判定された場合、処理はステップＳ７に進み、データ量比較部１７は、非圧縮データを選択したことを示す選択制御データを、非圧縮データとともにデータ送信部１８に供給する。

　ステップＳ８において、データ送信部１８は、非圧縮データを選択したことを示す選択制御データ（圧縮符号化されていないデータを示すフラグ）と、非圧縮データを、相手装置に送信する。

　以上で、１フレームのDSDデータの圧縮符号化処理は終了する。上述したステップＳ１乃至Ｓ８の処理は、入力バッファ１３から順次供給される１フレーム単位のDSDデータに対して繰り返し実行される。

　　　＜復号装置の構成例＞
　図１３は、上述した新たなDSD可逆圧縮符号化方式に対応する復号装置の主な構成例を示している。図１３の復号装置７０は、図８の圧縮符号化装置１０が圧縮符号化して送信したオーディオ信号を受信して伸長処理（可逆復号）する装置である。

　図８の圧縮符号化装置１０が圧縮符号化して送信したオーディオ信号は、不図示のネットワーク（例えば、LAN（Local Area Network）、WAN（Wide Area Network）、インターネット、電話回線網、衛星通信網などの公衆回線網など）を経由して、復号装置７０の入力部７１で受信され、データ受信部７２に供給される。

　データ受信部７２は、受信データに含まれる同期信号を分離するとともに、ネットワーク伝送中に発生した伝送誤りを検出して訂正する。そして、データ受信部７２は、受信データに含まれる、オーディオ信号が圧縮符号化されているか否かを示す選択制御データに基づいて、オーディオ信号が圧縮符号化されているか否かを判定する。そして、オーディオ信号が圧縮符号化されている場合には、データ受信部７２は、受信した圧縮データを、符号化データバッファ７３に供給する。また、オーディオ信号が圧縮符号化されていない場合には、データ受信部７２は、受信した非圧縮データを、出力バッファ７６に供給する。さらに、データ受信部７２は、受信データに含まれる、変換テーブルtable1のデータ（変換テーブルデータ）を、テーブル記憶部７５に供給する。テーブル記憶部７５は、データ受信部７２から供給された変換テーブルtable1を記憶し、必要に応じてデコード部７４に供給する。

　符号化データバッファ７３は、データ受信部７２から供給される圧縮データを一時蓄積し、所定のタイミングで後段のデコード部７４に供給する。

　デコード部７４は、圧縮データを圧縮前の状態に復号（可逆復号）して、出力バッファ７６に供給する。

　　　＜復号方法の詳細＞
　デコード部７４による復号方法について説明する。圧縮符号化装置１０で圧縮符号化されて送信されてきた圧縮データを、２ビット単位で以下のように表し、E2[n]を復号する場合について説明する。
　　...E2[n-3],E2[n-2],E2[n-1],E2[n],E2[n+1],E2[n+2],E2[n+3],...
　ここで、E2[n]は、２ビットの連続データを表し、E2データともいう。

　デコード部７４は、まず、E2[n]の値を判定する。E2[n]が“00b”である場合、受信された変換テーブルtable1[4096][3]に搭載されてないデータであるので、E2[n]の次の４ビットのデータ“E2[n+1]+E2[n+2]”が復号すべきデータとなる。また、E2[n]が“01b”、“10b”、または“11b”である場合、受信された変換テーブルtable1[4096][3]に搭載されているデータであるので、その直前に復号した１２ビットのD4データD4[n-3],D4[n-2],D4[n-1]を使って、変換テーブルtable1[4096][3]を参照し、復号すべきデータを検索する。復号すべきデータは、“table1[D4[n-3],D4[n-2],D4[n-1]][ E2[n]-1]”に格納されているデータとなる。以上のようにして、デコード部７４は、圧縮データを圧縮前の状態に復号（可逆復号）することができる。デコード部７４は、図１３に示されるように、２ビットのレジスタ９１、１２ビットのレジスタ９２、変換テーブル処理部９３、４ビットのレジスタ９４、及び、セレクタ９５により構成される。

　符号化データバッファ７３から供給された２ビットのE2データ（例えば、E2[n]）は、レジスタ９１に記憶される。１２ビットのレジスタ９２には、セレクタ９５の出力が供給されるようになっており、レジスタ９２は、レジスタ９１に記憶されている２ビットのE2データ（例えば、E2[n]）の直前に復号した１２ビットのデータ（例えば、D4[n-3],D4[n-2],D4[n-1]）が格納されている。レジスタ９１に記憶されている２ビットのE2データ（例えば、E2[n]）が“00b”である場合、セレクタ９５は、入力端子９６ａを選択し、E2[n]の次の４ビットのデータ“E2[n+1]+E2[n+2]”を復号結果として、出力端子９７から出力する。レジスタ９１に記憶されている２ビットのE2データ（例えば、E2[n]）が“01b”、“10b”、または“11b” である場合、変換テーブル処理部９３は、テーブル記憶部７５から供給された変換テーブルtable1の“table1[D4[n-3],D4[n-2],D4[n-1]][ E2[n]-1]”に格納されている４ビットのデータをレジスタ９４に記憶させる。セレクタ９５は、入力端子９６ｂを選択し、レジスタ９４に記憶されているデータを復号結果として、出力端子９７から出力する。

　出力バッファ７６は、データ受信部７２から供給された非圧縮データ、または、デコード部７４から供給された復号後のデータのいずれかを適宜選択して、アナログフィルタ７７に供給する。

　アナログフィルタ７７は、出力バッファ７６から供給された復号後のデータに対して、ローパスフィルタ、バンドパスフィルタ等の所定のフィルタ処理を実行し、出力部７８から出力させる。

　　　＜復号処理フロー＞
　図１４のフローチャートを参照して、復号装置７０の復号処理についてさらに説明する。

　初めに、ステップＳ２１において、データ受信部７２は、受信データに含まれる選択制御データに基づいて、受信したデータが圧縮符号化された圧縮データであるかを判定する。

　ステップＳ２１で、受信したデータが圧縮データであると判定された場合、処理はステップＳ２２に進み、データ受信部７２は、受信データに含まれていた変換テーブルデータをテーブル記憶部７５に供給する。変換テーブル処理部９３は、テーブル記憶部７５を介して、受信された変換テーブルtable1を取得する。またステップＳ２２では、受信データに含まれていた圧縮データが、符号化データバッファ７３に供給される。

　ステップＳ２３において、デコード部７４は、変換テーブルtable1を用いて、符号化データバッファ７３から供給された圧縮データを復号し、出力バッファ７６に供給する。即ち、デコード部７４は、２ビットのE2データ（例えば、E2[n]）が“00b”である場合、E2[n]の次の４ビットのデータ“E2[n+1]+E2[n+2]”を復号結果として出力バッファ７６に供給し、２ビットのE2データ（例えば、E2[n]）が“01b”、“10b”、または“11b” である場合、変換テーブルtable1の“table1[D4[n-3],D4[n-2],D4[n-1]][ E2[n]-1]”に格納されている４ビットのデータを復号結果として出力バッファ７６に供給する。

　また、ステップＳ２１で、受信したデータが圧縮データではない、即ち非圧縮データであると判定された場合、処理はステップＳ２４に進み、データ受信部７２は、受信データに含まれていた非圧縮データを取得し、出力バッファ７６に供給する。

　以上までの処理により、非圧縮データか、または、デコード部７４によって復号されたデータが、出力バッファ７６に供給され、出力バッファ７６に供給されたデータが、アナログフィルタ７７に出力される。

　ステップＳ２５において、アナログフィルタ７７は、出力バッファ７６を介して供給されたデータに対して所定のフィルタ処理を実行する。フィルタ処理後のオーディオ信号が出力部７８から出力される。

　１フレーム単位のオーディオ信号に対して、以上の処理が繰り返し実行される。

　　　＜DSDロスレスストリームの構造＞
　上述の新たなDSD可逆圧縮符号化方式において、DSDデータは、１chあたり固定長（4096×32=131072ビット）のブロック（Block）に分割されて圧縮される。圧縮後、連続する１０ブロック分の圧縮データにヘッダを付けてGOB（Group of Blocks）が構成される。さらにそのGOBの先頭にコンフィギュレーション情報（configuration）を付加した単位が、DSDロスレスペイロード（DSD_lossless_payload()）となる。ブロックの伸長に必要な情報（code book;参照テーブル）は、GOBヘッダ（GOB header）とGOBデータ（GOB data）に格納される。AACとのストリームスイッチングも考慮し、ブロック（Block(audio frame)）の時間長はAACと同程度に設定されている。

　DSDロスレスストリームの基本的な構造の例を図１５に示す。図１５の一番上の段に示されるように、DSDロスレスストリーム（DSD lossless stream）は、複数のDSDロスレスペイロード（DSD_lossless_payload()）により構成される。

　図１５の上から２段目に示されるように、１つのDSDロスレスペイロードは、フォーマットバージョン（format version）、GOBコンフィグ（GOB config）、およびGOBにより構成される。

　図１５の上から３段目に示されるように、GOBは、GOBヘッダ（GOB header）、GOBデータ（GOB data）、１０個のブロック（Block1乃至Block10）よりなる。GOBヘッダおよびGOBデータは、このGOBの復号に利用されるGOBイニシャライザ（GOB initializer）とも称する。GOBイニシャライザには、復号に用いられるデコーダコンフィギュレーション情報（decoder configration）、メタデータ（metadata）、コードブック（code book）等が含まれる。

　図１５の一番下の段に示されるように、ブロック（Block）は、ブロックヘッダ（Block header）、左チャンネルのオーディオデータ（Ｌ）、右チャンネルのオーディオデータ（Ｒ）、およびバイトアライン（byte align）により構成される（DSDデータが左右２chの場合）。

　１ブロック（Block）は、fsに依らず、１chあたり圧縮前のDSDデータで4096×32＝131072ビット分のデータが格納される。つまり、１ブロックの長さ（ブロック長）は、サンプリング周波数が2.8MHzの場合、約４６msecとなり、サンプリング周波数が5.6MHzの場合、約２３msecとなり、サンプリング周波数が11.2MHzの場合、約１２msecとなる。例えば、サンプリング周波数が2.8MHzの場合、１GOBには、再生時間で約４６８msec分のデータが格納される。

　　　＜シンタクス＞
　DSDロスレスペイロードのシンタクスの例を図１６のＡに示す。図１６のＡに示されるように、DSDロスレスペイロード（DSD_lossless_payload()）には、例えば、format version、DSD_lossless_gob_configuration()、DSD_lossless_gob(number_of_audio_data)等が格納される。このformat versionは、図１５のフォーマットバージョン（format version）に相当する。また、DSD_lossless_gob_configuration()は、図１５のGOBコンフィグ（GOB config）に相当する。また、DSD_lossless_gob()は、図１５のGOBに相当する。

　DSD_lossless_gob_configuration()のシンタクスの例を図１６のＢに示す。図１６のＢに示されるように、DSD_lossless_gob_configuration()には、例えば、channel_configuration、number of blocks、sampling_frequency、comment_flag、comment_size、comment_byte等が格納される。

　DSD_lossless_gob()のシンタクスの例を図１６のＣに示す。図１６のＣに示されるように、DSD_lossless_gob()には、例えば、DSD_lossless_gob_header()、DSD_lossless_gob_data()、DSD_lossless_block()、byte_align()等が格納される。このDSD_lossless_gob_header()は、図１５のGOBヘッダ（GOB header）に相当する。DSD_lossless_gob_data()は、図１５のGOBデータ（GOB data）に相当する。DSD_lossless_block()は、図１５の各ブロック（Block１乃至Block10）に相当する。

　DSD_lossless_gob_header()のシンタクスの例を図１６のＤに示す。図１６のＤに示されるように、DSD_lossless_gob_header()には、例えば、DSD_lossless_block_info等が格納される。

　DSD_lossless_gob_data()のシンタクスの例を図１６のＤに示す。図１６のＤに示されるように、DSD_lossless_gob_data()には、例えば、gob_codebook_length、gob_codebook[i]等が格納される。gob_codebook[i]は、図１５のコードブック（code book）に相当する。

　　＜スイッチング＞
　画像や音声などのコンテンツのデータ（コンテンツデータとも称する）を配信するシステムにおいて、配信するコンテンツデータのさらなる高品質化は、常に求められている。そして、そのコンテンツデータの高品質化に伴い、以上の新たなDSD可逆圧縮符号化方式のような新たな符号化方式の開発も随時行われている。

　しかしながら、このような高品質な符号化方式が新たに開発され、コンテンツデータの配信に適用されるようになったとしても、実際には、従来の低品質な符号化方式のコンテンツデータの配信も併用することが求められることがあり得る。

　例えば、より安定的にコンテンツデータを配信するために、伝送路の伝送帯域の変動に応じて配信するコンテンツデータのビットレートを切り替えることが考えられるが、その場合、１つの符号化方式では十分なビットレート幅を確保できない可能性がある。例えば、一般的に、高品質なコンテンツデータは低品質なコンテンツデータよりも高ビットレートとなる。伝送帯域の変動により強く、より安定的な配信を行うためには、従来の符号化方式のような低ビットレートのコンテンツデータも配信可能とすべきであるが、新たな符号化方式ではそこまでの低ビットレートに対応していないこともあり得る。例えば、上述の新たなDSD符号化方式のDSDロスレスストリームの場合、２．８Mbps以上のDSDデータを可逆圧縮してビットレートを低減させるが、AAC（Advanced Audio Coding）のように１２８kbpsの低レートを常時維持することはできない。

　つまり、より高品質な符号化方式が開発されるほど、対応すべきビットレート幅が広くなる可能性があり、１つの符号化方式で対応することはより困難になる可能性がある。

　また、例えば、新たな符号化方式が適用されても、再生側で使用されるデコーダがその符号化方式に対応しておらず、再生することができないことがあり得る。したがって、コンテンツデータの配信の汎用性を向上させるためには、従来の符号化方式による配信も可能とすることが求められる。

　なお、これらのことは、音声データに限らず、画像データ等の任意のコンテンツデータにおいても同様である。

　MPEG-DASHでは、MPDによって、互いに異なる符号化方式の複数のコンテンツデータの配信を管理することができる。例えば、伝送帯域の混雑度やデコーダの対応符号化方式等に応じて配信するコンテンツデータを切り替えることができる。しかしながら、従来のMPDにおいては、再生中におけるコンテンツデータの切り替え（スイッチング）は、ビットレートの切り替え程度しか考慮されておらず、再生中に符号化方式を切り替えることは想定されていなかった。

　例えば、MPDにおいては、基本的に、符号化方式は、アダプテーションセット（Adaptation Set）において管理され、切り替え（スイッチング）可能な互いに異なる符号化方式のコンテンツデータは、互いに異なるアダプテーションセットにおいて管理される。また、基本的に、ビットレートは、アダプテーションセット内のリプレゼンテーション（Representation）において管理され、切り替え（スイッチング）可能な互いに異なるビットレートのコンテンツデータは、同一のアダプテーションセットの互いに異なるリプレゼンテーションにおいて管理される。

　例えば、MPEG-DASHのライブプロファイル（Live Profile）の場合、図１７に示される例のようなファイル構造を有する。例えば「Audio DSD 2.8MHz」と「Audio DSD 5.6MHz」のように、符号化方式が互いに異なるコンテンツデータは、互いに異なるアダプテーションセットにおいて管理される。また、「Video」の「10Mbps」、「20Mbps」、「40Mbps」、「80Mbps」の例のように、ビットレートが互いに異なるコンテンツデータは、同一のアダプテーションセットの互いに異なるリプレゼンテーションにおいて管理される。

　また、例えば、日本語と英語等のように、言語違いのオーディオストリームが複数存在する場合も、アダプテーションセットを分けて管理される。特に、ユーザに（UI（User Interfase）で）選択させる意図がある場合には、言語属性を表す「@lang」がアダプテーションセットにしか存在しないため、アダプテーションセットを分けて管理する必要がある。

　なお、MPEG-DASHのオンデマンドプロファイル（On-demand profile）の場合のファイル構造は、図１８の例のようになる。この場合もライブプロファイルの場合と同様に、符号化方式等が異なる場合はアダプテーションセットを分けて管理される。

　したがって、符号化方式を切り替える（スイッチング）するために、アダプテーションセットを越えた切り替えを行うことになるが、MPDには、リプレゼンテーション間の切り替え（スイッチング）のための仕組みは用意されているものの、アダプテーションを越えた切り替え（スイッチング）を実現する仕組みは用意されていなかった。

　例えば、ライブプロファイルの場合、図１７に示されるように、コンテンツデータは、その再生時間方向にセグメント（Segment）単位に分けて管理される。図１７に示されるように、コンテンツデータがMP4ファイルの場合、各セグメントは、所定再生時間分のムービーフラグメントボックス（Movie Fragment Box（moof））と、メディアデータボックス（Media Data Box（mdat））とにより構成される。このセグメントがアクセス単位となるので、再生するコンテンツデータを切り替える（スイッチングする）場合、このセグメントの境界で行われる。

　しかしながら、セグメントの長さ（再生時間）は、アダプテーションセット毎に互いに独立に設定することができるため、セグメントの境界（の再生時刻）が、アダプテーション間で一致しているとは限らない。切り替え元のアダプテーションセットと切り替え先のアダプテーションセットとの間でこのセグメントの境界が一致していないと、切り替えの際に再生が途切れたり、再生時刻がずれたり（飛んだり戻ったり）するなどの不連続が生じる可能性がある。すなわち、シームレスな切り替えを保証することができなかった。

　また、例えば、オンデマンドプロファイルの場合、図１８に示されるように、コンテンツデータ全体は１つのメディアセグメント（Media Segment）として管理され、さらに、その再生時間方向にサブセグメント（Sub-segment）単位に分けて管理される。図１８に示されるように、コンテンツデータがMP4ファイルの場合、各セグメントは、所定再生時間分のムービーフラグメントボックス（Movie Fragment Box（moof））と、メディアデータボックス（Media Data Box（mdat））とにより構成される。このサブセグメントがアクセス単位となるので、再生するコンテンツデータを切り替える（スイッチングする）場合、このサブセグメントの境界で行われる。

　つまり、この場合も、ライブプロファイルのセグメント境界と同様に、アダプテーション間でサブセグメント境界（の再生時刻）の一致が保証されていないため、シームレスな切り替えを保証することができなかった。

　このように、シームレスな切り替えを行うことが保証されないため、アダプテーションセットを越えたスイッチングを実現することは困難であった。そのため、より高品位のコンテンツデータの配信を安定的に行うことが困難であった。

　＜２．第１の実施の形態＞
　　＜アダプテーションを越えた切り替えに関する情報の設定＞
　そこで、コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を設定するようにする。

　このようにすることにより、第１の管理単位を越えるシームレスな切り替え（再生の連続性が維持されるような（シームレスな再生が可能な）切り替え）を行うことができるようになり、より大きな帯域変動に対応することができるようになり、コンテンツデータをより安定的に伝送することができる。

　この管理情報は、MPEG-DASHのMPDとし、第１の管理単位を、アダプテーションセット（Adaptation Set）としてもよい。このようにすることにより、MPEG-DASHを用いた配信をより安定的に行うことができる。

　なお、以下においてMPDに関する説明を行う場合、ライブプロファイルを用いて説明し、オンデマンドプロファイルについても説明は省略するが、以下の説明は、特に矛盾が生じない限りに、任意のプロファイルに適用することができる。例えば、ライブプロファイルのセグメントについての説明は、セグメントをサブセグメントに置き換えることにより、オンデマンドプロファイルにも適用することができる。

　　＜切り替え先情報＞
　この切り替えに関する情報は、再生するデータの第１の管理単位を越える切り替えの、切り替え先に関する情報であるようにしてもよい。例えば、この切り替え先に関する情報として、切り替え先として許可する管理単位（すなわち、切り替え先の候補とする管理単位）を指定する情報を設定するようにしてもよい。例えば、この切り替え先に関する情報として、属性@ContentSwitchingDestinationIdを設定するようにしてもよい。

　例えば、管理情報がMPDの場合、この属性@ContentSwitchingDestinationIdに、切り替え先の候補とする管理単位の識別情報（Id）のリスト（羅列）を設定するようにしてもよい。切り替え先の候補とする管理単位は、例えば、他のアダプテーションセット（他の第１の管理単位）でもよいし、他のアダプテーションセットのリプレゼンテーション（他の第１の管理単位内の各データを管理する第２の管理単位）であってもよいし、その両方であってもよい。なお、「他のアダプテーションセット（他の第１の管理単位）」とは、現在再生中の（切り替え前の）コンテンツデータを管理するアダプテーションセット（第１の管理単位）以外のアダプテーションセット（第１の管理単位）を示す。また、切り替え先の候補としてアダプテーションセットを設定する場合は、その下位のリプレゼンテーションの指定は、従来のMPDの仕様に基づいて行われるようにしてもよい。

　切り替え先の候補としてアダプテーションセット（第１の管理単位）を設定する場合、追加する情報量が少なく、従来の仕様も利用するので、従来のMPDとの互換性が高い。また、切り替え先の候補としてリプレゼンテーション（第２の管理単位）を設定する場合、切り替えについてのより詳細な制御が可能になる。

　　　＜アライン＞
　この切り替え先に関する情報として設定される管理単位は、少なくとも一部のセグメントにおいて、現在の管理単位とセグメント境界の再生時刻が一致している（アラインされている）ようにしてもよい。換言するに、現在の管理単位に対して、少なくとも一部のセグメントにおいてセグメント境界がアラインされている管理単位を、切り替え先に関する情報として設定することができるようにしてもよい。

　セグメント境界がアラインされていれば、再生を行う装置において、このような切り替え先に関する情報に基づいて切り替え（スイッチング）の制御を行うようにすることにより、アダプテーションを越えた切り替えであっても、シームレスな切り替えを行うことができる。

　　　＜切り替え先情報の設定＞
　なお、切り替え先に関する情報は、任意の管理単位に設定することができる。例えば、属性@ContentSwitchingDestinationId（切り替え先に関する情報）を、アダプテーションセット（第１の管理単位）に設定することができるようにしてもよいし、リプレゼンテーション（第２の管理単位）に設定することができるようにしてもよいし、その両方に設定することができるようにしてもよい。

　切り替え先に関する情報をアダプテーションセット（第１の管理単位）に設定する場合、そのアダプテーションセットに属するリプレゼンテーションに共通な切り替え先に関する情報を設定することができ、情報量の増大を抑制することができる。また、切り替え先に関する情報をリプレゼンテーション（第２の管理単位）に設定する場合、切り替えについて、より詳細な制御を行うことができる。

　また、切り替え先に関する情報として、切り替え先として推奨する管理単位を指定する情報を設定するようにしてもよいし、切り替え先として推奨しない管理単位を指定する情報を設定するようにしてもよいし、切り替え先として禁止する管理単位を指定する情報を設定するようにしてもよい。

　　＜切り替えタイミング情報＞
　また、切り替えに関する情報は、再生するデータの第１の管理単位を越える切り替えのタイミングに関する情報であるようにしてもよい。例えば、このタイミングに関する情報として、再生するデータの第１の管理単位を越える切り替えを許可するタイミングを指定する情報（切り替えのタイミングの候補を指定する情報）であるようにしてもよい。例えば、このタイミングに関する情報として、属性@ContentSwitchingAlignmentCycleを設定するようにしてもよい。

　この候補とするタイミングは任意であるが、例えば、再生するデータの再生時間方向の管理単位である第２の管理単位の境界であるようにしてもよい。つまり、タイミングを指定する情報は、再生するデータの第１の管理単位を越える切り替えを許可する第２の管理単位の境界を指定する情報であるようにしてもよい。その際、候補となるタイミングを、次のタイミングまでの第２の管理単位の数で指定するようにしてもよい。

　例えば、管理情報がMPDの場合、再生するコンテンツデータのアダプテーションセット（第１の管理単位）を越えるスイッチング（切り替え）を許可するセグメント（第２の管理単位）の境界を、次のタイミングまでのセグメント（第２の管理単位）の数で指定するようにしてもよい。なお、ここでセグメントを第２の管理単位としたのは、第１の管理単位であるアダプテーションセットと異なる管理単位であるという意味である。付言するに、セグメントはリプレゼンテーションとも異なる管理単位である。つまり、アダプテーションセット（第１の管理単位）だけでなくリプレゼンテーション（第２の管理単位）も考慮に入れるとすると、セグメントは第３の管理単位とも言える。

　属性@ContentSwitchingAlignmentCycleの値と候補となるタイミングとの関係の例を図１９に示す。図１９において、「Segment」と記述された四角形がセグメントを示し、矢印が候補となるタイミングを示している。例えば、図１９の一番上の段に示されるように、属性@ContentSwitchingAlignmentCycleが設定されていない、または、属性@ContentSwitchingAlignmentCycleの値が「１」に設定されている場合、各セグメント境界においてアダプテーションセットを越えるスイッチングが許可される。また、上から２段目に示されるように、属性@ContentSwitchingAlignmentCycleの値が「２」に設定されている場合、２セグメント毎の境界において（すなわち、１つおきのセグメント境界において）アダプテーションセットを越えるスイッチングが許可される。さらに、一番下の段に示されるように、属性@ContentSwitchingAlignmentCycleの値が「３」に設定されている場合、３セグメント毎の境界において（すなわち、２つおきのセグメント境界において）アダプテーションセットを越えるスイッチングが許可される。

　なお、タイミングに関する情報においては、このような切り替えが許可されるタイミングを、セグメント数（＝周期の長さ）で表すように説明したが、この周期の長さをセグメント数以外の情報で表すようにしてもよい。例えば、時間（例えば秒）によりこの周期の長さを表すようにしてもよい。なお、周期の長さ以外の情報で、切り替えが許可されるタイミングを表すようにしてもよい。例えば、切り替えが許可されるタイミングを再生時刻（例えばISOBMFFのMovie TimeやMedia Time）やセグメント番号等により表すようにしてもよい。

　切り替えが許可されるタイミングを周期の長さ、特に、セグメント数により指定することにより、この情報量を低減させることができる。また、再生側に、切り替えが許可されるタイミングを、複雑な演算等を必要とせずに、より容易に把握させることができる。

　　　＜アライン＞
　このような候補となるタイミングにおいて、切り替え元のデータと切り替え先のデータとの間で再生時刻が一致している（アラインされている）ようにしてもよい。例えば、切り替えのタイミングの候補として指定されるセグメント境界がアラインされているようにしてもよい。

　セグメント境界がアラインされていれば、再生を行う装置において、このような切り替えのタイミングに関する情報に基づいて切り替え（スイッチング）の制御を行うようにすることにより、アダプテーションを越えた切り替えであっても、シームレスな切り替えを行うことができる。

　なお、切り替えのタイミング（セグメント境界）において、切り替え元のコンテンツデータと切り替え先のコンテンツデータとがアラインされていなくてもよい。例えば、切り替え前後のデータが切り替えのタイミングにおいて再生時刻に不連続がある場合、データをバッファすることによって再生時刻の微調整を行うようにしてもよい。また、例えば、データをアラインさせるのではなく、ダブルバッファ構成にしてデコード後のデータを滑らかに接続する処理を行うことによって切り替え前後の再生時刻を揃えるようにしてもよい。

　ただし、切り替えタイミングにおいてデータをアラインさせておくことにより、より容易かつ高速にシームレスな切り替えを行うことができる。

　　　＜タイミングに関する情報の設定＞
　なお、以上のタイミングに関する情報は、任意の管理単位に設定することができる。例えば、属性@ContentSwitchingAlignmentCycle（タイミングに関する情報）を、アダプテーションセット（第１の管理単位）に設定することができるようにしてもよいし、リプレゼンテーション（第２の管理単位）に設定することができるようにしてもよいし、その両方に設定することができるようにしてもよい。

　タイミングに関する情報をアダプテーションセット（第１の管理単位）に設定する場合、そのアダプテーションセットに属するリプレゼンテーションに共通なタイミングに関する情報を設定することができ、情報量の増大を抑制することができる。また、タイミングに関する情報をリプレゼンテーション（第２の管理単位）に設定する場合、切り替えについて、より詳細な制御を行うことができる。

　また、タイミングに関する情報として、切り替えを推奨するタイミングを指定する情報を設定するようにしてもよいし、切り替えを推奨しないタイミングを指定する情報を設定するようにしてもよいし、切り替えを禁止するタイミングを指定する情報を設定するようにしてもよい。

　　＜切り替えに関する情報の例１＞
　次に、以上のような切り替えに関する情報（切り替え先に関する情報とタイミングに関する情報）の適用例について説明する。最初に、図２０に示されるような構成のMPDに対して切り替えに関する情報を設定する場合について説明する。

　図２０の例のMPDの場合、アダプテーションセット（Adaptation Set（a1））のリプレゼンテーション（a1r1）において、2.8MHzのDSDロスレスストリームのMP4ファイルが管理され、アダプテーションセット（a2）のリプレゼンテーション（a2r1）において、5.6MHzのDSDロスレスストリームのMP4ファイルが管理されている。リプレゼンテーション（a1r1）においては、2.8MHzのDSDロスレスストリームの５GOBが１セグメント（Segment）とされており、１セグメントの再生時間は約2.322秒となっている。このリプレゼンテーション（a1r1）とリプレゼンテーション（a2r1）との間でセグメント境界をアラインさせるには、リプレゼンテーション（a2r1）の１セグメントの再生時間を約2.322秒とすればよく、そのためには、リプレゼンテーション（a2r1）において、5.6MHzのDSDロスレスストリームの１０GOBを１セグメント（Segment）とすればよい。このようにすることにより、図２０において矢印で示されるように、各セグメント境界がアラインされる。つまり、これらのリプレゼンテーション間であれば、任意のセグメント境界において、シームレスな切り替えを行うことができる。

　図２１は、図２０の場合のMPDの記述例を示す図である。図２１の例の場合、アダプテーションセットを超える切り替えに関する情報は、リプレゼンテーションに設定されている。

　図２１において下線で示されるように、リプレゼンテーション（a1r1）において、属性@ContentSwitchingDestinationIdに値「a2r1」が設定されている。つまり、切り替え先に関する情報として、リプレゼンテーション（a2r1）が切り替え先の候補に設定されている。また、そのリプレゼンテーション（a1r1）において、属性@ContentSwitchingAlignmentCycleに値「１」が設定されている。つまり、切り替えのタイミングに関する情報として、１周期分のセグメント数「１」が設定されている。つまり、この場合、リプレゼンテーション（a1r1）から見て、切り替え先の候補はリプレゼンテーション（a2r1）であり、全てのセグメント境界においてその切り替えが許可される。

　また、リプレゼンテーション（a2r1）において、属性@ContentSwitchingDestinationIdに値「a1r1」が設定されている。つまり、切り替え先に関する情報として、リプレゼンテーション（a1r1）が切り替え先の候補に設定されている。また、そのリプレゼンテーション（a2r1）において、属性@ContentSwitchingAlignmentCycleに値「１」が設定されている。つまり、切り替えのタイミングに関する情報として、１周期分のセグメント数「１」が設定されている。つまり、この場合、リプレゼンテーション（a2r1）から見て、切り替え先の候補はリプレゼンテーション（a1r1）であり、全てのセグメント境界においてその切り替えが許可される。

　図２０を参照して説明したように、これらのリプレゼンテーション間において各セグメント境界はアラインされているので、図２１のMPDに従って切り替えを行うことにより、シームレスな切り替えを行うことができる。

　図２２は、図２０の場合のMPDの記述例を示す図である。図２１の例の場合、アダプテーションセットを超える切り替えに関する情報は、アダプテーションセットに設定されている。

　図２２において下線で示されるように、アダプテーションセット（a1）において、属性@ContentSwitchingDestinationIdに値「a2」が設定されている。つまり、切り替え先の候補としてアダプテーションセット（a2）が指定されている。また、そのアダプテーションセット（a1）において、属性@ContentSwitchingAlignmentCycleに値「１」が設定されている。つまり、切り替えのタイミングに関する情報として、１周期分のセグメント数「１」が設定されている。つまり、この場合、アダプテーションセット（a1）から見て、切り替え先の候補はアダプテーションセット（a2）のリプレゼンテーションであり、全てのセグメント境界においてその切り替えが許可される。

　また、アダプテーションセット（a2）において、属性@ContentSwitchingDestinationIdに値「a1」が設定されている。つまり、切り替え先の候補としてアダプテーションセット（a1）が指定されている。また、そのアダプテーションセット（a1）において、属性@ContentSwitchingAlignmentCycleに値「１」が設定されている。つまり、切り替えのタイミングに関する情報として、１周期分のセグメント数「１」が設定されている。つまり、全てのセグメント境界においてアダプテーションセットを超えた切り替えが許可されている。

　図２０を参照して説明したように、これらのアダプテーションセット間において各セグメント境界はアラインされているので、図２１または図２２のMPDに従って切り替えを行うことにより、シームレスな切り替えを行うことができる。

　　＜切り替えに関する情報の例２＞
　アダプテーションセットを超えた切り替えが許可されるアダプテーションセットにより管理されるコンテンツデータの符号化方式は、互いに異なっていてもよい。例えば、図２３に示されるように、アダプテーションセット（Adaptation Set（a1））のリプレゼンテーションにおいて、64fsの2.8MHzのDSDロスレスストリームのMP4ファイルが管理され、アダプテーションセット（a2）のリプレゼンテーションにおいて、fs（44.1kHz）のAACストリームのMP4ファイルが管理されてもよい。

　このように符号化方式が異なる場合であっても、セグメント境界をアラインすることは可能である。例えば、アダプテーションセット（a1）のリプレゼンテーションにおいて、DSDロスレスストリームの１０GOBを１セグメント（Segment）とすると、１セグメントの再生時間は4096×32×10／64＝約4.644秒となる。このアダプテーションセット（a1）のリプレゼンテーションとアダプテーションセット（a2）のリプレゼンテーションとの間でセグメント境界をアラインさせるには、アダプテーションセット（a2）のリプレゼンテーションにおいても１セグメントの再生時間を約4.644秒とすればよい。

　例えば、DSDは44.1kHzの倍数のサンプリング周波数を持ち、fs=44.1kHzとすると、64fsと表せる。通常、ビデオと同時に再生されるAACのサンプリング周波数は48kHzであることが一般的だが、ここでは、AACのサンプリング周波数をfs=44.1kHzとする。上述した約4.644秒の再生時間に相当する、サンプリング周波数fs=44.1kHzのAACのaudio frame数は、(4096x32x10x10/64fs)*(fs/1024)=200である。よって、AACのSegmentを200個のAAC AudioFrameで構成すれば、DSDロスレスストリームのセグメントとアラインさせることができる（図２３の矢印）。つまり、これらのリプレゼンテーション間であれば、任意のセグメント境界において、シームレスな切り替えを行うことができる。

　図２４は、図２３の場合のMPDの記述例を示す図である。図２４の例の場合、アダプテーションセットを超える切り替えに関する情報は、アダプテーションセットに設定されている。

　図２４において下線で示されるように、この場合、アダプテーションセット（a1）において、属性@ContentSwitchingDestinationIdに値「a2」が設定されている。つまり、切り替え先に関する情報として、アダプテーションセット（a2）が切り替え先の候補に設定されている。また、そのアダプテーションセット（a1）において、属性@ContentSwitchingAlignmentCycleに値「１」が設定されている。つまり、切り替えのタイミングに関する情報として、１周期分のセグメント数「１」が設定されている。つまり、この場合、アダプテーションセット（a1）から見て、切り替え先の候補はアダプテーションセット（a2）であり、全てのセグメント境界においてその切り替えが許可される。

　また、アダプテーションセット（a2）において、属性@ContentSwitchingDestinationIdに値「a1」が設定されている。つまり、切り替え先に関する情報として、アダプテーションセット（a1）が切り替え先の候補に設定されている。また、そのアダプテーションセット（a2）において、属性@ContentSwitchingAlignmentCycleに値「１」が設定されている。つまり、切り替えのタイミングに関する情報として、１周期分のセグメント数「１」が設定されている。つまり、この場合、アダプテーションセット（a2）から見て、切り替え先の候補はアダプテーションセット（a1）であり、全てのセグメント境界においてその切り替えが許可される。

　図２３を参照して説明したように、これらのアダプテーションセット間において各セグメント境界はアラインされているので、図２４のMPDに従って、任意のセグメント境界において切り替えを行うことにより、シームレスな切り替えを行うことができる。

　　＜切り替えに関する情報の例３＞
　さらに、切り替え先の候補は複数であってもよい。また、一部のタイミング（一部のセグメント境界）においてのみが切り替えのタイミングの候補とされるようにしてもよい。例えば、一部のセグメント境界のみアラインされるようにしてもよい。

　例えば、図２５に示されるMPDの場合、アダプテーションセット（Adaptation Set（a1））のリプレゼンテーション（a1r1）においては、2.8MHzのDSDロスレスストリームのMP4ファイルが管理され、アダプテーションセット（a2）のリプレゼンテーション（a2r1）においては、5.6MHzのDSDロスレスストリームのMP4ファイルが管理されている。さらに、アダプテーションセット（a3）のリプレゼンテーション（a3r1）においては、48kHz,16bitのLPCM（Linear Pulse Code Modulation）のMP4ファイルが管理され、リプレゼンテーション（a3r2）においては、48kHz,24bitのLPCM（Linear Pulse Code Modulation）のMP4ファイルが管理される。

　そして、図２５に示されるように、リプレゼンテーション（a1r1）とリプレゼンテーション（a2r1）との間では、全てのセグメント境界においてアラインされている。また、リプレゼンテーション（a3r1）とリプレゼンテーション（a3r2）との間でも、全てのセグメント境界においてアラインされている。そして、リプレゼンテーション（a1r1）およびリプレゼンテーション（a2r1）において４セグメント毎、リプレゼンテーション（a3r1）およびリプレゼンテーション（a3r2）において５セグメント毎に、これらすべてのリプレゼンテーションの間でセグメント境界がアラインされている。

　アダプテーションセット（a3）と、アダプテーションセット（a1）やアダプテーションセット（a2）との間では、セグメントの長さ（再生時間）が互いに異なる。このような場合、両アダプテーションのセグメントの長さの最小公倍数において、セグメント境界がアラインする。例えば、アダプテーションセット（a1）やアダプテーションセット（a2）のセグメントの長さが、アダプテーションセット（a3）のセグメントの長さの４分の５倍であるとすると、図２５に示されるように、アダプテーションセット（a1）やアダプテーションセット（a2）において４セグメント毎、アダプテーションセット（a3）において５セグメント毎にセグメント境界がアラインする。

　これらのリプレゼンテーション間であれば、以上のようなアラインされたセグメント境界において切り替えを行うことにより、シームレスな切り替えを行うことができる。

　図２６は、図２５の場合のMPDの記述例を示す図である。図２６の例の場合、アダプテーションセットを超える切り替えに関する情報は、アダプテーションセットに設定されている。

　図２６において下線で示されるように、アダプテーションセット（a1）において、属性@ContentSwitchingDestinationIdに値「a2 a3」が設定され、属性@ContentSwitchingAlignmentCycleに値「1 4」が設定されている。つまり、この場合、アダプテーションセット（a1）からみて、切り替え先の候補は、アダプテーションセット（a2）とアダプテーションセット（a3）である。また、アダプテーションセット（a2）への切り替えのタイミングの候補は全セグメント境界であり、アダプテーションセット（a3）への切り替えのタイミングの候補は4つおきのセグメント境界である。

　また、アダプテーションセット（a2）において、属性@ContentSwitchingDestinationIdに値「a1 a3」が設定され、属性@ContentSwitchingAlignmentCycleに値「1 4」が設定されている。つまり、アダプテーションセット（a2）からみて、切り替え先の候補は、アダプテーションセット（a1）とアダプテーションセット（a3）である。また、アダプテーションセット（a1）への切り替えのタイミングの候補は全セグメント境界であり、アダプテーションセット（a3）への切り替えのタイミングの候補は4つおきのセグメント境界である。

　図２７は、この場合のMPDの記述例を示す図である。図２７に示されるMPDの記述例は、図２５の構成に対応する。図２７において下線で示されるように、この場合、アダプテーションセット（a3）において、属性@ContentSwitchingDestinationIdに値「a1 a2」が設定され、属性@ContentSwitchingAlignmentCycleに値「5 5」が設定されている。つまり、アダプテーションセット（a3）からみて、切り替え先の候補は、アダプテーションセット（a1）とアダプテーションセット（a2）である。また、アダプテーションセット（a1）またはアダプテーションセット（a2）への切り替えのタイミングの候補は５つおきのセグメント境界である。

　あらかじめスイッチングを想定してコンテンツを制作できる場合は、図２３の例のように、各オーディオストリーム固有のオーディオフレーム（オーディオアクセスユニット、オーディオフレームとも呼ばれる。MP4のシステム層からは1MP4サンプルとして参照されることが多い。）の公倍数でセグメントを構成することにより、セグメント境界を同時刻に合わせることができる。図２３の例では、１セグメントの時間長が約4.6秒と適切な長さで構成できているが、これはDSDロスレスストリームのブロック長が、AACのオーディオフレーム長を考慮して設計されているためである。

　しかしながら、一般的には、オーディオフレームの公倍数で１セグメントを構成すると、１セグメントが数秒以上と長くなってしまう場合がある。ランダムアクセスの観点ではセグメント時間長は約３秒乃至４秒程度以下にするのが望ましく、ユースケースによっては、１セグメントをオーディオフレームの公倍数で構成できない場合がある。図２５の例ではランダムアクセスの利便性向上のため、セグメント長を約３秒乃至４秒程度に制限しているため、DSDとLPCMで１セグメント長が異なっている。

　しかしながら、セグメント長はアダプテーションセット内で固定であるという性質から、ある周期でセグメント境界が一致する箇所が発生する。このようにある時間周期で、シームレススイッチングを実現できる必要条件を満たすセグメント境界が発生する。

　そこで、この箇所をプレーヤが即座にわかる属性を、上述したようにMPDに設けるようにすることにより、シームレスな切り替えを行うことができるようになる。

　　＜MPDの構成と記述例４＞
　なお、単にセグメント長の公倍数がスイッチング可能箇所であるならば、MPDに記載されたセグメントデュレーション（Segment duration）の情報を用いてアダプテーションセット間でのスイッチングを実現することは不可能ではない。例えば、MPDにはMultipleSegmentBaseInformation elementが定義されており、@duration属性が存在する。しかしながら、属性@durationの説明には、デュレーション（duration）の値は厳密な値ではなく、概算値であるとの説明がある（ISO/IEC23009-1:2014；”If present, specifies the constant approximate Segment duration.”）。このように、MPDにあるデュレーションの情報だけから、時間軸上でセグメント境界が完全に一致しているか否かの判定をすることができない。

　加えて、アダプテーションセット間のスイッチングを許容することにより、コンテンツ制作者や配信側が望まないスイッチングや、操作性に問題があるスイッチングを抑制する機能が求められることが考えられる。これまでストリームのスイッチングはアダプテーションセット内で制限されていたため、コンテンツ制作者や配信側は、プレーヤがどのようなスイッチングを行うかを想定することが出来ていた。しかしながら、アダプテーションセット間のスイッチングまで許容すると、コンテンツ制作者や配信側が想定しないスイッチングが出来てしまう可能性がある。

　そこで、上述した拡張属性（切り替え先に関する情報やタイミングに関する情報）を、このような、配信側が想定しないスイッチングの抑制に利用するようにしてもよい。つまり、具体的には、上述した拡張属性（切り替え先に関する情報やタイミングに関する情報）により、アラインされたセグメント境界の内、一部の境界におけるスイッチングのみを許可するようにしてもよい。

　例えば、図２８の例においては、図２０の場合と同様に、全てのリプレゼンテーション間において、全てのセグメント境界がアラインされている。したがって、全てのセグメント境界においてスイッチングを許可することもできるが、図２８に矢印で示されるように、その内の一部のセグメント境界においてのみスイッチングを許可するようにしてもよい。さらに、例えば1番目のセグメントと2番目のセグメントとの間のセグメント境界のように、一部のリプレゼンテーション間でのみ（例えばAACのリプレゼンテーション間でのみ）スイッチングを許可するようにすることもできる。図２９にこのMPDの記述例を示す。図２９において下線部分に示されるように、この場合、スイッチングを許可するセグメント境界が、一部のセグメント境界に制限されている。

　例えば、この図２８のセグメント構成において、全てのセグメント境界でアダプテーションセット間のスイッチングを行うと、約4.6秒ごとにDSDロスレスデコーダとAACデコーダの切り替えが発生する可能性がある。符号化方式が異なるデコーダの切り替え時にはリセットや初期設定が必要になり、あまり頻繁にスイッチングすると、プレーヤのハードウエアの性能等によっては、操作性低下（応答性の悪化）や再生品質が低減する可能性がある。つまり、アダプテーションセット「内」でのスイッチングを考慮してセグメント長を規定した場合、それが必ずしもアダプテーションセット「間」のスイッチング可能な箇所と一致するとは限らない。

　そこで、アダプテーションセット間で全てのセグメント境界がアラインされている場合においても、アダプテーションセット間でのスイッチングが可能なセグメント境界を、上述した切り替えに関する情報やタイミングに関する情報等の拡張属性でプレーヤに伝えることにより、プレーヤは、アダプテーションセット間のスイッチングの可否をより高速に判定することができるようになる。また、上述したようにスイッチング可能なセグメント境界が制限される（低減する）ので、プレーヤの操作性や再生品質の低減を抑制しながらシームレスな切り替えを行うことができるようになる。

　なお、以上の拡張属性を解釈することができない従来のプレーヤは、MPDに含まれるその拡張属性を読み飛ばすことができる。従来のプレーヤは、従来通りアダプテーションセット内のスイッチングしか行わないので、この拡張属性を読み飛ばしても、MPDの記述に従って、コンテンツデータの再生を正しく行うことができる。すなわち、上述した属性（第１の管理単位を越える切り替えに関する情報）を拡張する本技術を用いることにより、互換性を維持したまま新しいユーザインタフェース（UI）を提供することができる。

　　＜配信システム＞
　次に、以上のような本技術を適用するシステムについて説明する。図３０は、本技術を適用した情報処理システムの一態様である配信システムの構成の一例を示すブロック図である。図３０に示される配信システム５００は、画像や音声などのデータ（コンテンツ）を配信するシステムである。配信システム５００において、ファイル生成装置５０１、配信サーバ５０２、および再生端末５０３は、ネットワーク５０４を介して互いに通信可能に接続されている。

　ファイル生成装置５０１は、本技術を適用した情報処理装置の一態様であり、音声データを格納するMP4ファイルやMPDのファイル（MPDファイルとも称する）の生成に関する処理を行う装置である。例えば、ファイル生成装置５０１は、音声データを生成し、生成した音声データを格納するMP4ファイルやそのMP4ファイルを管理するMPDファイルを生成し、生成したそれらのファイルを配信サーバ５０２に供給する。

　配信サーバ５０２は、本技術を適用した情報処理装置の一態様であり、MPEG-DASHを用いたコンテンツデータの配信サービス（すなわち、MPDファイルを用いたMP4ファイルの配信サービス）に関する処理を行うサーバである。例えば、配信サーバ５０２は、ファイル生成装置５０１から供給されたMPDファイルやMP4ファイルを取得して管理し、MPEG-DASHを用いた配信サービスを提供する。例えば、配信サーバ５０２は、再生端末５０３からの要求に応じて、MPDファイルを再生端末５０３提供する。また、配信サーバ５０２は、そのMPDファイルに基づく再生端末５０３からの要求に応じて、要求されたMP4ファイルを再生端末５０３に供給する。

　再生端末５０３は、本技術を適用した情報処理装置の一態様であり、音声データの再生に関する処理を行う装置である。例えば、再生端末５０３は、MPEG-DASHに従って配信サーバ５０２に対してMP4ファイルの配信を要求し、その要求に応じて供給されたMP4ファイルを取得する。より具体的には、再生端末５０３は、配信サーバ５０２からMPDファイルを取得し、そのMPDファイルの情報に従って、所望のコンテンツデータを格納するMP4ファイルを配信サーバ５０２から取得する。再生端末５０３は、その取得したMP4ファイルをデコードし、音声データを再生する。

　ネットワーク５０４は、任意の通信網であり、有線通信の通信網であってもよいし、無線通信の通信網であってもよいし、それらの両方により構成されるようにしてもよい。また、ネットワーク５０４が、１の通信網により構成されるようにしてもよいし、複数の通信網により構成されるようにしてもよい。例えば、インターネット、公衆電話回線網、所謂3G回線や4G回線等の無線移動体用の広域通信網、WAN（Wide Area Network）、LAN（Local Area Network）、Bluetooth（登録商標）規格に準拠した通信を行う無線通信網、NFC（Near Field Communication）等の近距離無線通信の通信路、赤外線通信の通信路、HDMI（登録商標）（High-Definition Multimedia Interface）やUSB（Universal Serial Bus）等の規格に準拠した有線通信の通信網等、任意の通信規格の通信網や通信路がネットワーク５０４に含まれるようにしてもよい。

　ファイル生成装置５０１、配信サーバ５０２、再生端末５０３は、それぞれ、ネットワーク５０４に通信可能に接続されており、このネットワーク５０４を介して互いに情報の授受を行うことができる。ファイル生成装置５０１、配信サーバ５０２、再生端末５０３は、ネットワーク５０４に対して、有線通信により接続されるようにしてもよいし、無線通信により接続されるようにしてもよいし、その両方により接続されるようにしてもよい。

　なお、図３０において、配信システム５００の構成として、ファイル生成装置５０１、配信サーバ５０２、および再生端末５０３は、１台ずつ示されているが、これらの数は、それぞれ任意であり、互いに同一でなくてもよい。例えば、配信システム５００において、ファイル生成装置５０１、配信サーバ５０２、再生端末５０３は、それぞれ、単数であってもよいし、複数であってもよい。

　　＜ファイル生成装置＞
　図３１は、ファイル生成装置５０１の主な構成例を示すブロック図である。図３１に示されるように、ファイル生成装置５０１は、オーディオストリーム生成部５１１、コンテンツファイル生成部５１２、MPD生成部５１３、および通信部５１４を有する。

　オーディオストリーム生成部５１１は、コンテンツデータのストリームの生成に関する処理を行う。例えば、オーディオストリーム生成部５１１は、入力されたオーディオアナログ信号（音声信号とも称する）を変調したり、A/D変換したり、符号化したりして、オーディオデジタルデータ（音声データとも称する）のストリームであるオーディオストリームを生成し、それをコンテンツファイル生成部５１２に供給する。

　なお、このオーディオストリーム生成部５１１によるオーディオアナログ信号に対する信号処理の内容は任意である。例えば、変調や符号化を採用する場合、その変調方式や符号化方式は任意である。例えば、オーディオストリーム生成部５１１は、オーディオアナログ信号から、DSDロスレスストリーム、AACストリーム、LPCMのストリーム等を生成することができる。

　コンテンツファイル生成部５１２は、オーディオストリーム生成部５１１から供給されるコンテンツデータを格納するファイル（コンテンツファイル）の生成に関する処理を行う。例えば、コンテンツファイル生成部５１２は、オーディオストリーム生成部５１１からコンテンツデータとして供給されるオーディオストリームを格納するコンテンツファイルであるMP4ファイルを生成し、それをMPD生成部５１３や通信部５１４に供給する。

　なお、このコンテンツファイル生成部５１２が生成するコンテンツファイルの仕様は任意である。例えば、コンテンツファイル生成部５１２は、DSDロスレスストリーム、AACストリーム、LPCMのストリーム等を格納するMP4ファイルを生成することができる。もちろん、コンテンツファイル生成部５１２がMP4ファイル以外のコンテンツファイルを生成するようにしてもよい。

　MPD生成部５１３は、コンテンツファイル生成部５１２が生成したコンテンツファイルの管理情報の生成に関する処理を行う。例えば、MPD生成部５１３は、コンテンツファイル生成部５１２から供給されるMP4ファイルについてのMPDファイルを生成し、それを通信部５１４に供給する。MPD生成部５１３は、このMPDファイルの生成の際に、上述した本技術を適用し、上述した拡張属性を用いて、アダプテーションセットを越える切り替えに関する情報をMPDに設定する。

　通信部５１４は、ネットワーク５０４を介した他の装置との通信に関する処理を行う。例えば、通信部５１４は、供給されたMPDファイルやMP4ファイルを配信サーバ５０２に供給する。

　図３１に示されるように、MPD生成部５１３は、ピリオド設定部５２１、アダプテーションセット設定部５２２、リプレゼンテーション設定部５２３、セグメント設定部５２４、スイッチング先指定情報設定部５２５、タイミング指定情報設定部５２６、およびファイル生成部５２７を有する。

　ピリオド設定部５２１は、MPDのピリオド（Period）の設定に関する処理を行う。アダプテーションセット設定部５２２は、MPDのアダプテーションセット（Adaptation Set）の設定に関する処理を行う。リプレゼンテーション設定部５２３は、MPDのリプレゼンテーション（Representation）の設定に関する処理を行う。セグメント設定部５２４は、MPDのセグメント（Segment）の設定に関する処理を行う。スイッチング先指定情報設定部５２５は、再生するMP4ファイルのアダプテーションセットを越えるスイッチングのスイッチング先に関する情報の設定に関する処理を行う。タイミング指定情報設定部５２６は、再生するMP4ファイルのアダプテーションセットを越えるスイッチングのタイミングに関する情報の設定に関する処理を行う。ファイル生成部５２７は、MPDファイルの生成に関する処理を行う。

　　＜配信用データ生成処理の流れ＞
　次に、配信システム５００のファイル生成装置５０１において実行される配信用データ生成処理の流れの例を、図３２のフローチャートを参照して説明する。ファイル生成装置５０１は、コンテンツデータのMP4ファイルやMPDファイルを生成する際に、この配信用データ生成処理を行う。

　配信用データ生成処理が開始されると、ファイル生成装置５０１のオーディオストリーム生成部５１１は、ステップＳ５０１において、オーディオアナログ信号から複数種類のオーディオストリームを生成する。例えば、オーディオストリーム生成部５１１は、オーディオアナログ信号をΔΣ変調してDSDデータを生成し、さらに、そのDSDデータを上述した新たなDSD可逆圧縮符号化方式で符号化し、DSDロスレスストリームを生成する。また、オーディオストリーム生成部５１１は、LPCMのストリームやAACのストリーム等も生成することができる。

　ステップＳ５０２において、コンテンツファイル生成部５１２は、ステップＳ５０１において生成されたオーディオストリームを格納するコンテンツファイル（例えばMP4ファイル）を生成する。

　ステップＳ５０３において、MPD生成部５１３は、MPDファイル生成処理を実行し、ステップＳ５０２において生成されたコンテンツファイル（MP4ファイル）を管理するMPDファイルを生成する。

　ステップＳ５０４において、通信部５１４は、ステップＳ５０２において生成されたコンテンツファイルや、ステップＳ５０３において生成されたMPDファイルを配信サーバ５０２に供給（アップロード）する。

　ステップＳ５０４の処理が終了すると、配信用データ生成処理が終了する。

　　＜MPDファイル生成処理の流れ＞
　次に、図３３のフローチャートを参照して図３２のステップＳ５０３において実行されるMPDファイル生成処理の流れの例を説明する。

　MPDファイル生成処理が開始されると、MPD生成部５１３のピリオド設定部５２１は、ステップＳ５０２において生成されたコンテンツファイル（MP4ファイル）について、ステップＳ５１１において、ピリオドを設定する。ステップＳ５１２において、アダプテーションセット設定部５２２は、アダプテーションセットを設定する。ステップＳ５１３において、リプレゼンテーション設定部５２３は、リプレゼンテーションを設定する。

　ステップＳ５１４において、セグメント設定部５２４は、セグメント境界を適宜揃えて（アラインさせて）セグメントを設定する。なお、このセグメント境界のアラインは、上述したように全てのセグメント境界において行う必要は無い。つまり、セグメント設定部５２４は、一部のセグメント境界についてのみアラインさせるようにしてもよい。どのようにセグメント境界をアラインさせるかは、例えば、各符号化方式等の仕様や、ユーザ等の指示等の、任意の情報に基づいて決定される。

　ステップＳ５１５において、スイッチング先指定情報設定部５２５は、アダプテーションセットを越えたスイッチングのスイッチング先として許可するアダプテーションセットやリプレゼンテーション等の任意の管理単位を指定するスイッチング先指定情報を設定する。なお、このスイッチング先指定情報は、上述した切り替え先に関する情報であり、本技術を適用した情報である。つまり、スイッチング先指定情報設定部５２５は、例えば、本技術を適用した拡張属性@ContentSwitchingDestinationIdを、このスイッチング先指定情報として設定する。

　なお、スイッチング先指定情報は、例えばアダプテーションセットやリプレゼンテーション等の任意の管理単位に設定することができる。スイッチング先指定情報設定部５２５は、例えば、MP4ファイルの各種情報、ステップＳ５１４において設定されたセグメント境界のアライン、ユーザ等の指示等の、任意の情報に基づいてスイッチング先として許可する管理単位を決定し、スイッチング先指定情報を設定する。

　ステップＳ５１６において、タイミング指定情報設定部５２６は、アダプテーションセットを越えたスイッチングを許可するタイミングを指定するタイミング指定情報を設定する。なお、このタイミング指定情報は、上述した切り替えのタイミングに関する情報であり、本技術を適用した情報である。つまり、タイミング指定情報設定部５２６は、例えば、本技術を適用した拡張属性@ContentSwitchingAlignmentCycleを、このタイミング指定情報として設定する。

　なお、このスイッチング先指定情報は、例えばアダプテーションセットやリプレゼンテーション等の任意の管理単位に設定することができる。タイミング指定情報設定部５２６は、例えば、MP4ファイルの各種情報、ステップＳ５１４において設定されたセグメント境界のアライン、ユーザ等の指示等の、任意の情報に基づいてアダプテーションセットを越えたスイッチングを許可するタイミングを決定し、タイミング指定情報を設定する。

　ステップＳ５１７において、ファイル生成部５２７は、ステップＳ５１１乃至ステップＳ５１６において行われた各種設定を反映したMPDファイルを生成する。MPDファイルが生成されると、MPDファイル生成処理が終了し、処理は図３２に戻る。

　以上のように各処理を実行することにより、ファイル生成装置５０１は、本技術を適用した拡張属性を有するMPDファイルを生成することができる。すなわち、ファイル生成装置５０１は、本技術を適用した切り替えに関する情報を設定することができる。これにより、アダプテーションセットを越えるシームレスな切り替えを容易に実現することができ、コンテンツデータをより安定的に伝送することができる。

　　＜再生端末＞
　図３４は、再生端末５０３の主な構成例を示すブロック図である。図３３に示されるように、再生端末５０３は、MPD取得部５５１、パース部５５２、コンテンツファイル取得部５５３、ストリーム抽出部５５４、復号部５５５、および出力部５５６を有する。

　MPD取得部５５１は、MPDファイルの取得に関する処理を行う。例えば、MPD取得部５５１は、配信サーバ５０２に対してMPDファイルを要求し、その配信サーバ５０２から供給されるMPDファイルを取得する。MPD取得部５５１は、取得したMPDファイルをパース部５５２に供給する。

　パース部５５２は、MPDファイルのパース（解析）に関する処理を行う。例えば、パース部５５２は、MPD取得部５５１から供給されるMPDファイルをパースし、そのMPDファイルの記述に応じた制御情報を生成し、それをコンテンツファイル取得部５５３に供給する。

　コンテンツファイル取得部５５３は、コンテンツファイルの取得に関する処理を行う。例えば、コンテンツファイル取得部５５３は、パース部５５２から供給される制御情報に基づいて、配信サーバ５０２からコンテンツファイルとしてMP4ファイルを取得し、その取得したMP4ファイルをストリーム抽出部５５４に供給する。

　ストリーム抽出部５５４は、ストリームの抽出に関する処理を行う。例えば、ストリーム抽出部５５４は、コンテンツファイル取得部５５３から供給されるMP4ファイルからオーディオストリームを抽出する。例えば、そのオーディオストリームを復号して出力する場合、ストリーム抽出部５５４は、抽出したオーディオストリームを復号部５５５に供給する。オーディオストリームのまま出力する場合、ストリーム抽出部５５４は、抽出したオーディオストリームを出力部５５６に供給する。

　復号部５５５は、コンテンツデータが符号化された符号化データの復号に関する処理を行う。例えば、復号部５５５は、ストリーム抽出部５５４から供給されたオーディオストリームを復号する等して、オーディオアナログ信号を復元する。復号部５５５は、復元したオーディオアナログ信号を出力部５５６に供給する。なお、復号部５５５がオーディオストリームに対して行う処理は、そのストリームに対して正しい方法である限り任意である。例えば、復号だけでなく、復調やD/A変換等も行われるようにしてもよい。

　例えば、オーディオストリームは、DSDロスレスストリームであり、復号部５５５は、そのDSDロスレスストリームを復号してDSDデータを復元し、さらに復調してオーディオアナログ信号を復元する。また、例えば、オーディオストリームは、LPCMのストリームであってもよいし、AACのストリームであってもよい。復号部５５５は、それらのデータに応じた処理を行い、オーディオアナログ信号を復元する。

　出力部５５６は、コンテンツデータの出力に関する処理を行う。例えば、出力部５５６は、スピーカを有し、復号部５５５から供給されるオーディオアナログ信号をそのスピーカから出力する。また、例えば、出力部５５６は、アナログ信号の出力端子を有し、復号部５５５から供給されるオーディオアナログ信号を、その出力端子を介して他の装置に供給する。さらに、例えば、出力部５５６は、デジタル信号の出力端子を有し、ストリーム抽出部５５４から供給されたオーディオストリームを、その出力端子を介して例えば外部デコーダ５６１等の他の装置に供給する。つまり、オーディオストリームは、再生端末５０３の外部に設けられた外部デコーダ５６１において復号することもできる。

　また、図３４に示されるように、パース部５５２は、スイッチング先指定情報解析部５７１と、タイミング指定情報解析部５７２とを有する。スイッチング先指定情報解析部５７１は、MPDファイルに含まれるスイッチング先指定情報（再生するコンテンツデータのアダプテーションセットを越える切り替えの、切り替え先に関する情報）の解析に関する処理を行う。タイミング指定情報解析部５７２は、MPDファイルに含まれるタイミング指定情報（再生するコンテンツデータのアダプテーションセットを越える切り替えのタイミングに関する情報）の解析に関する処理を行う。

　また、図３４に示されるように、コンテンツファイル取得部５５３は、スイッチング制御部５８１を有する。スイッチング制御部５８１は、再生するコンテンツデータのアダプテーションセットを越えるスイッチングの制御に関する処理を行う。例えば、スイッチング制御部５８１は、スイッチング先指定情報解析部５７１やタイミング指定情報解析部５７２の解析結果に基づいて（スイッチング先指定情報解析部５７１やタイミング指定情報解析部５７２の解析結果が反映された制御情報に基づいて）このスイッチングの制御を行う。

　　＜再生処理の流れ＞
　次に、配信システム５００の再生端末５０３において実行される再生処理の流れの例を、図３５のフローチャートを参照して説明する。再生処理が開始されると、再生端末５０３のMPD取得部５５１は、ステップＳ５３１において、例えばユーザ等により指定されたMPDファイルを配信サーバ１０２から取得する。

　ステップＳ５３２において、パース部５５２は、パース処理を実行して、ステップＳ５３１において取得されたMPDファイルをパースし、そのパース結果を反映した制御情報を生成する。ステップＳ５３３において、コンテンツファイル取得部５５３は、コンテンツファイル取得処理を実行して、ステップＳ５３２のパース結果（制御情報）や、ネットワーク５０４の空き帯域等の通信状況などに応じて、所望のコンテンツに関するMP4ファイルを、配信サーバ１０２から取得する。

　ステップＳ５３４において、ストリーム抽出部５５４は、ステップＳ５３３において取得されたMP4ファイルからオーディオストリームを抽出する。ステップＳ５３５において、復号部５５５は、そのオーディオストリームを復号するか否かを判定する。復号すると判定された場合、処理はステップＳ５３６に進む。ステップＳ５３６において、復号部５５５は、ステップＳ５３４において抽出されたオーディオストリームを復号し、オーディオアナログ信号を復元する。オーディオストリームが復号されると処理はステップＳ５３７に進む。また、ステップＳ５３５において、オーディオストリームを復号しないと判定された場合、処理はステップＳ５３７に進む。

　ステップＳ５３７において、出力部５５６は、オーディオストリームまたはオーディオアナログ信号を出力する。ステップＳ５３７の処理が終了すると、再生処理が終了する。

　　＜パース処理の流れ＞
　次に、図３５のステップＳ５３２において実行されるパース処理の流れの例を、図３６のフローチャートを参照して説明する。

　パース処理が開始されると、パース部５５２は、ステップＳ５４１においてMPDファイルを解析する。ステップＳ５４２において、スイッチング先指定情報解析部５７１は、MPDファイルに含まれるスイッチング先指定情報を解析する。ステップＳ５４３において、タイミング指定情報解析部５７２は、MPDファイルに含まれるタイミング指定情報を解析する。

　ステップＳ５４３の処理が終了するとパース処理が終了し、処理は図３５に戻る。以上のようにパース部５５２は、MPDファイルを解析し、さらに、本技術を適用した拡張属性（@ContentSwitchingDestinationIdや@ContentSwitchingAlignmentCycle等）を解析することができる。

　　＜コンテンツファイル取得処理の流れ＞
　次に、図３５のステップＳ５３３において実行されるコンテンツファイル取得処理の流れの例を、図３７のフローチャートを参照して説明する。コンテンツファイル取得処理が開始されると、コンテンツファイル取得部５５３は、ステップＳ５５１において、パース結果や通信状況などに応じて、取得するコンテンツファイル（MP4ファイル）を選択する。取得するMP4ファイルが決定すると、ステップＳ５５２において、コンテンツファイル取得部５５３は、そのMP4ファイルの取得を開始する。

　ステップＳ５５３において、スイッチング制御部５８１は、取得するMP4ファイルを切り替えるか否かを判定する。例えば伝送帯域の変動などに応じて、取得するMP4ファイルを切り替えると判定された場合、処理はステップＳ５５４に進む。

　ステップＳ５５４において、スイッチング制御部５８１は、スイッチング先指定情報の解析結果に基づいて、スイッチング先（すなわち、切り替え後のMP4ファイル）を選択する。ステップＳ５５５において、スイッチング制御部５８１は、タイミング指定情報の解析結果に基づいて、スイッチングを行うタイミングを決定し、そのタイミングにおいて、取得するMP4ファイルを切り替える。

　ステップＳ５５５の処理が終了すると、処理はステップＳ５５６に進む。また、ステップＳ５５３において、取得するMP4ファイルを切り替えないと判定された場合、処理はステップＳ５５６に進む。

　ステップＳ５５６において、コンテンツファイル取得部５５３は、MP4ファイルの取得を終了するか否かを判定する。まだ、所望のコンテンツのMP4ファイルの取得が終了しておらず、MP4ファイルの取得を終了しないと判定された場合、処理はステップＳ５５３に戻り、それ以降の処理が繰り返される。そして、ステップＳ５５６において、所望のコンテンツに関するMP4ファイルの取得が終了したと判定された場合、コンテンツファイル取得処理が終了する。

　以上のように各処理を実行することにより、再生端末５０３は、本技術を適用した拡張属性を有するMPDファイルに応じてコンテンツファイルを取得することができる。すなわち、再生端末５０３は、そのMPDファイルに応じて、アダプテーションセットを越えるシームレスな切り替えを容易に実現することができ、コンテンツデータをより安定的な伝送を実現することができる。

　＜３．第２の実施の形態＞
　　＜スイッチングの方針の制御＞
　第１の実施の形態において説明した本技術を適用することにより、アダプテーションセット間でのスイッチングが許容され、ストリームの切り替えに大きな自由度が生まれる。その自由度により、コンテンツ制作側・配信側が望まないスイッチングの組み合わせも発生する可能性がある。

　例えば、ビデオとオーディオが同程度のビットレートになる場合、伝送路帯域の変動によってビデオとオーディオのどちらをスイッチングすることも考えられる。例えば、オーディオ重視のアプリケーションの場合、伝送帯域が下がった時にはまずビデオのレートを下げて、オーディオはなるべく品質を維持すべきという方針も考えられる。このように、単にビットレート値のみでストリームを選択するのではなく、送り出し側が想定するストリームの優先度に従ってスイッチングすることで、映像と音を合わせた状態での品質を高く維持することができる可能性がある。

　また、別のケースとしては、サンプリング周波数2.8MHzのDSDはすべてのプレーヤが再生可能だが、5.6MHzのDSDは一部のプレーヤのみが対応しているアプリケーションがあるとする。そのとき、DSD5.6MHzからDSD2.8MHzへのスイッチングはプレーヤが自動に行えるが、その逆はユーザが明示的に指示しない限りスイッチングされないようにしたいという方針も考えられる。

　また、図３８に示される例のように、DSD5.6MHzからDSD2.8MHzへのスイッチングはプレーヤが自動に行えるが、DSD5.6MHzからLPCMへのスイッチングは抑制したいという方針も考えられる。

　そこで配信側が望むスイッチングの優先順位やスイッチングの方向性（ある方向にはスイッチングし易いがその逆はしにくい）等をプレーヤ側に伝え、プレーヤでのスイッチングを制御するようにしてもよい。

　　＜切り替え優先順の設定＞
　このような切り替えの方針に関する情報として、再生するデータの第１の管理単位を越える切り替えの、優先順に関する情報を設定するようにしてもよい。そして、この優先順に関する情報は、第１の管理単位の優先順を示す情報であるようにしてもよい。

　このような切り替えの優先順に関する情報を設定することにより、プレーヤ側におけるスイッチングの方針を、配信側から制御することができる。したがって、プレーヤ側において配信側が意図しないスイッチングが行われることを抑制することができる。これにより、例えば映像データばかりが伝送される等の、配信側が想定していなかった不安定なコンテンツデータの伝送を抑制することができる。つまり、配信側の意図したとおりに、コンテンツデータを伝送することができる。すなわち、コンテンツデータをより安定的に伝送することができる。

　なお、再生するデータをコンテンツデータ（オーディオストリーム）とし、管理情報をMPEG-DASHのMPDとし、第１の管理単位をアダプテーションセット（Adaptation Set）としてもよい。このようにすることにより、MPEG-DASHを用いた配信をより安定的に行うことができる。

　例えば、この優先順に関する情報として、属性@stabilityRankingを設定するようにしてもよい。この属性@stabilityRankingは、スイッチングの許容性を示す属性であり、例えば、アダプテーションに対して設定するようにしてもよい。例えば、この属性@stabilityRankingには、アダプテーションセットのスイッチングの許容度を示す自然数が設定される。この属性の値が大きくなる程、スイッチングがより許容されることを示し、ストリームのスイッチングを行う際は、この値がより大きい（より下位の）アダプテーションセットから先にスイッチングするように制御される。つまり、この属性の値が「１」のアダプテーションセットが、最もスイッチングさせたくないアダプテーションセットであることを示す。

　　＜優先ルールの例＞
　このような優先順に関する情報に基づく切り替えは、例えば、以下のような規則で行われるようにしてもよい。

　伝送帯域を確保できずビットレートを下げる必要が発生したとき、まずアダプテーションセット内でのリプレゼンテーション間の切り替えを行う。このとき、選択・再生中のストリームのうち、上述の属性@stabilityRankingの値が大きい（下位の）アダプテーションセットから順にリプレゼンテーションの切り替えを行う。

　また、リプレゼンテーションのスイッチでは伝送帯域を確保できず、アダプテーションセットを越えた切り替えが必要な場合、選択・再生中のストリームのうち、属性@stabilityRankingの値が最も大きい（下位の）アダプテーションセットを、属性@stabilityRankingの値がより大きい（より下位の）アダプテーションセットに切り替える。

　さらに、属性@stabilityRankingが最も大きい（下位の）アダプテーションセットをこれ以上スイッチングでき無い場合は、属性@stabilityRankingの値が次に大きい（１つ上の順位の）他のアダプテーションセットのスイッチングを試みる。

　なお、以上においては、属性@stabilityRankingの値を自然数としたが、この属性@stabilityRankingに値「０」を設定することができるようにしてもよい。その場合、値「０」は、単純に優先度を示す自然数とは異なる特別な値として利用するようにしてもよい。

　　＜属性@stabilityRankingの付与例１＞
　例えば、図３９のＡに示されるようなピリオド構成のMPDファイルの各アダプテーションセットに対して、DSDの配信を優先させるように属性@stabilityRankingを割り当てた例を、図３９のＢに示す。図３９のＢの表に示されるように、この場合、DSDのストリームをできるだけ切り替えないように、DSDストリームのアダプテーションセットに対してより若い番号（「１」や「２」）が設定されている。

　例えば、このような構成のMPDに対してプレーヤが、伝送（可能）帯域に合わせて、再生するビデオデータおよびオーディオデータを、そのビットレートの合計が多い順に選択する場合、図４０のＡの表に示されるような優先順で各データが選択される。したがって、このような優先順では、DSDのストリームを優先的に選択できていない。しかも、低ビットレートのAACのストリームが、高ビットレートのDSDのストリームより優先して選択される等、画音品質の逆転が起きている。

　これに対して、図３９のＢの表に示されるような値の属性@stabilityRankingを各アダプテーションセットに設定して、それをスイッチング制御に利用することにより、プレーヤは、図４０のＢの表に示されるような優先順で各データを選択することができる。なお、図４０のＢの表において、括弧内の数字は、そのアダプテーションセットの優先順（属性@stabilityRankingの値）を示している。

　より具体的に説明すると、まず、オーディオで最上位のもの、ビデオで最上位のものを選び、次に、属性@stabilityRankingの値が大きい（下位の）ビデオのアダプテーションセット内においてリプレゼンテーションのスイッチングをする。次に、属性@stabilityRankingの値が大きい（下位の）ビデオの、アダプテーションセットを越えたスイッチングを行う。ビデオの属性@stabilityRankingの値をこれ以上大きくできなくなる（順位を下げられなくなる）と、次は、オーディオの、アダプテーションセットを越えたスイッチングを行うようにし、オーディオの属性@stabilityRankingの値を大きくしていく（順位を下げていく）。

　このような手順で選択することにより、図４０のＢに示されるような優先順の選択を行うことができる。このような優先順で伝送路帯域に収まるオーディオとビデオの組み合わせを選択することで、最も高音質なDSD5.6を出来るだけ維持したスイッチングを実現することができる。

　この場合のMPDの記述例を図４１に示す。図４１には、オーディオデータのアダプテーションセットについてのみ記述例が示されている。図４１に示されるように、この場合、各アダプテーションセットに対して、属性@ContentSwitchingDestinationIdと、属性@stabilityRankingとが設定されている。

　　＜属性@stabilityRankingの付与例２＞
　例えば、図３９のＡに示されるようなピリオド構成のMPDファイルの各アダプテーションセットに対して、ビデオの配信を優先させるように属性@stabilityRankingを割り当てた例を、図４２のＡに示す。図４２のＡの表に示されるように、この場合、ビデオのストリームをできるだけ切り替えないように、ビデオのストリーム（4K/30p 20Mbps, 4K/30p 10Mbps）のアダプテーションセットに対して、DSDのアダプテーションセットよりも若い番号（「１」）が設定されている。

　このような値の属性@stabilityRankingを各アダプテーションセットに設定して、それをスイッチング制御に利用することにより、プレーヤは、図４２のＢの表に示されるような優先順で各データを選択することができる。なお、図４２のＢの表において、括弧内の数字は、そのアダプテーションセットの優先順（属性@stabilityRankingの値）を示している。

　より具体的に説明すると、まず、オーディオで最上位のもの、ビデオで最上位のものを選び、次に、属性@stabilityRankingの値が大きい（下位の）DSD5.6のリプレゼンテーションのスイッチングをしようとするが、１本しか無いのでビデオのリプレゼンテーションのスイッチを行う。これ以上リプレゼンテーションのスイッチングを行うことができなくなると、属性@stabilityRankingの値がより大きな（より下位の）オーディオのアダプテーションセットを越えたスイッチングを行う。そして、次に、属性@stabilityRankingの値が大きい（下位の）AACのリプレゼンテーションのスイッチングが行われる。そしてまたこれ以上オーディオのアダプテーションセットを越えたスイッチングおよびオーディオのリプレゼンテーションのスイッチングを行うことができなくなると、ビデオのアダプテーションセットを越えたスイッチングを行う。

　このような手順で選択することにより、図４２のＢに示されるような優先順の選択を行うことができる。このような優先順で伝送路帯域に収まるオーディオとビデオの組み合わせを選択することで、４K動画を出来るだけ維持したスイッチングを実現することができる。

　　＜ファイル生成装置＞
　この場合のファイル生成装置５０１の主な構成例を図４３に示す。この場合も、ファイル生成装置５０１は、第１の実施の形態（図３１）の場合と基本的に同様の構成を有する。ただし、この場合、MPD生成部５１３は、選択優先順情報設定部７０１を有する。

　選択優先順情報設定部７０１は、選択優先順情報の設定に関する処理を行う。この選択優先順情報は、コンテンツデータのアダプテーションセットを越える切り替えの、優先順に関する情報であり、例えばアダプテーションセットの優先順を示す情報であり、例えば、本技術を適用した拡張属性@stabilityRanking等を含む。

　　＜MPDファイル生成処理の流れ＞
　この場合も配信用データ生成処理は、第１の実施の形態（図３２）の場合と同様に実行される。図４４のフローチャートを参照して、この場合のMPDファイル生成処理の流れの例を説明する。

　この場合も、ステップＳ５７１乃至ステップＳ５７４の各処理は、図３３のステップＳ５１１乃至ステップＳ５１４の各処理と同様に実行される。

　ステップＳ５７５において、選択優先順情報設定部７０１は、各アダプテーションセットの選択優先順を決定し、その選択優先順を示す選択優先順情報を設定する。選択優先順情報設定部７０１は、例えば、MP4ファイルの各種情報、ユーザ等の指示等の、任意の情報に基づいてこの選択優先順を決定する。

　ステップＳ５７６において、ファイル生成部５２７は、ステップＳ５７１乃至ステップＳ５７５において行われた各種設定を反映したMPDファイルを生成する。MPDファイルが生成されると、MPDファイル生成処理が終了し、処理は図３２に戻る。

　以上のように各処理を実行することにより、ファイル生成装置５０１は、本技術を適用した拡張属性を有するMPDファイルを生成することができる。すなわち、ファイル生成装置５０１は、本技術を適用した切り替えに関する情報を設定することができる。これにより、配信側の意図しないスイッチングを抑制し、配信側の意図したとおりに、コンテンツデータを伝送することができる。すなわち、コンテンツデータをより安定的に伝送することができる。

　　＜再生端末＞
　この場合の再生端末５０３の主な構成例を図４５に示す。この場合も、再生端末５０３は、第１の実施の形態（図３４）の場合と基本的に同様の構成を有する。ただし、この場合、パース部５５２は、選択優先順情報解析部７１１を有する。選択優先順情報解析部７１１は、選択優先順情報の解析に関する処理を行う。

　例えば、コンテンツファイル取得部５５３のスイッチング制御部５８１は、選択優先順情報解析部７１１の解析結果に基づいて（選択順優先情報解析部７１１の解析結果が反映された制御情報に基づいて）このスイッチングの制御を行う。

　　＜パース処理の流れ＞
　この場合も再生処理は、第１の実施の形態（図３５）の場合と同様に実行される。図４６のフローチャートを参照して、この場合のパース処理の流れの例を説明する。

　パース処理が開始されると、パース部５５２は、ステップＳ５８１においてMPDファイルを解析する。ステップＳ５８２において、選択優先順情報解析部７１１は、MPDファイルに含まれる選択優先順情報を解析する。

　ステップＳ５８２の処理が終了するとパース処理が終了し、処理は図３５に戻る。以上のようにパース部５５２は、MPDファイルを解析し、さらに、本技術を適用した拡張属性（@stabilityRanking等）を解析することができる。

　　＜コンテンツファイル取得処理の流れ＞
　次に、図４７のフローチャートを参照して、この場合のコンテンツファイル取得処理の流れの例を説明する。この場合も、ステップＳ５９１乃至ステップＳ５９３の各処理は、図３７のステップＳ５５１乃至ステップＳ５５３の各処理と同様に実行される。

　ステップＳ５９４において、スイッチング制御部５８１は、スイッチング処理を実行し、選択優先順情報に基づいて取得するコンテンツファイル（MP4ファイル）を切り替える。ステップＳ５９４の処理が終了すると処理はステップＳ５９５に進む。

　ステップＳ５９５の処理は、図３７のステップＳ５５６の処理と同様に実行される。つまり、ステップＳ５９５において所望のコンテンツに関するMP4ファイルの取得が終了したと判定された場合、コンテンツファイル取得処理が終了する。

　　＜スイッチング処理の流れ＞
　次に、図４７のステップＳ５９４において実行されるスイッチング処理の流れの例を、図４８のフローチャートを参照して説明する。

　スイッチング処理が開始されると、スイッチング制御部５８１は、ステップＳ６０１において、選択優先順が最下位のアダプテーションセットを処理対象とする。

　ステップＳ６０２において、スイッチング制御部５８１は、より低ビットレートのリプレゼンテーションへの切り替えが可能であるか否かを判定する。切り替えが不可能であると判定された場合、処理はステップＳ６０３に進む。

　ステップＳ６０３において、スイッチング制御部５８１は、異なるメディアタイプのアダプテーションセット内で、より低いビットレートのリプレゼンテーションへの切り替えが可能か否かを判定する。切り替えが可能であると判定された場合、処理はステップＳ６０４に進む。なお選択再生中のアダプテーションセットがビデオ、オーディオ、字幕などと３個以上あり、切り替えが可能なアダプテーションセットが２個以上存在した場合は、選択優先順の低いアダプテーションセット内のリプレゼンテーションから切り替えていく。

　また、ステップＳ６０２において、切り替え可能であると判定された場合、処理はステップＳ６０４に進む。ステップＳ６０４において、スイッチング制御部５８１は、その切り替え可能なリプレゼンテーションの切り替えを行う。ステップＳ６０４の処理が終了すると、処理はステップＳ６０７に進む。

　また、ステップＳ６０３において、切り替えが不可能であると判定された場合、処理はステップＳ６０５に進む。ステップＳ６０５において、スイッチング制御部５８１は、同じメディアタイプでより下位のアダプテーションセットが存在するか否かを判定する。存在すると判定された場合、処理はステップＳ６０６に進む。

　ステップＳ６０６において、スイッチング制御部５８１は、そのアダプテーションセットを切り替え、その中で最も高ビットレートのリプレゼンテーションを選択する。ステップＳ６０６の処理が終了すると、処理はステップＳ６０７に進む。

　ステップＳ６０７において、スイッチング制御部５８１は、切り替え後の状態において、伝送帯域を満たすか否かを判定する。伝送帯域が不足していると判定された場合、処理はステップＳ６０２に戻り、それ以降の処理が繰り返される。

　また、ステップＳ６０７において、伝送帯域を満たすと判定された場合、スイッチング処理が終了し、処理は図４７に戻る。

　また、ステップＳ６０５において、同じメディアタイプでより下位のアダプテーションセットが存在しないと判定された場合、処理はステップＳ６０８に進む。ステップＳ６０８において、スイッチング制御部５８１は、全てのメディアタイプについて処理したか否かを判定する。例えば、ビデオは処理したがオーディオは未処理である等、未処理のメディアタイプが存在すると判定された場合、処理はステップＳ６０９に進む。

　ステップＳ６０９において、スイッチング制御部５８１は、メディアタイプが異なり、選択優先順が次に高いアダプテーションセットを処理対象とする。ステップＳ６０９の処理が終了すると、処理はステップＳ６０２に戻り、それ以降の処理が繰り返される。

　ステップＳ６０８において、全てのメディアタイプについて処理が行われたと判定された場合、スイッチング処理が終了し、処理は図４７に戻る。

　以上のように各処理を実行することにより、再生端末５０３は、本技術を適用した拡張属性を有するMPDファイルに応じてコンテンツファイルを取得することができる。すなわち、再生端末５０３は、そのMPDファイルに応じて、配信側の意図したとおりにスイッチングを行うことができる。つまり、配信側の意図したとおりのコンテンツデータの伝送を実現することができ、コンテンツデータのより安定的な伝送を実現することができる。

　＜４．第３の実施の形態＞
　　＜切り替え優先グループの設定＞
　第２の実施の形態において説明した、アダプテーションセットの優先順に関する情報を階層化するようにしてもよい。例えば、優先順に関する情報として、さらに、第１の管理単位のグループの優先順を示す情報を設定するようにしてもよい。このように優先順に関する情報を階層化することにより、より多様なスイッチングの制御を行うことができるようになり、配信側が意図しないスイッチングが行われることをより抑制することができる。これにより、配信側のより意図したとおりに、コンテンツデータを伝送することができ、コンテンツデータをより安定的に伝送することができる。

　例えば、この優先順に関する情報として、属性@stabilityRankingGroupを設定するようにしてもよい。この属性@stabilityRankingGroupは、スイッチングの観点での、アダプテーションセットのグループ化とそのグループに対する優先度を示す情報である。この属性@stabilityRankingGroupは、「０」または正の整数の値を取ることができる。この属性@stabilityRankingGroupの値が大きいほど、高品質なアダプテーションセットのグループであると配信側が想定していることを表す。

　なお、値「０」は特別な意味を持ち、通常は選択されないが再生継続のために用意された特別なアダプテーションセットであることを表す。この属性@stabilityRankingGroupの値が「０」のアダプテーションセットは、この属性@stabilityRankingGroupの値が「１」のアダプテーションセットのグループに所属する。つまり、属性@stabilityRankingGroupの値が「０」であることは、そのアダプテーションセットが、グループ１の中で特別な意味を持つアダプテーションセットであることを示す。

　また、この属性@stabilityRankingGroupの値が「０」のアダプテーションセットは、上述した属性@stabilityRankingの値によらず、再生開始時と通常再生中には選択されるべきではないコンテンツであることを表す。これに対してこの属性@stabilityRankingGroupの値が「０」以外の値のとき、属性@stabilityRankingの値はグループ内での相対順位であるとみなす。この属性@stabilityRankingGroupが存在しない（設定されていない）場合、アダプテーションセットのグループ化は省略されている。プレーヤは属性@stabilityRankingに従って選択の優先度を決定する。

　　＜属性@stabilityRankingGroupの付与例１＞
　属性@stabilityRankingと属性@stabilityRankingGroupの両方を用いる場合について説明する。

　上述のように、属性@stabilityRankingGroupは、スイッチングの観点からアダプテーションセットの分類と順位付けを行う属性である。例えばビデオやオーディオ等のメディアタイプ（Media Type）毎に、属性@stabilityRankingGroupが同じ値を持つアダプテーションセット（つまり同一グループのアダプテーションセット）の中から、再生に使われるアダプテーションセットが選択されることが、配信側の意図になっている。属性@stabilityRankingGroupの値が大きいほど、選択される優先度が高いアダプテーションセットであることを表す。属性@stabilityRankingGroupが同じ値を持つアダプテーションセットの、そのグループ内での優先順位は属性@stabilityRankingで決まる。

　例えば、各アダプテーションセットの属性@stabilityRankingの値と、属性@stabilityRankingGroupの値とが、図４９のＡに示される表のように設定されるとする。図４９のＡの例の場合、属性@stabilityRankingGroupの値は、「１」乃至「３」の３種類存在する。つまり、各アダプテーションセットは、図４９のＢに示されるように、グループＧ１、グループＧ２、グループＧ３の３つのグループに分けられる。属性@stabilityRankingGroupの値は大きいほど優先度が高いので、この場合、グループＧ３のアダプテーションセットの優先度が最も高く、グループＧ１のアダプテーションセットの優先度が最も低い。

　属性@stabilityRankingは、全てのアダプテーションセットを一列に並べてスイッチングの許容度を順位付けしたものであるが、属性@stabiltyRankingGroupは、そのシーケンシャルな順位に区切りを設定するようなものである。このような属性により、同時に再生されることが適切なアダプテーションセットのセットをプレーヤに伝えることで、より配信側の意図を反映させたスイッチングを実現することができる。

　　＜属性@stabilityRankingGroupの付与例２＞
　属性@stabilityRankingと属性@stabilityRankingGroupの付与の他の例を説明する。例えば、属性@stabilityRankingと属性@stabilityRankingGroupの値を図５０のＡに示される表のように設定するとする。この場合、属性@stabilityRankingGroupの値として「０」と「１」の２値が用いられている。したがって、全てのアダプテーションセットは、図５０のＢに示されるように１つのグループＧ１に属する。ただし、AACのアダプテーションセットと、Still Pictureのアダプテーションセットの属性@stabilityRankingGroupは、値「０」が設定されている。

　このような値の属性@stabilityRankingと属性@stabilityRankingGroupを各アダプテーションセットに設定して、それをスイッチング制御に利用することにより、プレーヤは、図５０のＣの表に示されるような優先順で各データを選択することができる。なお、図５０のＣの表において、括弧内の数字は、そのアダプテーションセットの属性@stabilityRankingの値を示している。

　上述のようにStill Pictureのアダプテーションセットの属性@stabilityRankingGroupの値は「０」であるので、この場合、図５０のＣの表に示されるように、DSD5.6やDSD2.8のオーディオデータが選択されている間は、Still Pictureへの切り替えは行わずに、オーディオデータが切り替えられている。

　　＜属性@stabilityRankingGroupの付与例３＞
　また、例えば、属性@stabilityRankingと属性@stabilityRankingGroupの値を図５１のＡに示される表のように設定するとする。この場合、属性@stabilityRankingGroupの値として「０」、「１」、「２」の３値が用いられている。したがって、アダプテーションセットは、図５１のＢに示されるようにグループＧ１とグループＧ２に分けられる。ただし、Still Pictureのアダプテーションセットの属性@stabilityRankingGroupの値は「０」である。

　このような値の属性@stabilityRankingと属性@stabilityRankingGroupを各アダプテーションセットに設定して、それをスイッチング制御に利用することにより、プレーヤは、図５１のＣの表に示されるような優先順で各データを選択することができる。なお、図５１のＣの表において、括弧内の数字は、そのアダプテーションセットの属性@stabilityRankingの値を示している。

　この場合、図５１のＣに示されるように、グループＧ２に属するアダプテーションセットが優先的に選択される。

　　＜属性@stabilityRankingGroupの付与例４＞
　また、例えば、属性@stabilityRankingと属性@stabilityRankingGroupの値を図５２のＡに示される表のように設定するとする。この場合、属性@stabilityRankingGroupの値として「１」、「２」、「３」の３値が用いられている。したがって、アダプテーションセットは、図５２のＢに示されるようにグループＧ１、グループＧ２、グループＧ３に分けられる。この場合、図５２のＣに示されるように、グループＧ３に属するアダプテーションセットが優先的に選択される。

　　＜属性@stabilityRankingGroupの付与例５＞
　また、例えば、図３９のＡに示されるようなピリオド構成を有するMPDの各アダプテーションセットに対して、属性@stabilityRankingと属性@stabilityRankingGroupの値を図５３のＡに示される表のように設定するとする。この場合、属性@stabilityRankingGroupの値として「０」と「１」の２値が用いられている。

　このような値の属性@stabilityRankingと属性@stabilityRankingGroupを各アダプテーションセットに設定して、それをスイッチング制御に利用することにより、プレーヤは、図５３のＢの表に示されるような優先順で各データを選択することができる。なお、図５３のＢの表において、括弧内の数字は、そのアダプテーションセットの属性@stabilityRankingの値を示している。

　図５３の例の場合、オーディオデータはAACのアダプテーションセットの属性@stabilityRankingGroupの値が「０」に設定され、ビデオデータはStill Pictureのアダプテーションセットの属性@stabilityRankingGroupの値が「０」に設定されている。このように、ビデオやオーディオ等のメディアタイプ毎に最終避難的なアダプテーションセット（なるべく選択するべきではない、フェイルセーフ的なアダプテーションセット）を明示しておくことで、例えばDSD5.6＋Still Pictureといった音と映像の品質の差が大きすぎて配信側にとって望ましくない組み合わせを選択することを抑制することができ、よりバランスのとれたスイッチングを実現することができる。

　もちろん、上述した属性@stabilityRankingと属性@stabilityRankingGroupの値は、例を示したものであり、属性@stabilityRankingと属性@stabilityRankingGroupの値はこれらの例に限定されない。

　　＜ファイル生成装置＞
　この場合のファイル生成装置５０１の主な構成例を図５４に示す。この場合も、ファイル生成装置５０１は、第２の実施の形態（図４３）の場合と基本的に同様の構成を有する。ただし、この場合、MPD生成部５１３は、グループ情報設定部９０１をさらに有する。

　グループ情報設定部９０１は、グループ情報の設定に関する処理を行う。このグループ情報は、選択優先順に関するアダプテーションセットをグループ化したり、グループの優先順を示したりする情報であり、例えば、本技術を適用した拡張属性@stabilityRankingGroup等を含む。

　　＜MPDファイル生成処理の流れ＞
　この場合も配信用データ生成処理は、第１の実施の形態（図３２）の場合と同様に実行される。図５５のフローチャートを参照して、この場合のMPDファイル生成処理の流れの例を説明する。

　この場合も、ステップＳ６２１乃至ステップＳ６２４の各処理は、図３３のステップＳ５１１乃至ステップＳ５１４の各処理と同様に実行される。

　ステップＳ６２５において、グループ情報設定部９０１は、同時に再生されることが許可されるアダプテーションセットの組を決定し、アダプテーションセットのグループを設定する。この処理により、例えば、図５６のＡに示されるように、各アダプテーションセットが２つのグループに分類される。

　ステップＳ６２６において、グループ情報設定部９０１は、各グループ間の選択優先順を決定し、グループ情報を設定する再生を継続するための最低限のストリームがある場合、グループ情報の値を「０」に設定する。この処理により、例えば、図５６のＢに示されるように、各グループに「Ｇ１」、「Ｇ２」といった選択優先順が付与される。また、例えば、Still Pictureのアダプテーションセットの属性@stabilityRankingGroupの値が「０」に設定される。

　ステップＳ６２７において、グループ情報設定部９０１は、グループ内における各アダプテーションセットの選択優先順を決定する。この処理により、例えば、図５６のＣに示されるように、各グループ内において、各アダプテーションセットの選択優先順が設定される。図５６のＣにおいて括弧内の数字が、各アダプテーションセットに割り当てられたグループ内の優先順を示している。

　ステップＳ６２８において、選択優先順情報設定部７０１は、全体における各アダプテーションセットの選択優先順を決定し、選択優先順情報を設定する。この処理により、例えば、図５６のＤに示されるように、各アダプテーションセットの選択優先順が設定される。図５６のＤにおいて括弧内の数字が、各アダプテーションセットに割り当てられた選択優先順を示している。

　ステップＳ６２９において、ファイル生成部５２７は、ステップＳ６２１乃至ステップＳ６２８において行われた各種設定を反映したMPDファイルを生成する。MPDファイルが生成されると、MPDファイル生成処理が終了し、処理は図３２に戻る。

　以上のように各処理を実行することにより、ファイル生成装置５０１は、本技術を適用した拡張属性を有するMPDファイルを生成することができる。すなわち、ファイル生成装置５０１は、本技術を適用した選択優先順に関する情報やグループに関する情報を設定することができる。これにより、より配信側の意図に沿った、よりバランスのとれたスイッチングを実現することができる。

　　＜再生端末＞
　この場合の再生端末５０３の主な構成例を図５７に示す。この場合も、再生端末５０３は、第２の実施の形態（図４５）の場合と基本的に同様の構成を有する。ただし、この場合、パース部５５２は、グループ情報解析部９１１をさらに有する。グループ情報解析部９１１は、グループ情報の解析に関する処理を行う。

　例えば、コンテンツファイル取得部５５３のスイッチング制御部５８１は、グループ情報解析部９１１の解析結果に基づいて（グループ情報解析部９１１の解析結果が反映された制御情報に基づいて）このスイッチングの制御を行う。

　　＜パース処理の流れ＞
　この場合も再生処理は、第１の実施の形態（図３５）の場合と同様に実行される。図５８のフローチャートを参照して、この場合のパース処理の流れの例を説明する。

　パース処理が開始されると、パース部５５２は、ステップＳ６４１においてMPDファイルを解析する。ステップＳ６４２において、選択優先順情報解析部７１１は、MPDファイルに含まれる選択優先順情報を解析する。ステップＳ６４３において、グループ情報解析部９１１は、MPDファイルに含まれるグループ情報を解析する。

　ステップＳ６４３の処理が終了するとパース処理が終了し、処理は図３５に戻る。以上のようにパース部５５２は、MPDファイルを解析し、さらに、本技術を適用した拡張属性（@stabilityRankingや@stabilityRankingGroup等）を解析することができる。

　　＜コンテンツファイル取得処理の流れ＞
　次に、図５９のフローチャートを参照して、この場合のコンテンツファイル取得処理の流れの例を説明する。この場合も、ステップＳ６５１乃至ステップＳ６５３の各処理は、図４７のステップＳ５９１乃至ステップＳ５９３の各処理と同様に実行される。

　ステップＳ６５４において、スイッチング制御部５８１は、スイッチング処理を実行し、選択優先順情報やグループ情報に基づいて取得するコンテンツファイル（MP4ファイル）を切り替える。ステップＳ６５４の処理が終了すると処理はステップＳ６５５に進む。

　ステップＳ６５５の処理は、図４７のステップＳ５９５の処理と同様に実行される。つまり、ステップＳ６５５において所望のコンテンツに関するMP4ファイルの取得が終了したと判定された場合、コンテンツファイル取得処理が終了する。

　　＜スイッチング処理の流れ＞
　次に、図５９のステップＳ６５４において実行されるスイッチング処理の流れの例を、図６０のフローチャートを参照して説明する。

　スイッチング処理が開始されると、スイッチング制御部５８１は、ステップＳ６６１において、グループ内で選択優先順が最下位のアダプテーションセットを処理対象とする。

　ステップＳ６６２において、スイッチング制御部５８１は、より低ビットレートのリプレゼンテーションへの切り替えが可能であるか否かを判定する。切り替えが不可能であると判定された場合、処理はステップＳ６６３に進む。

　ステップＳ６６３において、スイッチング制御部５８１は、グループ内かつメディアタイプが異なるアダプテーションセット内で、より低いビットレートのリプレゼンテーションへの切り替えが可能か否かを判定する。切り替えが可能であると判定された場合、処理はステップＳ６６４に進む。なおグループ内の選択再生中のアダプテーションセットがビデオ、オーディオ、字幕などと３個以上あり、切り替えが可能なアダプテーションセットが２個以上存在した場合は、選択優先順の低いアダプテーションセット内のリプレゼンテーションから切り替えていく。

　また、ステップＳ６６２において、切り替えが可能であると判定された場合、処理はステップＳ６６４に進む。ステップＳ６６４において、スイッチング制御部５８１は、その切り替え可能なリプレゼンテーションの切り替えを行う。ステップＳ６６４の処理が終了すると、処理はステップＳ６６７に進む。

　また、ステップＳ６６３において、切り替えが不可能と判定された場合、処理はステップＳ６６５に進む。ステップＳ６６５において、スイッチング制御部５８１は、グループ内かつ同じメディアタイプでより下位のアダプテーションセットが存在するか否かを判定する。存在すると判定された場合、処理はステップＳ６６６に進む。

　ステップＳ６６６において、スイッチング制御部５８１は、そのアダプテーションセットを切り替え、その中で最も高ビットレートのリプレゼンテーションを選択する。ステップＳ６６６の処理が終了すると、処理はステップＳ６６７に進む。

　ステップＳ６６７において、スイッチング制御部５８１は、切り替え後の状態において、伝送帯域を満たすか否かを判定する。伝送帯域が不足していると判定された場合、処理はステップＳ６６２に戻り、それ以降の処理が繰り返される。

　また、ステップＳ６６７において、伝送帯域を満たすと判定された場合、スイッチング処理が終了し、処理は図５９に戻る。

　また、ステップＳ６６５において、同じメディアタイプでより下位のアダプテーションセットが存在しないと判定された場合、処理はステップＳ６６８に進む。ステップＳ６６８において、スイッチング制御部５８１は、グループ内の全てのメディアタイプについて処理したか否かを判定する。例えば、ビデオは処理したがオーディオは未処理である等、未処理のメディアタイプが存在すると判定された場合、処理はステップＳ６６９に進む。

　ステップＳ６６９において、スイッチング制御部５８１は、同一グループの、メディアタイプが異なり、選択優先順が次に高いアダプテーションセットを処理対象とする。ステップＳ６６９の処理が終了すると、処理はステップＳ６６２に戻り、それ以降の処理が繰り返される。

　ステップＳ６６８において、全てのメディアタイプについて処理が行われたと判定された場合、処理は、ステップＳ６７０に進む。ステップＳ６７０において、スイッチング制御部５８１は、より下位のグループが存在するか否かを判定する。存在すると判定された場合、処理はステップＳ６７１に進む。

　ステップＳ６７１において、スイッチング制御部５８１は、グループを切り替える。そしてメディアタイプごとに、最上位のアダプテーションセットを選択する。さらに各アダプテーションセットの中で、最も高ビットレートのリプレゼンテーションを選択する。

　ステップＳ６７２において、スイッチング制御部５８１は、切り替え後の状態において、伝送帯域を満たすか否かを判定する。伝送帯域が不足していると判定された場合、処理はステップＳ６６１に戻り、それ以降の処理が繰り返される。

　ステップＳ６７０において、より下位のグループが存在しないと判定された場合、スイッチング処理が終了し、処理は図５９に戻る。また、ステップＳ６７２において、伝送帯域を満たすと判定された場合、スイッチング処理が終了し、処理は図５９に戻る。

　以上のように各処理を実行することにより、再生端末５０３は、本技術を適用した拡張属性を有するMPDファイルに応じてコンテンツファイルを取得することができる。すなわち、再生端末５０３は、そのMPDファイルに応じて、より配信側の意図に沿った、よりバランスのとれたスイッチングを実現することができる。

　＜５．その他＞
　　＜規格＞
　以上においては、DSDロスレスストリームをMP4ファイルに格納し、MPEG-DASHを利用して配信する場合について説明したが、本技術はこれ以外の例にも適用することができる。例えば、本技術は、DSDロスレスストリーム以外の任意のデータにも適用することができる。また、本技術は、MP4ファイル以外の任意のファイルフォーマットに格納する場合にも適用することができる。さらに、本技術は、MPEG-DASH以外の任意の規格のデータ配信にも適用することができる。

　　＜本技術の適用分野＞
　本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。

　例えば、本技術は、鑑賞の用に供される画像を伝送するシステムやデバイスにも適用することができる。また、例えば、本技術は、交通の用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、セキュリティの用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、スポーツの用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、農業の用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、畜産業の用に供されるシステムやデバイスにも適用することができる。さらに、本技術は、例えば火山、森林、海洋等の自然の状態を監視するシステムやデバイスにも適用することができる。また、本技術は、例えば天気、気温、湿度、風速、日照時間等を観測する気象観測システムや気象観測装置に適用することができる。さらに、本技術は、例えば鳥類、魚類、ハ虫類、両生類、哺乳類、昆虫、植物等の野生生物の生態を観測するシステムやデバイス等にも適用することができる。

　　＜コンピュータ＞
　上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

　図６１は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　図６１に示されるコンピュータ１０００において、CPU（Central Processing Unit）１００１、ROM（Read Only Memory）１００２、RAM（Random Access Memory）１００３は、バス１００４を介して相互に接続されている。

　バス１００４にはまた、入出力インタフェース１０１０も接続されている。入出力インタフェース１０１０には、入力部１０１１、出力部１０１２、記憶部１０１３、通信部１０１４、およびドライブ１０１５が接続されている。

　入力部１０１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部１０１２は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部１０１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部１０１４は、例えば、ネットワークインタフェースよりなる。ドライブ１０１５は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア１０２１を駆動する。

　以上のように構成されるコンピュータ１０００では、CPU１００１が、例えば、記憶部１０１３に記憶されているプログラムを、入出力インタフェース１０１０およびバス１００４を介して、RAM１００３にロードして実行することにより、上述した一連の処理が行われる。RAM１００３にはまた、CPU１００１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　コンピュータ１０００が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア１０２１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア１０２１をドライブ１０１５に装着することにより、入出力インタフェース１０１０を介して、記憶部１０１３にインストールすることができる。

　また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部１０１４で受信し、記憶部１０１３にインストールすることができる。

　その他、このプログラムは、ROM１００２や記憶部１０１３等に、あらかじめインストールしておくこともできる。

　　＜その他＞
　なお、符号化データ（ビットストリーム）に関する各種情報は、符号化データに多重化されて伝送され又は記録されるようにしてもよいし、符号化データに多重化されることなく、符号化データと関連付けられた別個のデータとして伝送され又は記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る（リンクさせ得る）ようにすることを意味する。つまり、互いに関連付けられたデータは、１つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ（画像）に関連付けられた情報は、その符号化データ（画像）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。

　また、上述したように、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　また、例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

　また、例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、例えば、上述したプログラムは、任意の装置において実行することができる。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

　また、例えば、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　なお、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

　なお、本明細書において複数説明した本技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術を、他の実施の形態において説明した本技術と組み合わせて実施することもできる。また、上述した任意の本技術を、上述していない他の技術と併用して実施することもできる。

　なお、本技術は以下のような構成も取ることができる。
　（１）　コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を設定する設定部
　を備える情報処理装置。
　（２）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）である
　（１）に記載の情報処理装置。
　（３）　前記切り替えに関する情報は、再生するデータの前記第１の管理単位を越える切り替えの、切り替え先に関する情報である
　（１）または（２）に記載の情報処理装置。
　（４）　前記切り替え先に関する情報はContentSwitchingDestinationIdである
　（１）乃至（３）のいずれかに記載の情報処理装置。
　（５）　前記切り替え先に関する情報は、前記切り替え先として許可する管理単位を指定する情報である
　（１）乃至（４）のいずれかに記載の情報処理装置。
　（６）　前記管理単位を指定する情報は、前記切り替え先として許可する他の前記第１の管理単位を指定する情報である
　（１）乃至（５）のいずれかに記載の情報処理装置。
　（７）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）である
　（１）乃至（６）のいずれかに記載の情報処理装置。
　（８）　前記管理単位を指定する情報は、前記切り替え先として許可する、他の前記第１の管理単位内の各データを管理する第２の管理単位を指定する情報である
　（１）乃至（７）のいずれかに記載の情報処理装置。
　（９）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）であり、
　前記第２の管理単位は、リプレゼンテーション（Representation）である
　（１）乃至（８）のいずれかに記載の情報処理装置。
　（１０）　前記設定部は、前記切り替え先に関する情報を、前記管理情報の前記第１の管理単位に設定する
　（１）乃至（９）のいずれかに記載の情報処理装置。
　（１１）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）であり、
　前記設定部は、前記切り替え先に関する情報を、現在の再生対象のデータを管理するアダプテーションセットに設定するように構成される
　（１）乃至（１０）のいずれかに記載の情報処理装置。
　（１２）　前記設定部は、前記切り替え先に関する情報を、前記管理情報の前記第１の管理単位内の各データを管理する第２の管理単位に設定する
　（１）乃至（１１）のいずれかに記載の情報処理装置。
　（１３）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）であり、
　前記第２の管理単位は、リプレゼンテーション（Representation）であり、
　前記設定部は、前記切り替え先に関する情報を、現在の再生対象のデータを管理するリプレゼンテーションに設定するように構成される
　（１）乃至（１２）のいずれかに記載の情報処理装置。
　（１４）　前記切り替えに関する情報は、再生するデータの前記第１の管理単位を越える切り替えのタイミングに関する情報である
　（１）乃至（１３）のいずれかに記載の情報処理装置。
　（１５）　前記タイミングに関する情報は、再生するデータの前記第１の管理単位を越える切り替えを許可するタイミングを指定する情報である
　（１）乃至（１４）のいずれかに記載の情報処理装置。
　（１６）　前記タイミングは、前記データの再生時間方向の管理単位である第２の管理単位の境界であり、
　前記タイミングを指定する情報は、再生するデータの前記第１の管理単位を越える切り替えを許可する前記第２の管理単位の境界を指定する情報である
　（１）乃至（１５）のいずれかに記載の情報処理装置。
　（１７）　前記タイミングを指定する情報は、前記タイミングを、次のタイミングまでの前記第２の管理単位の数で指定する情報である
　（１）乃至（１６）のいずれかに記載の情報処理装置。
　（１８）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）であり、
　前記第２の管理単位は、セグメント（Segment）である
　（１）乃至（１７）のいずれかに記載の情報処理装置。
　（１９）　前記タイミングにおいて、切り替え元のデータと切り替え先のデータとの間で再生時刻が一致している
　（１）乃至（１８）のいずれかに記載の情報処理装置。
　（２０）　前記タイミングに関する情報は、ContentSwitchingAlignmentCycleである
　（１）乃至（１９）のいずれかに記載の情報処理装置。
　（２１）　前記設定部は、前記タイミングに関する情報を、前記管理情報の前記第１の管理単位に設定する
　（１）乃至（２０）のいずれかに記載の情報処理装置。
　（２２）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）であり、
　前記設定部は、前記タイミングに関する情報を、現在の再生対象のデータを管理するアダプテーションセットに設定するように構成される
　（１）乃至（２１）のいずれかに記載の情報処理装置。
　（２３）　前記設定部は、前記タイミングに関する情報を、前記管理情報の前記第１の管理単位内の各データを管理する第２の管理単位に設定する
　（１）乃至（２２）のいずれかに記載の情報処理装置。
　（２４）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）であり、
　前記第２の管理単位は、リプレゼンテーション（Representation）であり、
　前記設定部は、前記タイミングに関する情報を、現在の再生対象のデータを管理するリプレゼンテーションに設定するように構成される
　（１）乃至（２３）のいずれかに記載の情報処理装置。
　（２５）　前記切り替えに関する情報は、再生するデータの前記第１の管理単位を越える切り替えの、優先順に関する情報である
　（１）乃至（２４）のいずれかに記載の情報処理装置。
　（２６）　前記優先順に関する情報は、前記第１の管理単位の優先順を示す情報である
　（１）乃至（２５）のいずれかに記載の情報処理装置。
　（２７）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）である
　（１）乃至（２６）のいずれかに記載の情報処理装置。
　（２８）　前記優先順に関する情報は、@stabilityRankingである
　（１）乃至（２７）のいずれかに記載の情報処理装置。
　（２９）　前記優先順に関する情報は、前記第１の管理単位のグループの優先順を示す情報である
　（１）乃至（２８）のいずれかに記載の情報処理装置。
　（３０）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）である
　（１）乃至（２９）のいずれかに記載の情報処理装置。
　（３１）　前記優先順に関する情報は、@stabilityRankingGroupである
　（１）乃至（３０）のいずれかに記載の情報処理装置。
　（３２）　前記設定部は、前記優先順に関する情報を前記第１の管理単位に設定する
　（１）乃至（３１）のいずれかに記載の情報処理装置。
　（３３）　前記管理情報は、MPD（Media Presentation Description）であり、
　前記第１の管理単位は、アダプテーションセット（Adaptation Set）である
　（１）乃至（３２）のいずれかに記載の情報処理装置。
　（３４）　前記データは、オーディオアナログ信号がΔΣ変調されたDSD（Direct Stream Digital）データが可逆符号化されて得られたDSDロスレスストリームを格納する、ISO/IEC14496に準拠したファイルフォーマットのファイルである
　（１）乃至（３３）のいずれかに記載の情報処理装置。
　（３５）　前記設定部の設定に基づいて前記管理情報のファイルを生成するファイル生成部をさらに備える
　（１）乃至（３４）のいずれかに記載の情報処理装置。
　（３６）　前記データを生成するデータ生成部をさらに備え、
　前記ファイル生成部は、前記データ生成部により生成されたデータの前記管理情報のファイルを生成するように構成される
　（１）乃至（３５）のいずれかに記載の情報処理装置。
　（３７）　前記ファイル生成部により生成された前記ファイルを、サーバに送信する送信部をさらに備える
　（１）乃至（３６）のいずれかに記載の情報処理装置。
　（３８）　コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を設定する
　情報処理方法。
　（３９）　コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を解析する解析部と、
　前記解析部の解析結果に基づいて、再生するデータの切り替えを制御する制御部と
　を備える情報処理装置。
　（４０）　コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を解析し、
　その解析結果に基づいて、再生するデータの切り替えを制御する
　情報処理方法。

　５００　配信システム，　５０１　ファイル生成装置，　５０２　配信サーバ，　５０３　再生端末，　５０４　ネットワーク，　５１１　オーディオストリーム生成部，　５１２　コンテンツファイル生成部，　５１３　MPD生成部，　５１４　通信部，　５２１　ピリオド設定部，　５２２　アダプテーションセット設定部，　５２３　リプレゼンテーション設定部，　５２４　セグメント設定部，　５２５　スイッチング先指定情報設定部，　５２６　タイミング指定情報設定部，　５２７　ファイル生成部，　５５１　MPD取得部，　５５２　パース部，　５５３　コンテンツファイル取得部，　５５４　ストリーム抽出部，　５５５　復号部，　５５６　出力部，　５６１　外部デコーダ，　５７１　スイッチング先指定情報解析部，　５７２　タイミング指定情報解析部，　５８１　スイッチング制御部，　７０１　選択優先順情報設定部，　７１１　選択優先順情報解析部，　９０１　グループ情報設定部，　９１１　グループ情報解析部，　１０００　コンピュータ

Claims

　コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を設定する設定部
　を備える情報処理装置。
　前記切り替えに関する情報は、再生するデータの前記第１の管理単位を越える切り替えの、切り替え先として許可する管理単位を指定する情報である
　請求項１に記載の情報処理装置。
　前記管理単位を指定する情報は、前記切り替え先として許可する、他の前記第１の管理単位を指定する情報、または、他の前記第１の管理単位内の各データを管理する第２の管理単位を指定する情報である
　請求項２に記載の情報処理装置。
　前記設定部は、前記管理単位を指定する情報を、前記管理情報の前記第１の管理単位、または、前記管理情報の前記第１の管理単位内の各データを管理する第２の管理単位に設定する
　請求項２に記載の情報処理装置。
　前記切り替えに関する情報は、再生するデータの前記第１の管理単位を越える切り替えを許可するタイミングを指定する情報である
　請求項１に記載の情報処理装置。
　前記タイミングは、前記データの再生時間方向の管理単位である第２の管理単位の境界であり、
　前記タイミングを指定する情報は、再生するデータの前記第１の管理単位を越える切り替えを許可する前記第２の管理単位の境界を指定する情報である
　請求項５に記載の情報処理装置。
　前記タイミングを指定する情報は、前記タイミングを、次のタイミングまでの前記第２の管理単位の数で指定する情報である
　請求項６に記載の情報処理装置。
　前記タイミングにおいて、切り替え元のデータと切り替え先のデータとの間で再生時刻が一致している
　請求項５に記載の情報処理装置。
　前記設定部は、前記タイミングを指定する情報を、前記管理情報の前記第１の管理単位、または、前記管理情報の前記第１の管理単位内の各データを管理する第２の管理単位に設定する
　請求項５に記載の情報処理装置。
　前記切り替えに関する情報は、再生するデータの前記第１の管理単位を越える切り替えの、優先順に関する情報である
　請求項１に記載の情報処理装置。
　前記優先順に関する情報は、前記第１の管理単位の優先順を示す情報である
　請求項１０に記載の情報処理装置。
　前記優先順に関する情報は、前記第１の管理単位のグループの優先順を示す情報である
　請求項１０に記載の情報処理装置。
　前記設定部は、前記優先順に関する情報を前記第１の管理単位に設定する
　請求項１０に記載の情報処理装置。
　前記データは、オーディオアナログ信号がΔΣ変調されたDSD（Direct Stream Digital）データが可逆符号化されて得られたDSDロスレスストリームを格納する、ISO/IEC14496に準拠したファイルフォーマットのファイルである
　請求項１に記載の情報処理装置。
　前記設定部の設定に基づいて前記管理情報のファイルを生成するファイル生成部をさらに備える
　請求項１に記載の情報処理装置。
　前記データを生成するデータ生成部をさらに備え、
　前記ファイル生成部は、前記データ生成部により生成されたデータの前記管理情報のファイルを生成するように構成される
　請求項１５に記載の情報処理装置。
　前記ファイル生成部により生成された前記ファイルを、サーバに送信する送信部をさらに備える
　請求項１５に記載の情報処理装置。
　コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を設定する
　情報処理方法。
　コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を解析する解析部と、
　前記解析部の解析結果に基づいて、再生するデータの切り替えを制御する制御部と
　を備える情報処理装置。
　コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第１の管理単位を越える切り替えに関する情報を解析し、
　その解析結果に基づいて、再生するデータの切り替えを制御する
　情報処理方法。