WO2017169891A1 - 情報処理装置および方法 - Google Patents

情報処理装置および方法 Download PDF

Info

Publication number
WO2017169891A1
WO2017169891A1 PCT/JP2017/010872 JP2017010872W WO2017169891A1 WO 2017169891 A1 WO2017169891 A1 WO 2017169891A1 JP 2017010872 W JP2017010872 W JP 2017010872W WO 2017169891 A1 WO2017169891 A1 WO 2017169891A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
information
switching
unit
management unit
Prior art date
Application number
PCT/JP2017/010872
Other languages
English (en)
French (fr)
Inventor
俊也 浜田
充 勝股
平林 光浩
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to JP2018509040A priority Critical patent/JPWO2017169891A1/ja
Priority to US16/088,357 priority patent/US20200314163A1/en
Priority to CN201780019432.9A priority patent/CN109155867A/zh
Publication of WO2017169891A1 publication Critical patent/WO2017169891A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/762Media network packet handling at the source 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本開示は、コンテンツデータをより安定的に伝送することができるようにする情報処理装置および方法に関する。 コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を設定するようにする。本開示は、例えば、情報処理装置、ファイル生成装置、配信サーバ、または再生端末等に適用することができる。

Description

情報処理装置および方法
 本開示は、情報処理装置および方法に関し、特に、コンテンツデータをより安定的に伝送することができるようにした情報処理装置および方法に関する。
 従来、映像や音楽のデータを、インターネットを介したストリーミング配信するために、MPEG-DASH(Moving Picture Experts Group phase - Dynamic Adaptive Streaming over HTTP)が開発された(例えば、非特許文献1参照)。さらに、高品位な映像と音楽をユーザに送る手段として、ISO/IEC14496-12で規定されたISO(International Organization for Standardization) Base Media File Format(ISOBMFF)形式のファイルを使い、MPEG-DASHでストリーミング配信することが考えられた。映像や音楽のデータは高品質化が進み、それとともに、配信においてもより高品質なデータの配信が求められている。
 例えば、音楽の高品位符号化についてはDSD(Direct Stream Digital)が高品質な符号化方式として知られている。DSDデータは高レートであるため、ロスレスで圧縮する方式(DSD可逆圧縮方式)が考えられた。近年、より負荷の小さい新たなDSD可逆圧縮符号化方式も考えられた。
MPEG-DASH(Dynamic Adaptive Streaming over HTTP)(URL:http://mpeg.chiariglione.org/standards/mpeg-dash/media-presentation-description-and-segment-formats/text-isoiec-23009-12012-dam-1)
 このように高品位なデータの配信が行われるようになっても、伝送帯域や互換性の観点から、従来の低品位なデータの配信も併用することが求められている。つまり、符号化方式が異なるデータ間でのスイッチング(配信データの切り替え)を行うことが求められる。
 しかしながら、MPEG-DASHのMPD(Media Presentation Description)においては、符号化方式が異なるデータは異なるアダプテーションセット(Adaptation Set)で管理される。そして、従来のMPEG-DASH規格においては、このアダプテーションセットを越えたスイッチングは考慮されておらず、このようなスイッチングを実現することは困難であった。そのため、より高品位のコンテンツデータの配信を安定的に行うことが困難であった。
 本開示は、このような状況に鑑みてなされたものであり、コンテンツデータをより安定的に伝送することができるようにするものである。
 本技術の一側面の情報処理装置は、コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を設定する設定部を備える情報処理装置である。
 前記切り替えに関する情報は、再生するデータの前記第1の管理単位を越える切り替えの、切り替え先として許可する管理単位を指定する情報であるようにすることができる。
 前記管理単位を指定する情報は、前記切り替え先として許可する、他の前記第1の管理単位を指定する情報、または、他の前記第1の管理単位内の各データを管理する第2の管理単位を指定する情報であるようにすることができる。
 前記設定部は、前記管理単位を指定する情報を、前記管理情報の前記第1の管理単位、または、前記管理情報の前記第1の管理単位内の各データを管理する第2の管理単位に設定することができる。
 前記切り替えに関する情報は、再生するデータの前記第1の管理単位を越える切り替えを許可するタイミングを指定する情報であるようにすることができる。
 前記タイミングは、前記データの再生時間方向の管理単位である第2の管理単位の境界であり、前記タイミングを指定する情報は、再生するデータの前記第1の管理単位を越える切り替えを許可する前記第2の管理単位の境界を指定する情報であるようにすることができる。
 前記タイミングを指定する情報は、前記タイミングを、次のタイミングまでの前記第2の管理単位の数で指定する情報であるようにすることができる。
 前記タイミングにおいて、切り替え元のデータと切り替え先のデータとの間で再生時刻が一致しているようにすることができる。
 前記設定部は、前記タイミングを指定する情報を、前記管理情報の前記第1の管理単位、または、前記管理情報の前記第1の管理単位内の各データを管理する第2の管理単位に設定することができる。
 前記切り替えに関する情報は、再生するデータの前記第1の管理単位を越える切り替えの、優先順に関する情報であるようにすることができる。
 前記優先順に関する情報は、前記第1の管理単位の優先順を示す情報であるようにすることができる。
 前記優先順に関する情報は、前記第1の管理単位のグループの優先順を示す情報であるようにすることができる。
 前記設定部は、前記優先順に関する情報を前記第1の管理単位に設定することができる。
 前記データは、オーディオアナログ信号がΔΣ変調されたDSD(Direct Stream Digital)データが可逆符号化されて得られたDSDロスレスストリームを格納する、ISO/IEC14496に準拠したファイルフォーマットのファイルであるようにすることができる。
 前記設定部の設定に基づいて前記管理情報のファイルを生成するファイル生成部をさらに備えるようにすることができる。
 前記データを生成するデータ生成部をさらに備え、前記ファイル生成部は、前記データ生成部により生成されたデータの前記管理情報のファイルを生成するように構成されるようにすることができる。
 前記ファイル生成部により生成された前記ファイルを、サーバに送信する送信部をさらに備えるようにすることができる。
 本技術の一側面の情報処理方法は、コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を設定する情報処理方法である。
 本技術の他の側面の情報処理装置は、コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を解析する解析部と、前記解析部の解析結果に基づいて、再生するデータの切り替えを制御する制御部とを備える情報処理装置である。
 本技術の他の側面の情報処理方法は、コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を解析し、その解析結果に基づいて、再生するデータの切り替えを制御する情報処理方法である。
 本技術の一側面の情報処理装置および方法においては、コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報が設定される。
 本技術の他の側面の情報処理装置および方法においては、コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報が解析され、その解析結果に基づいて、再生するデータの切り替えが制御される。
 本開示によれば、情報を処理することができる。特に、コンテンツデータをより安定的に伝送することができる。
MPEG-DASHを用いたデータ伝送の様子の例を説明する図である。 MPDの構成例を示す図である。 コンテンツの時間的区切りを説明する図である。 MPDにおけるPeriod以下の階層構造の例を示す図である。 MPDファイルの構成例を時間軸上で説明する図である。 DSD方式を説明する図である。 ストリーミング配信のビットレート変動の様子の例を説明する図である。 圧縮符号化装置の主な構成例を示すブロック図である。 データ発生カウントテーブルpretableの作成方法を説明する図である。 変換テーブルtable1を説明する図である。 エンコード部の構成例を示すブロック図である。 圧縮符号化処理を説明するフローチャートである。 復号装置の主な構成例を示ブロック図である。 復号処理を説明するフローチャートである。 DSDロスレスストリームの主な構成例を示す図である。 DSDロスレスストリームのシンタクスの例を示す図である。 MPDの構成例を示す図である。 MPDの構成例を示す図である。 @ContentSwitchingAlignmentCycleについて説明する図である。 MPDの構成例を示す図である。 MPDの記述例を示す図である。 MPDの記述例を示す図である。 MPDの構成例を示す図である。 MPDの記述例を示す図である。 MPDの構成例を示す図である。 MPDの記述例を示す図である。 MPDの記述例を示す図である。 MPDの構成例を示す図である。 MPDの記述例を示す図である。 配信システムの主な構成例を示すブロック図である。 ファイル生成装置の主な構成例を示すブロック図である。 配信用データ生成処理の流れの例を説明するフローチャートである。 MPDファイル生成処理の流れの例を説明するフローチャートである。 再生端末の主な構成例を示すブロック図である。 再生処理の流れの例を説明するフローチャートである。 パース処理の流れの例を説明するフローチャートである。 コンテンツファイル取得処理の流れの例を説明するフローチャートである。 スイッチングの制限の例を示す図である。 @stabilityRankingの例を示す図である。 @stabilityRankingを用いたスイッチングの制御例を示す図である。 MPDの記述例を示す図である。 @stabilityRankingを用いたスイッチングの制御例を示す図である。 ファイル生成装置の主な構成例を示すブロック図である。 MPDファイル生成処理の流れの例を説明するフローチャートである。 再生端末の主な構成例を示すブロック図である。 パース処理の流れの例を説明するフローチャートである。 コンテンツファイル取得処理の流れの例を説明するフローチャートである。 スイッチング処理の流れの例を説明するフローチャートである。 @stabilityRankingと@stabilityRankingGroupの例を示す図である。 @stabilityRankingと@stabilityRankingGroupとを用いたスイッチングの制御例を示す図である。 @stabilityRankingと@stabilityRankingGroupとを用いたスイッチングの制御例を示す図である。 @stabilityRankingと@stabilityRankingGroupとを用いたスイッチングの制御例を示す図である。 @stabilityRankingと@stabilityRankingGroupとを用いたスイッチングの制御例を示す図である。 ファイル生成装置の主な構成例を示すブロック図である。 MPDファイル生成処理の流れの例を説明するフローチャートである。 グループ化と優先順付加の様子の例を説明する図である。 再生端末の主な構成例を示すブロック図である。 パース処理の流れの例を説明するフローチャートである。 コンテンツファイル取得処理の流れの例を説明するフローチャートである。 スイッチング処理の流れの例を説明するフローチャートである。 コンピュータの主な構成例を示すブロック図である。
 以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
 1.アダプテーションセットを越えたスイッチング
 2.第1の実施の形態(配信システム:スイッチング先指定情報とタイミング指定情報)
 3.第2の実施の形態(配信システム:選択優先順情報)
 4.第3の実施の形態(配信システム:グループ情報)
 5.その他
 <1.アダプテーションセットを越えたスイッチング>
  <映像や音声の配信>
 近年、映像と音楽を消費者に届ける手段として、インターネットを介したストリーミング配信が期待されている。しかしながら、伝送手段としてのインターネットは、放送や光ディスクと比べて伝送が不安定である。まずユーザの環境によって伝送帯域の最高レートが大きく変わる。さらに同一ユーザであっても常に一定の伝送帯域が確保されていることはなく、時間の経過で変動する。また伝送帯域が変動するということは、クライアントからの要求に対する応答時間が一定ではないということでもある。
 このようなインターネットを介した伝送のための規格として、MPEG-DASH(Moving Picture Experts Group - Dynamic Adaptive Streaming over HTTP)が開発されている。サーバ側にデータサイズが異なる複数のファイルを置いておき、クライアントがMPD(Media Presentation Description)を参照して最適なファイルを選択するというプル型のモデルである。特殊なプロトコルを使わずhttpを用いることで、一般的なHTTP(HyperText Transfer Protocol)サーバが利用できる。ファイル形式は、MPEG-TS(Moving Picture Experts Group - Transport Stream)だけでなく、ISOBMFF(International Organization for Standardization Base Media File Format)形式のファイルが使われている。
  <MPEG-DASH>
 MPEG-DASHを用いたデータ伝送の様子の例を図1に示す。図1の情報処理システム1において、ファイル生成装置2は、動画コンテンツとして、ビデオデータやオーディオデータを生成し、符号化し、伝送用のファイルフォーマットでファイル化する。例えば、ファイル生成装置2は、これらのデータを10秒程度の時間毎にファイル化する(セグメント化する)。ファイル生成装置2は、生成したセグメントファイルを、Webサーバ3にアップロードする。また、ファイル生成装置2は、動画コンテンツを管理するMPDファイル(管理ファイル)を生成し、それをWebサーバ3にアップロードする。
 DASHサーバとしてのWebサーバ3は、ファイル生成装置2により生成された動画コンテンツのファイルを、MPEG-DASHに準ずる方式で、インターネット4を介して再生端末5にライブ配信する。例えば、Webサーバ3は、ファイル生成装置2からアップロードされたセグメントファイルやMPDファイルを格納する。また、Webサーバ3は、再生端末5からの要求に応じて、格納しているセグメントファイルやMPDファイルを再生端末5に送信する。
 再生端末5(再生装置)は、ストリーミングデータの制御用ソフトウエア(以下、制御用ソフトウエアとも称する)6、動画再生ソフトウエア7、HTTPアクセス用のクライアント・ソフトウエア(以下、アクセス用ソフトウエアという)8等を実行する。
 制御用ソフトウエア6は、Webサーバ3からストリーミングするデータを制御するソフトウエアである。例えば、制御用ソフトウエア6は、Webサーバ3からMPDファイルを取得する。また、制御用ソフトウエア6は、例えば、そのMPDファイルや動画再生ソフトウエア7により指定される再生時刻等を表す再生時刻情報、およびインターネット4のネットワーク帯域に基づいて、再生対象のセグメントファイルの送信要求を、アクセス用ソフトウエア8に指令する。
 動画再生ソフトウエア7は、インターネット4を介してWebサーバ3から取得された符号化ストリームを再生するソフトウエアである。例えば、動画再生ソフトウエア7は、再生時刻情報を制御用ソフトウエア6に指定する。また、動画再生ソフトウエア7は、アクセス用ソフトウエア8から受信開始の通知を取得すると、アクセス用ソフトウエア8から供給される符号化ストリームを復号する。動画再生ソフトウエア7は、復号の結果得られるビデオデータやオーディオデータを出力する。
 アクセス用ソフトウエア8は、HTTPを用いたWebサーバ3との通信を制御するソフトウエアである。例えば、アクセス用ソフトウエア8は、受信開始の通知を動画再生ソフトウエア7に供給する。また、アクセス用ソフトウエア8は、制御用ソフトウエア6の指令に応じて、再生対象のセグメントファイルの符号化ストリームの送信要求をWebサーバ3に送信する。さらに、アクセス用ソフトウエア8は、その送信要求に応じてWebサーバ3から送信されてくる、通信環境等に応じたビットレートのセグメントファイルを受信する。そして、アクセス用ソフトウエア8は、その受信したファイルから符号化ストリームを抽出し、動画再生ソフトウエア7に供給する。
  <MPD>
 次に、MPDについて説明する。MPDは、例えば図2に示されるような構成を有する。MPDの解析(パース)においては、クライアント(図1の例の場合、再生端末5)は、MPD(図2のMedia Presentation)のピリオド(Period)に含まれるリプレゼンテーション(Representation)の属性から最適なものを選択する。
 クライアントは、選択したリプレゼンテーション(Representation)の先頭のセグメント(Segment)を読んでイニシャライズセグメント(Initialization Segment)を取得し、処理する。続いて、クライアントは、後続のセグメント(Segment)を取得し、再生する。
 なお、MPDにおける、ピリオド(Period)、リプレゼンテーション(Representation)、およびセグメント(Segment)の関係は、図3のようになる。つまり、1つのメディアコンテンツは、時間方向のデータ単位であるピリオド(Period)毎に管理することができ、各ピリオド(Period)は、時間方向のデータ単位であるセグメント(Segment)毎に管理することができる。また、各ピリオド(Period)について、ビットレート等の属性の異なる複数のリプレゼンテーション(Representation)を構成することができる。
 したがって、このMPDのファイル(MPDファイルとも称する)は、ピリオド(Period)以下において、図4に示されるような階層構造を有する。また、このMPDの構造を時間軸上に並べると図5の例のようになる。図5の例から明らかなように、同一のセグメント(Segment)に対して複数のリプレゼンテーション(Representation)が存在している。クライアントは、これらのうちのいずれかを適応的に選択することにより、通信環境や自己のデコード能力などに応じて適切なストリームデータを取得し、再生することができる。
  <DSD>
 ところで、映像や音楽のデータは高品質化が進み、それとともに、配信においてもより高品質なデータの配信が求められている。例えば、音声信号の高品位な変調方式としてDSD(Direct Stream Digital)が知られている(図6)。図6に示されるように、PCM(Pulse Code Modulation)の場合、オーディオアナログ信号の各サンプリング時刻の信号値が固定数ビットのデジタルデータに変換されるのに対して、DSDの場合、オーディオアナログ信号がΔΣ変調され、1ビットのデジタルデータに変換される。
 DSDの場合、サンプリング周波数が例えば2.8MHz、5.6MHz、11.2MHzと高いため、ビットレートも2chでそれぞれ、5.6Mbps、11.2Mbps、22.4Mbps になる。そこで、このような高レートのDSDデータをロスレスで圧縮する方式が考案された。
  <DST>
 例えば、DSDデータの可逆圧縮符号化方式として、SACD(Super Audio Compact Disc)向けに開発しMPEG4 AAC(Advanced Audio Coding)(IEC/ISO(International Organization for Standardization / International Electrotechnical Commission) 14496-3)で規格化されているDST(Direct Stream Transfer)がある。しかしながら、このDSTは負荷が大き過ぎて、ソフトウエアでの処理には適さない。
  <新たなDSD可逆圧縮符号化方式>
 そこで、DSTとは異なる手法で、組み込み系プロセッサでのソフトウエア処理でも実現できる新たなDSD可逆圧縮符号化方式も開発された。この新たなDSD可逆圧縮符号化方式で生成したDSDロスレスストリームを配信に用いることで、伝送に必要な帯域を抑えることが可能になるとともに、PCやモバイル端末のようなクライアントでのソフトウエア処理でのリアルタイムデコードが期待できる。
 例えば、図7のAに示されるように、オーディオデータの符号化方式にAACを用いる通常のライブストリーミングの場合、ビットレートが一定であるので、ビデオデータは、伝送路の帯域変動に応じてビットレートを選択する。これに対して、オーディオデータの符号化方式にDSDの可逆符号化方式を採用したライブストリーミング(4K+DSD)の場合、図7のBに示されるように、DSDロスレスストリームは、局所的なレート変動が大きい。つまり、このレート変動により生じる帯域の余裕をビデオデータの伝送に割り当てることができ、より高品位なビデオデータ伝送を可能にする。
   <圧縮符号化装置の構成例>
 次に、この新たなDSD可逆圧縮符号化方式について説明する。この新たなDSD可逆圧縮符号化方式に対応する圧縮符号化装置の主な構成例を図8に示す。図8に示される圧縮符号化装置10は、アナログのオーディオ信号をΣ△(シグマデルタ)変調によりデジタル信号に変換し、変換後のオーディオ信号を圧縮符号化して出力する装置である。つまり、圧縮符号化装置10は、オーディオ信号をDSD方式で変調してデジタル化し、そのデジタルデータ(DSDデータ)を上述した新たなDSD可逆圧縮符号化方式で符号化し、DSDロスレスストリームを生成する装置である。
 アナログのオーディオ信号は、入力部11から入力されて、ADC(Analog Digital Converter)12へ供給される。ADC12は、供給されたアナログのオーディオ信号を、ΣΔ変調によりデジタル化して、入力バッファ13に出力する。
 ADC12は、加算器21、積分器22、比較器23、1サンプル遅延回路24、及び、1ビットDAC(Digital Analog Converter)25により構成される。入力部11から供給されたオーディオ信号は、加算器21に供給される。加算器21は、1ビットDAC25から供給された1サンプル期間前のアナログのオーディオ信号と、入力部11からのオーディオ信号を加算して、積分器22に出力する。積分器22は、加算器21からのオーディオ信号を積分して比較器23に出力する。比較器23は、入力オーディオ信号の中点電位と比較されて1サンプル期間ごとに1ビット量子化する。サンプル期間の周波数(サンプリング周波数)は、従来の48kHz、44.1kHzに対して、その64倍あるいは128倍の周波数が用いられる。比較器23は、1ビット量子化したオーディオ信号を、入力バッファ13に出力するとともに、1サンプル遅延回路24に供給する。1サンプル遅延回路24は、比較器23からのオーディオ信号を1サンプル期間分遅延させて1ビットDAC25に出力する。1ビットDAC25は、1サンプル遅延回路24からのデジタル信号をアナログ信号に変換して加算器21に出力する。
 以上のように構成されるADC12は、入力部11から供給されたオーディオ信号を、1ビットのデジタル信号に変換(A/D変換)して、入力バッファ13に出力する。このΣΔ変調のA/D変換によれば、サンプル期間の周波数(サンプリング周波数)を充分高くすることによって、例えば1ビットの少ないビット数でも広いダイナミックレンジのデジタル音声信号を得ることができる。例えば、ADC12には、入力部11からステレオ(2チャンネル)のオーディオ信号が入力され、ADC12は、それを44.1kHzの128倍のサンプリング周波数で1ビットの信号にAD変換して入力バッファ13に出力する。なお、ΣΔ変調では、量子化のビット数を2ビットあるいは4ビットとすることもできる。
 入力バッファ13は、ADC12から供給される1ビットデジタルのオーディオ信号を、一時蓄積し、1フレーム単位で後段の制御部14、エンコード部15、及び、データ量比較部17に供給する。ここで、1フレームとは、オーディオ信号を所定の時間(期間)に区切って1まとまりとみなす単位である。例えば3秒を1フレームとしてもよい。換言するに、入力バッファ13は、オーディオ信号を、3秒単位で、制御部14、エンコード部15、及び、データ量比較部17に供給する。上述したように、入力部11から入力されるオーディオ信号は、ステレオ(2チャンネル)の信号であり、44.1kHzの128倍のサンプリング周波数で1ビットの信号にA/D変換するため、1フレーム当たりのデータ量は、44100(Hz)*128*2(ch)*3(sec)=5.6Mビットとなる。以下においては、入力バッファ13から供給される△Σ変調されたデジタル信号を、DSDデータとも称する。
 制御部14は、圧縮符号化装置1全体の動作を制御する。また、制御部14は、エンコード部15が圧縮符号化を行うために必要となる変換テーブルtable1を作成して、エンコード部15に供給する機能を有する。例えば、制御部14は、入力バッファ13から供給される1フレームのDSDデータを用いて、データ発生カウントテーブルpretableを作成し、データ発生カウントテーブルpretableからさらに変換テーブルtable1を作成する。制御部14は、作成した変換テーブルtable1を、エンコード部15とデータ送信部18に供給する。変換テーブルtable1は、1フレーム単位で作成(更新)され、エンコード部15に供給される。
 エンコード部15は、制御部14から供給された変換テーブルtable1を用いて、入力バッファ13から供給されるDSDデータを4ビット単位で圧縮符号化する。したがって、エンコード部15には入力バッファ13から、制御部14に供給されるタイミングと同時にDSDデータが供給されるが、エンコード部15では、制御部14から変換テーブルが供給されるまで処理は待機される。エンコード部15は、4ビットのDSDデータを、2ビットのデータに符号化するか、または、6ビットのデータに符号化して、符号化データバッファ16に出力する。
 符号化データバッファ16は、エンコード部15で圧縮符号化されたDSDデータである圧縮データを一時的にバッファリングし、データ量比較部17とデータ送信部18に供給する。
 データ量比較部17は、入力バッファ13から供給されるDSDデータ(以下、非圧縮データともいう。)と、符号化データバッファ16から供給される圧縮データのデータ量を、フレーム単位で比較する。エンコード部15は、上述したように、4ビットのDSDデータを、2ビットのデータか、または6ビットのデータに符号化するため、アルゴリズム上、圧縮後のデータ量が、圧縮前のデータ量を超えてしまう場合もあり得るためである。そこで、データ量比較部17は、圧縮データと非圧縮データのデータ量を比較して、データ量の少ない方を選択し、どちらを選択したかを示す選択制御データをデータ送信部18に供給する。なお、データ量比較部17は、非圧縮データを選択したことを示す選択制御データをデータ送信部18に供給する場合には、非圧縮データもデータ送信部18に供給する。選択制御データは、送信データを受け取る受信側の装置から見れば、データ送信部18から送信されてくるオーディオデータが、エンコード部15で圧縮符号化されたデータか否かを表すフラグであるといえる。
 データ送信部18は、データ量比較部17から供給される選択制御データに基づいて、符号化データバッファ16から供給される圧縮データか、または、データ量比較部17から供給される非圧縮データのどちらかを選択し、選択制御データとともに、出力部19を介して相手装置に送信する。また、データ送信部18は、圧縮データを送信する場合には、制御部14から供給される変換テーブルtable1のデータも、圧縮データに付加して相手装置に送信する。データ送信部18は、送信データとして、所定数のサンプルごとのデジタル信号に同期信号と誤り訂正符号(ECC)を付加して送信することができる。
  <データ発生カウントテーブルの作成方法>
 次に、制御部14によるデータ発生カウントテーブルpretableの作成方法について説明する。
 制御部14は、1フレームのDSDデータに対して、データ発生カウントテーブルpretableを作成するが、入力バッファ13から供給されるDSDデータを、4ビット単位で以下のように表す。
  ...D4[n-3],D4[n-2],D4[n-1],D4[n],D4[n+1],D4[n+2],D4[n+3],...
 ここで、D4[n]は、4ビットの連続データを表し、以下では、D4データともいう(n>3)。
 制御部14は、過去の3つのD4データ(過去の12ビットデータ)の次のD4データの発生回数をカウントし、図9に示されるデータ発生カウントテーブルpretable[4096][16]を作成する。ここで、データ発生カウントテーブルpretable[4096][16]の[4096]と[16]は、データ発生カウントテーブルが4096行16列のテーブル(行列)であることを表し、[0]乃至[4095]の各行は、過去の3つのD4データがとり得る値(過去のビットパターン)に対応し、[0]乃至[15]の各列は、次のD4データがとり得る値に対応する。
 例えば、データ発生カウントテーブルpretableの1行目であるpretable[0][0]乃至[0][15]は、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]が“0”={0000,0000,0000}だった時の次のデータの発生回数を示しており、過去3つのデータが“0”だった次の4ビットは“0”であった回数が369a(HEX表記)であって、他のデータはなかったことを示している。データ発生カウントテーブルpretableの2行目であるpretable[1][0]乃至[1][15]は、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]が“1”={0000,0000,0001}だった時の次のデータの発生回数を示している。データ発生カウントテーブルpretableの2行目の全ての要素が“0”であるのは、過去データとして3つのD4データが“1”となるデータが、この1フレーム内に存在しなかったことを示している。また、図9では、データ発生カウントテーブルpretableの118行目であるpretable[117][0]乃至[117][15]は、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]が“117”={0000,0111,0101}だった時の次のデータの発生回数を示している。このデータでは、過去3つのデータが“117”だった次の4ビットが“0”であった回数が0回であり、“1”であった回数が1回であり、“2”であった回数が10回であり、“3”であった回数が18回であり、“4”であった回数が20回であり、“5”であった回数が31回であり、“6”であった回数が11回であり、“7”であった回数が0回であり、“8”であった回数が4回であり、“9”であった回数が12回であり、“10”であった回数が5回であり、“11”乃至“15”であった回数が0回であったことを示している。
 制御部14は、以上のようにして、1フレームのDSDデータに対して、過去の3つのD4データ(過去の12ビットデータ)の次のD4データの発生回数をカウントし、データ発生カウントテーブルpretableを作成する。
   <変換テーブルの作成方法>
 次に、制御部14による変換テーブルtable1の作成方法について説明する。
 制御部14は、先に作成したデータ発生カウントテーブルpretableに基づいて、4096行3列の変換テーブルtable1[4096][3]を作成する。ここで、変換テーブルtable1[4096][3]の各行[0]乃至[4095]は、過去の3つのD4データがとり得る値に対応し、各列[0]乃至[2]には、次のD4データがとり得る16個の値のうち、発生頻度が大きかった3つの値が格納される。変換テーブルtable1[4096][3]の第1列[0]には、発生頻度が最も大きい(1番目の)値が格納され、第2列[1]には、発生頻度が2番目の値が格納され、第3列[2]には、発生頻度が3番目の値が格納される。
 図10は、図9に示したデータ発生カウントテーブルpretableに対応する変換テーブルtable1[4096][3]の例を示している。変換テーブルtable1[4096][3]の118行目であるtable1[117][0]乃至[117][2]は、{05,04,03}となっている。これは、図9のデータ発生カウントテーブルpretableの118行目のpretable[117][0]乃至[117][15]の内容と対応している。図9におけるデータ発生カウントテーブルpretableの118行目のpretable[117][0]乃至[117][15]では、発生頻度が最も大きい(1番目の)値は、31回発生した“5”であり、発生頻度が2番目の値は、20回発生した“4”であり、発生頻度が3番目の値は、18回発生した“3”である。これにより、図10の変換テーブルtable1[4096][3]の第118行第1列table1[117][0]には、{05}が格納され、第118行第2列table1[117][1]には、{04}が格納され、第118行第3列table1[117][2]には、{03}が格納されている。同様に、図10の変換テーブルtable1[4096][3]の1行目のtable1[0][0]乃至[0][2]は、図9のデータ発生カウントテーブルpretableの1行目のpretable[0][0]乃至[0][15]の内容と対応している。
 図9のデータ発生カウントテーブルpretableの1行目のpretable[0][0]乃至[0][15]では、発生頻度が最も大きい(1番目の)値は、369a(HEX表記)回発生した“0”であり、それ以外の値は発生していない。そこで、図10の変換テーブルtable1[4096][3]の第1行第1列table1[0][0]には、{00}が格納され、第1行第2列table1[0][1]と第1行第3列table1[0][2]には、データが存在しないことを表す{ff}が格納されている。データが存在しないことを表す値は、{ff}に限られず、適宜決定することができる。変換テーブルtable1の各要素に格納される値は、“0”から“15”までのいずれかであるので、4ビットで表現できるが、コンピュータ処理上、扱いを容易にするために8ビットで表現されている。
 以上のようにして、先に作成したデータ発生カウントテーブルpretableに基づいて、4096行3列の変換テーブルtable1[4096][3]が作成され、エンコード部15に供給される。
   <エンコード部15による圧縮符号化方法>
 次に、エンコード部15による、変換テーブルtable1を用いた圧縮符号化方法について説明する。例えば、入力バッファ13から供給されるDSDデータ
  ...D4[n-3],D4[n-2],D4[n-1],D4[n],D4[n+1],D4[n+2],D4[n+3],...
 のうち、エンコード部15が、D4[n]を符号化する場合について説明する。
 D4[n]を符号化する場合、エンコード部15は、その直前の過去の12ビットのデータであるD4[n-3],D4[n-2],D4[n-1]を一塊の12ビットのデータとみなして、変換テーブルtable1[4096][3]の、D4[n-3],D4[n-2],D4[n-1]が示すアドレス(行)の3つの値、table1[D4[n-3],D4[n-2],D4[n-1]][0],table1[D4[n-3],D4[n-2],D4[n-1]][1],table1[D4[n-3],D4[n-2],D4[n-1]][2]を検索する。
 エンコード部15は、変換テーブルtable1[4096][3]の、D4[n-3],D4[n-2],D4[n-1]が示すアドレス(行)の3つの値、table1[D4[n-3],D4[n-2],D4[n-1]][0],table1[D4[n-3],D4[n-2],D4[n-1]][1],table1[D4[n-3],D4[n-2],D4[n-1]][2]のなかにD4[n]と同じものがあり、table1[D4[n-3],D4[n-2],D4[n-1]][0]と同じ場合は、D4[n]を“01b”と2ビットに変換し、table1[D4[n-3],D4[n-2],D4[n-1]][1]と同じ場合は、D4[n]を“10b”と2ビットに変換し、table1[D4[n-3],D4[n-2],D4[n-1]][2]と同じ場合は、D4[n]を“11b”と2ビットに変換する。また、エンコード部15は、変換テーブルtable1[4096][3]の、D4[n-3],D4[n-2],D4[n-1]が示すアドレス(行)の3つの値のなかに同じものが無ければ、“00b+ D4[n]”のように、D4[n]の前に“00b”をつけて6ビットに変換する。ここで、“01b”、“10b”、“11b”、“00b+ D4[n]”のbは、2進表記であることを表す。
 以上のようにして、エンコード部15は、変換テーブルtable1を用いて、4ビットのDSDデータD4[n]を、2ビットのデータ“01b”、“10b”若しくは“11b”に変換するか、または、6ビットのデータ“00b+D4[n]”に変換して、符号化データバッファ16に出力する。
   <エンコード部15の詳細構成>
 図11は、上述した圧縮符号化を行うエンコード部15の構成例を示す図である。
 入力バッファ13から供給された4ビットのDSDデータ(例えば、D4[n])は、4ビットを格納するレジスタ51に記憶される。また、レジスタ51の出力は、セレクタ55の1つの入力端子56aと、12ビットを格納するレジスタ52とつながっており、レジスタ52には、レジスタ51に記憶されている4ビットのDSDデータの直前の過去の12ビットのデータ(例えば、D4[n-3],D4[n-2],D4[n-1])が格納されている。
 変換テーブル処理部53は、制御部14から供給された変換テーブルtable1を有している。変換テーブル処理部53は、レジスタ52に格納されている12ビットのデータ(例えば、D4[n-3],D4[n-2],D4[n-1])が示すアドレスの3つの値、table1[D4[n-3],D4[n-2],D4[n-1]][0],table1[D4[n-3],D4[n-2],D4[n-1]][1],table1[D4[n-3],D4[n-2],D4[n-1]][2]のなかに、レジスタ51に格納されている4ビットのデータ(例えば、D4[n])があるか否かを検索し、ある場合には、同じ値が格納されている列に対応する値、即ち、“01b”、“10b”、または“11b”のいずれかを、2ビットのレジスタ54に記憶させる。2ビットのレジスタ54に記憶されたデータは、セレクタ55の1つの入力端子56cに供給される。また、変換テーブル処理部53は、レジスタ52に格納されている12ビットのデータ(例えば、D4[n-3],D4[n-2],D4[n-1])が示すアドレスの3つの値のなかに、レジスタ51に格納されている4ビットのデータ(例えば、D4[n])がない場合には、変換をしないことを示す信号(以下、変換無信号という。)を、セレクタ55に出力する。
 セレクタ55は、3つの入力端子56a乃至56cのなかの1つを選択し、その選択された入力端子56から取得されるデータを出力端子57から出力する。入力端子56aには、レジスタ51に記憶された4ビットのDSDデータ(例えば、D4[n])が供給され、入力端子56bには、“00b”が供給され、入力端子56cには、レジスタ54に記憶された2ビットの変換データが供給される。セレクタ55は、変換テーブル処理部53から、変換しないことを示す変換無信号が供給された場合には、入力端子56bを選択して“00b”を出力端子57から出力した後、入力端子56aを選択して、レジスタ51に記憶された4ビットのDSDデータ(例えば、D4[n])を出力端子57から出力する。これにより、変換テーブルtable1にD4[n]と同じものがない場合に出力される6ビット“00b+ D4[n]”が出力端子57から出力される。また、変換しないことを示す変換無信号が供給されない場合(変換したことを示す変換有信号が供給された場合)には、セレクタ55は、入力端子56cを選択して、レジスタ54から供給された2ビットの変換データを出力端子57から出力する。これにより、変換テーブルtable1にD4[n]と同じものがあった場合に出力される2ビット、即ち、“01b”、“10b”、または“11b”のいずれかが出力端子57から出力される。
   <圧縮符号化処理フロー>
 図12のフローチャートを参照して、圧縮符号化装置10による圧縮符号化処理について説明する。
 なお、図12の処理フローでは、ADC12の処理は省略されており、ADC12で△Σ変調された1フレームのDSDデータが入力バッファ13から出力された後の処理について説明する。
 初めに、ステップS1において、制御部14は、1フレームのDSDデータに対して、過去の3つのD4データ(過去の12ビットデータ)の次のD4データの発生回数をカウントし、データ発生カウントテーブルpretableを作成する。
 ステップS2において、制御部14は、作成したデータ発生カウントテーブルpretableに基づいて、4096行3列の変換テーブルtable1を作成する。制御部14は、作成した変換テーブルtable1を、エンコード部15とデータ送信部18に供給する。
 ステップS3において、エンコード部15は、1フレーム期間のDSDデータに対して、変換テーブルtable1を用いて、圧縮符号化を実行する。具体的には、エンコード部15は、4ビットのDSDデータD4[n]を、2ビットのデータ“01b”、“10b”若しくは“11b”に変換するか、または、6ビットのデータ“00b+D4[n]”に変換する処理を1フレーム期間のDSDデータに対して行う。圧縮符号化されて得られた圧縮データは、符号化データバッファ16とデータ量比較部17に供給される。
 ステップS4において、データ量比較部17は、入力バッファ13から供給された1フレームの非圧縮データと、符号化データバッファ16から供給された1フレームの圧縮データのデータ量を比較し、データ量が圧縮前よりも削減されたかを判定する。
 ステップS4で、データ量が圧縮前よりも削減されたと判定された場合、処理はステップS5に進み、データ量比較部17は、圧縮データを選択したことを示す選択制御データをデータ送信部18に供給する。
 ステップS6において、データ送信部18は、圧縮データを選択したことを示す選択制御データ(圧縮符号化されたデータを示すフラグ)と、エンコード部15から供給された圧縮データに、制御部14から供給された変換テーブルtable1のデータ(変換テーブルデータ)を付加して、相手装置に送信する。
 また、ステップS4で、データ量が圧縮前よりも削減されていないと判定された場合、処理はステップS7に進み、データ量比較部17は、非圧縮データを選択したことを示す選択制御データを、非圧縮データとともにデータ送信部18に供給する。
 ステップS8において、データ送信部18は、非圧縮データを選択したことを示す選択制御データ(圧縮符号化されていないデータを示すフラグ)と、非圧縮データを、相手装置に送信する。
 以上で、1フレームのDSDデータの圧縮符号化処理は終了する。上述したステップS1乃至S8の処理は、入力バッファ13から順次供給される1フレーム単位のDSDデータに対して繰り返し実行される。
   <復号装置の構成例>
 図13は、上述した新たなDSD可逆圧縮符号化方式に対応する復号装置の主な構成例を示している。図13の復号装置70は、図8の圧縮符号化装置10が圧縮符号化して送信したオーディオ信号を受信して伸長処理(可逆復号)する装置である。
 図8の圧縮符号化装置10が圧縮符号化して送信したオーディオ信号は、不図示のネットワーク(例えば、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、電話回線網、衛星通信網などの公衆回線網など)を経由して、復号装置70の入力部71で受信され、データ受信部72に供給される。
 データ受信部72は、受信データに含まれる同期信号を分離するとともに、ネットワーク伝送中に発生した伝送誤りを検出して訂正する。そして、データ受信部72は、受信データに含まれる、オーディオ信号が圧縮符号化されているか否かを示す選択制御データに基づいて、オーディオ信号が圧縮符号化されているか否かを判定する。そして、オーディオ信号が圧縮符号化されている場合には、データ受信部72は、受信した圧縮データを、符号化データバッファ73に供給する。また、オーディオ信号が圧縮符号化されていない場合には、データ受信部72は、受信した非圧縮データを、出力バッファ76に供給する。さらに、データ受信部72は、受信データに含まれる、変換テーブルtable1のデータ(変換テーブルデータ)を、テーブル記憶部75に供給する。テーブル記憶部75は、データ受信部72から供給された変換テーブルtable1を記憶し、必要に応じてデコード部74に供給する。
 符号化データバッファ73は、データ受信部72から供給される圧縮データを一時蓄積し、所定のタイミングで後段のデコード部74に供給する。
 デコード部74は、圧縮データを圧縮前の状態に復号(可逆復号)して、出力バッファ76に供給する。
   <復号方法の詳細>
 デコード部74による復号方法について説明する。圧縮符号化装置10で圧縮符号化されて送信されてきた圧縮データを、2ビット単位で以下のように表し、E2[n]を復号する場合について説明する。
  ...E2[n-3],E2[n-2],E2[n-1],E2[n],E2[n+1],E2[n+2],E2[n+3],...
 ここで、E2[n]は、2ビットの連続データを表し、E2データともいう。
 デコード部74は、まず、E2[n]の値を判定する。E2[n]が“00b”である場合、受信された変換テーブルtable1[4096][3]に搭載されてないデータであるので、E2[n]の次の4ビットのデータ“E2[n+1]+E2[n+2]”が復号すべきデータとなる。また、E2[n]が“01b”、“10b”、または“11b”である場合、受信された変換テーブルtable1[4096][3]に搭載されているデータであるので、その直前に復号した12ビットのD4データD4[n-3],D4[n-2],D4[n-1]を使って、変換テーブルtable1[4096][3]を参照し、復号すべきデータを検索する。復号すべきデータは、“table1[D4[n-3],D4[n-2],D4[n-1]][ E2[n]-1]”に格納されているデータとなる。以上のようにして、デコード部74は、圧縮データを圧縮前の状態に復号(可逆復号)することができる。デコード部74は、図13に示されるように、2ビットのレジスタ91、12ビットのレジスタ92、変換テーブル処理部93、4ビットのレジスタ94、及び、セレクタ95により構成される。
 符号化データバッファ73から供給された2ビットのE2データ(例えば、E2[n])は、レジスタ91に記憶される。12ビットのレジスタ92には、セレクタ95の出力が供給されるようになっており、レジスタ92は、レジスタ91に記憶されている2ビットのE2データ(例えば、E2[n])の直前に復号した12ビットのデータ(例えば、D4[n-3],D4[n-2],D4[n-1])が格納されている。レジスタ91に記憶されている2ビットのE2データ(例えば、E2[n])が“00b”である場合、セレクタ95は、入力端子96aを選択し、E2[n]の次の4ビットのデータ“E2[n+1]+E2[n+2]”を復号結果として、出力端子97から出力する。レジスタ91に記憶されている2ビットのE2データ(例えば、E2[n])が“01b”、“10b”、または“11b” である場合、変換テーブル処理部93は、テーブル記憶部75から供給された変換テーブルtable1の“table1[D4[n-3],D4[n-2],D4[n-1]][ E2[n]-1]”に格納されている4ビットのデータをレジスタ94に記憶させる。セレクタ95は、入力端子96bを選択し、レジスタ94に記憶されているデータを復号結果として、出力端子97から出力する。
 出力バッファ76は、データ受信部72から供給された非圧縮データ、または、デコード部74から供給された復号後のデータのいずれかを適宜選択して、アナログフィルタ77に供給する。
 アナログフィルタ77は、出力バッファ76から供給された復号後のデータに対して、ローパスフィルタ、バンドパスフィルタ等の所定のフィルタ処理を実行し、出力部78から出力させる。
   <復号処理フロー>
 図14のフローチャートを参照して、復号装置70の復号処理についてさらに説明する。
 初めに、ステップS21において、データ受信部72は、受信データに含まれる選択制御データに基づいて、受信したデータが圧縮符号化された圧縮データであるかを判定する。
 ステップS21で、受信したデータが圧縮データであると判定された場合、処理はステップS22に進み、データ受信部72は、受信データに含まれていた変換テーブルデータをテーブル記憶部75に供給する。変換テーブル処理部93は、テーブル記憶部75を介して、受信された変換テーブルtable1を取得する。またステップS22では、受信データに含まれていた圧縮データが、符号化データバッファ73に供給される。
 ステップS23において、デコード部74は、変換テーブルtable1を用いて、符号化データバッファ73から供給された圧縮データを復号し、出力バッファ76に供給する。即ち、デコード部74は、2ビットのE2データ(例えば、E2[n])が“00b”である場合、E2[n]の次の4ビットのデータ“E2[n+1]+E2[n+2]”を復号結果として出力バッファ76に供給し、2ビットのE2データ(例えば、E2[n])が“01b”、“10b”、または“11b” である場合、変換テーブルtable1の“table1[D4[n-3],D4[n-2],D4[n-1]][ E2[n]-1]”に格納されている4ビットのデータを復号結果として出力バッファ76に供給する。
 また、ステップS21で、受信したデータが圧縮データではない、即ち非圧縮データであると判定された場合、処理はステップS24に進み、データ受信部72は、受信データに含まれていた非圧縮データを取得し、出力バッファ76に供給する。
 以上までの処理により、非圧縮データか、または、デコード部74によって復号されたデータが、出力バッファ76に供給され、出力バッファ76に供給されたデータが、アナログフィルタ77に出力される。
 ステップS25において、アナログフィルタ77は、出力バッファ76を介して供給されたデータに対して所定のフィルタ処理を実行する。フィルタ処理後のオーディオ信号が出力部78から出力される。
 1フレーム単位のオーディオ信号に対して、以上の処理が繰り返し実行される。
   <DSDロスレスストリームの構造>
 上述の新たなDSD可逆圧縮符号化方式において、DSDデータは、1chあたり固定長(4096×32=131072ビット)のブロック(Block)に分割されて圧縮される。圧縮後、連続する10ブロック分の圧縮データにヘッダを付けてGOB(Group of Blocks)が構成される。さらにそのGOBの先頭にコンフィギュレーション情報(configuration)を付加した単位が、DSDロスレスペイロード(DSD_lossless_payload())となる。ブロックの伸長に必要な情報(code book;参照テーブル)は、GOBヘッダ(GOB header)とGOBデータ(GOB data)に格納される。AACとのストリームスイッチングも考慮し、ブロック(Block(audio frame))の時間長はAACと同程度に設定されている。
 DSDロスレスストリームの基本的な構造の例を図15に示す。図15の一番上の段に示されるように、DSDロスレスストリーム(DSD lossless stream)は、複数のDSDロスレスペイロード(DSD_lossless_payload())により構成される。
 図15の上から2段目に示されるように、1つのDSDロスレスペイロードは、フォーマットバージョン(format version)、GOBコンフィグ(GOB config)、およびGOBにより構成される。
 図15の上から3段目に示されるように、GOBは、GOBヘッダ(GOB header)、GOBデータ(GOB data)、10個のブロック(Block1乃至Block10)よりなる。GOBヘッダおよびGOBデータは、このGOBの復号に利用されるGOBイニシャライザ(GOB initializer)とも称する。GOBイニシャライザには、復号に用いられるデコーダコンフィギュレーション情報(decoder configration)、メタデータ(metadata)、コードブック(code book)等が含まれる。
 図15の一番下の段に示されるように、ブロック(Block)は、ブロックヘッダ(Block header)、左チャンネルのオーディオデータ(L)、右チャンネルのオーディオデータ(R)、およびバイトアライン(byte align)により構成される(DSDデータが左右2chの場合)。
 1ブロック(Block)は、fsに依らず、1chあたり圧縮前のDSDデータで4096×32=131072ビット分のデータが格納される。つまり、1ブロックの長さ(ブロック長)は、サンプリング周波数が2.8MHzの場合、約46msecとなり、サンプリング周波数が5.6MHzの場合、約23msecとなり、サンプリング周波数が11.2MHzの場合、約12msecとなる。例えば、サンプリング周波数が2.8MHzの場合、1GOBには、再生時間で約468msec分のデータが格納される。
   <シンタクス>
 DSDロスレスペイロードのシンタクスの例を図16のAに示す。図16のAに示されるように、DSDロスレスペイロード(DSD_lossless_payload())には、例えば、format version、DSD_lossless_gob_configuration()、DSD_lossless_gob(number_of_audio_data)等が格納される。このformat versionは、図15のフォーマットバージョン(format version)に相当する。また、DSD_lossless_gob_configuration()は、図15のGOBコンフィグ(GOB config)に相当する。また、DSD_lossless_gob()は、図15のGOBに相当する。
 DSD_lossless_gob_configuration()のシンタクスの例を図16のBに示す。図16のBに示されるように、DSD_lossless_gob_configuration()には、例えば、channel_configuration、number of blocks、sampling_frequency、comment_flag、comment_size、comment_byte等が格納される。
 DSD_lossless_gob()のシンタクスの例を図16のCに示す。図16のCに示されるように、DSD_lossless_gob()には、例えば、DSD_lossless_gob_header()、DSD_lossless_gob_data()、DSD_lossless_block()、byte_align()等が格納される。このDSD_lossless_gob_header()は、図15のGOBヘッダ(GOB header)に相当する。DSD_lossless_gob_data()は、図15のGOBデータ(GOB data)に相当する。DSD_lossless_block()は、図15の各ブロック(Block1乃至Block10)に相当する。
 DSD_lossless_gob_header()のシンタクスの例を図16のDに示す。図16のDに示されるように、DSD_lossless_gob_header()には、例えば、DSD_lossless_block_info等が格納される。
 DSD_lossless_gob_data()のシンタクスの例を図16のDに示す。図16のDに示されるように、DSD_lossless_gob_data()には、例えば、gob_codebook_length、gob_codebook[i]等が格納される。gob_codebook[i]は、図15のコードブック(code book)に相当する。
  <スイッチング>
 画像や音声などのコンテンツのデータ(コンテンツデータとも称する)を配信するシステムにおいて、配信するコンテンツデータのさらなる高品質化は、常に求められている。そして、そのコンテンツデータの高品質化に伴い、以上の新たなDSD可逆圧縮符号化方式のような新たな符号化方式の開発も随時行われている。
 しかしながら、このような高品質な符号化方式が新たに開発され、コンテンツデータの配信に適用されるようになったとしても、実際には、従来の低品質な符号化方式のコンテンツデータの配信も併用することが求められることがあり得る。
 例えば、より安定的にコンテンツデータを配信するために、伝送路の伝送帯域の変動に応じて配信するコンテンツデータのビットレートを切り替えることが考えられるが、その場合、1つの符号化方式では十分なビットレート幅を確保できない可能性がある。例えば、一般的に、高品質なコンテンツデータは低品質なコンテンツデータよりも高ビットレートとなる。伝送帯域の変動により強く、より安定的な配信を行うためには、従来の符号化方式のような低ビットレートのコンテンツデータも配信可能とすべきであるが、新たな符号化方式ではそこまでの低ビットレートに対応していないこともあり得る。例えば、上述の新たなDSD符号化方式のDSDロスレスストリームの場合、2.8Mbps以上のDSDデータを可逆圧縮してビットレートを低減させるが、AAC(Advanced Audio Coding)のように128kbpsの低レートを常時維持することはできない。
 つまり、より高品質な符号化方式が開発されるほど、対応すべきビットレート幅が広くなる可能性があり、1つの符号化方式で対応することはより困難になる可能性がある。
 また、例えば、新たな符号化方式が適用されても、再生側で使用されるデコーダがその符号化方式に対応しておらず、再生することができないことがあり得る。したがって、コンテンツデータの配信の汎用性を向上させるためには、従来の符号化方式による配信も可能とすることが求められる。
 なお、これらのことは、音声データに限らず、画像データ等の任意のコンテンツデータにおいても同様である。
 MPEG-DASHでは、MPDによって、互いに異なる符号化方式の複数のコンテンツデータの配信を管理することができる。例えば、伝送帯域の混雑度やデコーダの対応符号化方式等に応じて配信するコンテンツデータを切り替えることができる。しかしながら、従来のMPDにおいては、再生中におけるコンテンツデータの切り替え(スイッチング)は、ビットレートの切り替え程度しか考慮されておらず、再生中に符号化方式を切り替えることは想定されていなかった。
 例えば、MPDにおいては、基本的に、符号化方式は、アダプテーションセット(Adaptation Set)において管理され、切り替え(スイッチング)可能な互いに異なる符号化方式のコンテンツデータは、互いに異なるアダプテーションセットにおいて管理される。また、基本的に、ビットレートは、アダプテーションセット内のリプレゼンテーション(Representation)において管理され、切り替え(スイッチング)可能な互いに異なるビットレートのコンテンツデータは、同一のアダプテーションセットの互いに異なるリプレゼンテーションにおいて管理される。
 例えば、MPEG-DASHのライブプロファイル(Live Profile)の場合、図17に示される例のようなファイル構造を有する。例えば「Audio DSD 2.8MHz」と「Audio DSD 5.6MHz」のように、符号化方式が互いに異なるコンテンツデータは、互いに異なるアダプテーションセットにおいて管理される。また、「Video」の「10Mbps」、「20Mbps」、「40Mbps」、「80Mbps」の例のように、ビットレートが互いに異なるコンテンツデータは、同一のアダプテーションセットの互いに異なるリプレゼンテーションにおいて管理される。
 また、例えば、日本語と英語等のように、言語違いのオーディオストリームが複数存在する場合も、アダプテーションセットを分けて管理される。特に、ユーザに(UI(User Interfase)で)選択させる意図がある場合には、言語属性を表す「@lang」がアダプテーションセットにしか存在しないため、アダプテーションセットを分けて管理する必要がある。
 なお、MPEG-DASHのオンデマンドプロファイル(On-demand profile)の場合のファイル構造は、図18の例のようになる。この場合もライブプロファイルの場合と同様に、符号化方式等が異なる場合はアダプテーションセットを分けて管理される。
 したがって、符号化方式を切り替える(スイッチング)するために、アダプテーションセットを越えた切り替えを行うことになるが、MPDには、リプレゼンテーション間の切り替え(スイッチング)のための仕組みは用意されているものの、アダプテーションを越えた切り替え(スイッチング)を実現する仕組みは用意されていなかった。
 例えば、ライブプロファイルの場合、図17に示されるように、コンテンツデータは、その再生時間方向にセグメント(Segment)単位に分けて管理される。図17に示されるように、コンテンツデータがMP4ファイルの場合、各セグメントは、所定再生時間分のムービーフラグメントボックス(Movie Fragment Box(moof))と、メディアデータボックス(Media Data Box(mdat))とにより構成される。このセグメントがアクセス単位となるので、再生するコンテンツデータを切り替える(スイッチングする)場合、このセグメントの境界で行われる。
 しかしながら、セグメントの長さ(再生時間)は、アダプテーションセット毎に互いに独立に設定することができるため、セグメントの境界(の再生時刻)が、アダプテーション間で一致しているとは限らない。切り替え元のアダプテーションセットと切り替え先のアダプテーションセットとの間でこのセグメントの境界が一致していないと、切り替えの際に再生が途切れたり、再生時刻がずれたり(飛んだり戻ったり)するなどの不連続が生じる可能性がある。すなわち、シームレスな切り替えを保証することができなかった。
 また、例えば、オンデマンドプロファイルの場合、図18に示されるように、コンテンツデータ全体は1つのメディアセグメント(Media Segment)として管理され、さらに、その再生時間方向にサブセグメント(Sub-segment)単位に分けて管理される。図18に示されるように、コンテンツデータがMP4ファイルの場合、各セグメントは、所定再生時間分のムービーフラグメントボックス(Movie Fragment Box(moof))と、メディアデータボックス(Media Data Box(mdat))とにより構成される。このサブセグメントがアクセス単位となるので、再生するコンテンツデータを切り替える(スイッチングする)場合、このサブセグメントの境界で行われる。
 つまり、この場合も、ライブプロファイルのセグメント境界と同様に、アダプテーション間でサブセグメント境界(の再生時刻)の一致が保証されていないため、シームレスな切り替えを保証することができなかった。
 このように、シームレスな切り替えを行うことが保証されないため、アダプテーションセットを越えたスイッチングを実現することは困難であった。そのため、より高品位のコンテンツデータの配信を安定的に行うことが困難であった。
 <2.第1の実施の形態>
  <アダプテーションを越えた切り替えに関する情報の設定>
 そこで、コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を設定するようにする。
 このようにすることにより、第1の管理単位を越えるシームレスな切り替え(再生の連続性が維持されるような(シームレスな再生が可能な)切り替え)を行うことができるようになり、より大きな帯域変動に対応することができるようになり、コンテンツデータをより安定的に伝送することができる。
 この管理情報は、MPEG-DASHのMPDとし、第1の管理単位を、アダプテーションセット(Adaptation Set)としてもよい。このようにすることにより、MPEG-DASHを用いた配信をより安定的に行うことができる。
 なお、以下においてMPDに関する説明を行う場合、ライブプロファイルを用いて説明し、オンデマンドプロファイルについても説明は省略するが、以下の説明は、特に矛盾が生じない限りに、任意のプロファイルに適用することができる。例えば、ライブプロファイルのセグメントについての説明は、セグメントをサブセグメントに置き換えることにより、オンデマンドプロファイルにも適用することができる。
  <切り替え先情報>
 この切り替えに関する情報は、再生するデータの第1の管理単位を越える切り替えの、切り替え先に関する情報であるようにしてもよい。例えば、この切り替え先に関する情報として、切り替え先として許可する管理単位(すなわち、切り替え先の候補とする管理単位)を指定する情報を設定するようにしてもよい。例えば、この切り替え先に関する情報として、属性@ContentSwitchingDestinationIdを設定するようにしてもよい。
 例えば、管理情報がMPDの場合、この属性@ContentSwitchingDestinationIdに、切り替え先の候補とする管理単位の識別情報(Id)のリスト(羅列)を設定するようにしてもよい。切り替え先の候補とする管理単位は、例えば、他のアダプテーションセット(他の第1の管理単位)でもよいし、他のアダプテーションセットのリプレゼンテーション(他の第1の管理単位内の各データを管理する第2の管理単位)であってもよいし、その両方であってもよい。なお、「他のアダプテーションセット(他の第1の管理単位)」とは、現在再生中の(切り替え前の)コンテンツデータを管理するアダプテーションセット(第1の管理単位)以外のアダプテーションセット(第1の管理単位)を示す。また、切り替え先の候補としてアダプテーションセットを設定する場合は、その下位のリプレゼンテーションの指定は、従来のMPDの仕様に基づいて行われるようにしてもよい。
 切り替え先の候補としてアダプテーションセット(第1の管理単位)を設定する場合、追加する情報量が少なく、従来の仕様も利用するので、従来のMPDとの互換性が高い。また、切り替え先の候補としてリプレゼンテーション(第2の管理単位)を設定する場合、切り替えについてのより詳細な制御が可能になる。
   <アライン>
 この切り替え先に関する情報として設定される管理単位は、少なくとも一部のセグメントにおいて、現在の管理単位とセグメント境界の再生時刻が一致している(アラインされている)ようにしてもよい。換言するに、現在の管理単位に対して、少なくとも一部のセグメントにおいてセグメント境界がアラインされている管理単位を、切り替え先に関する情報として設定することができるようにしてもよい。
 セグメント境界がアラインされていれば、再生を行う装置において、このような切り替え先に関する情報に基づいて切り替え(スイッチング)の制御を行うようにすることにより、アダプテーションを越えた切り替えであっても、シームレスな切り替えを行うことができる。
   <切り替え先情報の設定>
 なお、切り替え先に関する情報は、任意の管理単位に設定することができる。例えば、属性@ContentSwitchingDestinationId(切り替え先に関する情報)を、アダプテーションセット(第1の管理単位)に設定することができるようにしてもよいし、リプレゼンテーション(第2の管理単位)に設定することができるようにしてもよいし、その両方に設定することができるようにしてもよい。
 切り替え先に関する情報をアダプテーションセット(第1の管理単位)に設定する場合、そのアダプテーションセットに属するリプレゼンテーションに共通な切り替え先に関する情報を設定することができ、情報量の増大を抑制することができる。また、切り替え先に関する情報をリプレゼンテーション(第2の管理単位)に設定する場合、切り替えについて、より詳細な制御を行うことができる。
 また、切り替え先に関する情報として、切り替え先として推奨する管理単位を指定する情報を設定するようにしてもよいし、切り替え先として推奨しない管理単位を指定する情報を設定するようにしてもよいし、切り替え先として禁止する管理単位を指定する情報を設定するようにしてもよい。
  <切り替えタイミング情報>
 また、切り替えに関する情報は、再生するデータの第1の管理単位を越える切り替えのタイミングに関する情報であるようにしてもよい。例えば、このタイミングに関する情報として、再生するデータの第1の管理単位を越える切り替えを許可するタイミングを指定する情報(切り替えのタイミングの候補を指定する情報)であるようにしてもよい。例えば、このタイミングに関する情報として、属性@ContentSwitchingAlignmentCycleを設定するようにしてもよい。
 この候補とするタイミングは任意であるが、例えば、再生するデータの再生時間方向の管理単位である第2の管理単位の境界であるようにしてもよい。つまり、タイミングを指定する情報は、再生するデータの第1の管理単位を越える切り替えを許可する第2の管理単位の境界を指定する情報であるようにしてもよい。その際、候補となるタイミングを、次のタイミングまでの第2の管理単位の数で指定するようにしてもよい。
 例えば、管理情報がMPDの場合、再生するコンテンツデータのアダプテーションセット(第1の管理単位)を越えるスイッチング(切り替え)を許可するセグメント(第2の管理単位)の境界を、次のタイミングまでのセグメント(第2の管理単位)の数で指定するようにしてもよい。なお、ここでセグメントを第2の管理単位としたのは、第1の管理単位であるアダプテーションセットと異なる管理単位であるという意味である。付言するに、セグメントはリプレゼンテーションとも異なる管理単位である。つまり、アダプテーションセット(第1の管理単位)だけでなくリプレゼンテーション(第2の管理単位)も考慮に入れるとすると、セグメントは第3の管理単位とも言える。
 属性@ContentSwitchingAlignmentCycleの値と候補となるタイミングとの関係の例を図19に示す。図19において、「Segment」と記述された四角形がセグメントを示し、矢印が候補となるタイミングを示している。例えば、図19の一番上の段に示されるように、属性@ContentSwitchingAlignmentCycleが設定されていない、または、属性@ContentSwitchingAlignmentCycleの値が「1」に設定されている場合、各セグメント境界においてアダプテーションセットを越えるスイッチングが許可される。また、上から2段目に示されるように、属性@ContentSwitchingAlignmentCycleの値が「2」に設定されている場合、2セグメント毎の境界において(すなわち、1つおきのセグメント境界において)アダプテーションセットを越えるスイッチングが許可される。さらに、一番下の段に示されるように、属性@ContentSwitchingAlignmentCycleの値が「3」に設定されている場合、3セグメント毎の境界において(すなわち、2つおきのセグメント境界において)アダプテーションセットを越えるスイッチングが許可される。
 なお、タイミングに関する情報においては、このような切り替えが許可されるタイミングを、セグメント数(=周期の長さ)で表すように説明したが、この周期の長さをセグメント数以外の情報で表すようにしてもよい。例えば、時間(例えば秒)によりこの周期の長さを表すようにしてもよい。なお、周期の長さ以外の情報で、切り替えが許可されるタイミングを表すようにしてもよい。例えば、切り替えが許可されるタイミングを再生時刻(例えばISOBMFFのMovie TimeやMedia Time)やセグメント番号等により表すようにしてもよい。
 切り替えが許可されるタイミングを周期の長さ、特に、セグメント数により指定することにより、この情報量を低減させることができる。また、再生側に、切り替えが許可されるタイミングを、複雑な演算等を必要とせずに、より容易に把握させることができる。
   <アライン>
 このような候補となるタイミングにおいて、切り替え元のデータと切り替え先のデータとの間で再生時刻が一致している(アラインされている)ようにしてもよい。例えば、切り替えのタイミングの候補として指定されるセグメント境界がアラインされているようにしてもよい。
 セグメント境界がアラインされていれば、再生を行う装置において、このような切り替えのタイミングに関する情報に基づいて切り替え(スイッチング)の制御を行うようにすることにより、アダプテーションを越えた切り替えであっても、シームレスな切り替えを行うことができる。
 なお、切り替えのタイミング(セグメント境界)において、切り替え元のコンテンツデータと切り替え先のコンテンツデータとがアラインされていなくてもよい。例えば、切り替え前後のデータが切り替えのタイミングにおいて再生時刻に不連続がある場合、データをバッファすることによって再生時刻の微調整を行うようにしてもよい。また、例えば、データをアラインさせるのではなく、ダブルバッファ構成にしてデコード後のデータを滑らかに接続する処理を行うことによって切り替え前後の再生時刻を揃えるようにしてもよい。
 ただし、切り替えタイミングにおいてデータをアラインさせておくことにより、より容易かつ高速にシームレスな切り替えを行うことができる。
   <タイミングに関する情報の設定>
 なお、以上のタイミングに関する情報は、任意の管理単位に設定することができる。例えば、属性@ContentSwitchingAlignmentCycle(タイミングに関する情報)を、アダプテーションセット(第1の管理単位)に設定することができるようにしてもよいし、リプレゼンテーション(第2の管理単位)に設定することができるようにしてもよいし、その両方に設定することができるようにしてもよい。
 タイミングに関する情報をアダプテーションセット(第1の管理単位)に設定する場合、そのアダプテーションセットに属するリプレゼンテーションに共通なタイミングに関する情報を設定することができ、情報量の増大を抑制することができる。また、タイミングに関する情報をリプレゼンテーション(第2の管理単位)に設定する場合、切り替えについて、より詳細な制御を行うことができる。
 また、タイミングに関する情報として、切り替えを推奨するタイミングを指定する情報を設定するようにしてもよいし、切り替えを推奨しないタイミングを指定する情報を設定するようにしてもよいし、切り替えを禁止するタイミングを指定する情報を設定するようにしてもよい。
  <切り替えに関する情報の例1>
 次に、以上のような切り替えに関する情報(切り替え先に関する情報とタイミングに関する情報)の適用例について説明する。最初に、図20に示されるような構成のMPDに対して切り替えに関する情報を設定する場合について説明する。
 図20の例のMPDの場合、アダプテーションセット(Adaptation Set(a1))のリプレゼンテーション(a1r1)において、2.8MHzのDSDロスレスストリームのMP4ファイルが管理され、アダプテーションセット(a2)のリプレゼンテーション(a2r1)において、5.6MHzのDSDロスレスストリームのMP4ファイルが管理されている。リプレゼンテーション(a1r1)においては、2.8MHzのDSDロスレスストリームの5GOBが1セグメント(Segment)とされており、1セグメントの再生時間は約2.322秒となっている。このリプレゼンテーション(a1r1)とリプレゼンテーション(a2r1)との間でセグメント境界をアラインさせるには、リプレゼンテーション(a2r1)の1セグメントの再生時間を約2.322秒とすればよく、そのためには、リプレゼンテーション(a2r1)において、5.6MHzのDSDロスレスストリームの10GOBを1セグメント(Segment)とすればよい。このようにすることにより、図20において矢印で示されるように、各セグメント境界がアラインされる。つまり、これらのリプレゼンテーション間であれば、任意のセグメント境界において、シームレスな切り替えを行うことができる。
 図21は、図20の場合のMPDの記述例を示す図である。図21の例の場合、アダプテーションセットを超える切り替えに関する情報は、リプレゼンテーションに設定されている。
 図21において下線で示されるように、リプレゼンテーション(a1r1)において、属性@ContentSwitchingDestinationIdに値「a2r1」が設定されている。つまり、切り替え先に関する情報として、リプレゼンテーション(a2r1)が切り替え先の候補に設定されている。また、そのリプレゼンテーション(a1r1)において、属性@ContentSwitchingAlignmentCycleに値「1」が設定されている。つまり、切り替えのタイミングに関する情報として、1周期分のセグメント数「1」が設定されている。つまり、この場合、リプレゼンテーション(a1r1)から見て、切り替え先の候補はリプレゼンテーション(a2r1)であり、全てのセグメント境界においてその切り替えが許可される。
 また、リプレゼンテーション(a2r1)において、属性@ContentSwitchingDestinationIdに値「a1r1」が設定されている。つまり、切り替え先に関する情報として、リプレゼンテーション(a1r1)が切り替え先の候補に設定されている。また、そのリプレゼンテーション(a2r1)において、属性@ContentSwitchingAlignmentCycleに値「1」が設定されている。つまり、切り替えのタイミングに関する情報として、1周期分のセグメント数「1」が設定されている。つまり、この場合、リプレゼンテーション(a2r1)から見て、切り替え先の候補はリプレゼンテーション(a1r1)であり、全てのセグメント境界においてその切り替えが許可される。
 図20を参照して説明したように、これらのリプレゼンテーション間において各セグメント境界はアラインされているので、図21のMPDに従って切り替えを行うことにより、シームレスな切り替えを行うことができる。
 図22は、図20の場合のMPDの記述例を示す図である。図21の例の場合、アダプテーションセットを超える切り替えに関する情報は、アダプテーションセットに設定されている。
 図22において下線で示されるように、アダプテーションセット(a1)において、属性@ContentSwitchingDestinationIdに値「a2」が設定されている。つまり、切り替え先の候補としてアダプテーションセット(a2)が指定されている。また、そのアダプテーションセット(a1)において、属性@ContentSwitchingAlignmentCycleに値「1」が設定されている。つまり、切り替えのタイミングに関する情報として、1周期分のセグメント数「1」が設定されている。つまり、この場合、アダプテーションセット(a1)から見て、切り替え先の候補はアダプテーションセット(a2)のリプレゼンテーションであり、全てのセグメント境界においてその切り替えが許可される。
 また、アダプテーションセット(a2)において、属性@ContentSwitchingDestinationIdに値「a1」が設定されている。つまり、切り替え先の候補としてアダプテーションセット(a1)が指定されている。また、そのアダプテーションセット(a1)において、属性@ContentSwitchingAlignmentCycleに値「1」が設定されている。つまり、切り替えのタイミングに関する情報として、1周期分のセグメント数「1」が設定されている。つまり、全てのセグメント境界においてアダプテーションセットを超えた切り替えが許可されている。
 図20を参照して説明したように、これらのアダプテーションセット間において各セグメント境界はアラインされているので、図21または図22のMPDに従って切り替えを行うことにより、シームレスな切り替えを行うことができる。
  <切り替えに関する情報の例2>
 アダプテーションセットを超えた切り替えが許可されるアダプテーションセットにより管理されるコンテンツデータの符号化方式は、互いに異なっていてもよい。例えば、図23に示されるように、アダプテーションセット(Adaptation Set(a1))のリプレゼンテーションにおいて、64fsの2.8MHzのDSDロスレスストリームのMP4ファイルが管理され、アダプテーションセット(a2)のリプレゼンテーションにおいて、fs(44.1kHz)のAACストリームのMP4ファイルが管理されてもよい。
 このように符号化方式が異なる場合であっても、セグメント境界をアラインすることは可能である。例えば、アダプテーションセット(a1)のリプレゼンテーションにおいて、DSDロスレスストリームの10GOBを1セグメント(Segment)とすると、1セグメントの再生時間は4096×32×10/64=約4.644秒となる。このアダプテーションセット(a1)のリプレゼンテーションとアダプテーションセット(a2)のリプレゼンテーションとの間でセグメント境界をアラインさせるには、アダプテーションセット(a2)のリプレゼンテーションにおいても1セグメントの再生時間を約4.644秒とすればよい。
 例えば、DSDは44.1kHzの倍数のサンプリング周波数を持ち、fs=44.1kHzとすると、64fsと表せる。通常、ビデオと同時に再生されるAACのサンプリング周波数は48kHzであることが一般的だが、ここでは、AACのサンプリング周波数をfs=44.1kHzとする。上述した約4.644秒の再生時間に相当する、サンプリング周波数fs=44.1kHzのAACのaudio frame数は、(4096x32x10x10/64fs)*(fs/1024)=200である。よって、AACのSegmentを200個のAAC AudioFrameで構成すれば、DSDロスレスストリームのセグメントとアラインさせることができる(図23の矢印)。つまり、これらのリプレゼンテーション間であれば、任意のセグメント境界において、シームレスな切り替えを行うことができる。
 図24は、図23の場合のMPDの記述例を示す図である。図24の例の場合、アダプテーションセットを超える切り替えに関する情報は、アダプテーションセットに設定されている。
 図24において下線で示されるように、この場合、アダプテーションセット(a1)において、属性@ContentSwitchingDestinationIdに値「a2」が設定されている。つまり、切り替え先に関する情報として、アダプテーションセット(a2)が切り替え先の候補に設定されている。また、そのアダプテーションセット(a1)において、属性@ContentSwitchingAlignmentCycleに値「1」が設定されている。つまり、切り替えのタイミングに関する情報として、1周期分のセグメント数「1」が設定されている。つまり、この場合、アダプテーションセット(a1)から見て、切り替え先の候補はアダプテーションセット(a2)であり、全てのセグメント境界においてその切り替えが許可される。
 また、アダプテーションセット(a2)において、属性@ContentSwitchingDestinationIdに値「a1」が設定されている。つまり、切り替え先に関する情報として、アダプテーションセット(a1)が切り替え先の候補に設定されている。また、そのアダプテーションセット(a2)において、属性@ContentSwitchingAlignmentCycleに値「1」が設定されている。つまり、切り替えのタイミングに関する情報として、1周期分のセグメント数「1」が設定されている。つまり、この場合、アダプテーションセット(a2)から見て、切り替え先の候補はアダプテーションセット(a1)であり、全てのセグメント境界においてその切り替えが許可される。
 図23を参照して説明したように、これらのアダプテーションセット間において各セグメント境界はアラインされているので、図24のMPDに従って、任意のセグメント境界において切り替えを行うことにより、シームレスな切り替えを行うことができる。
  <切り替えに関する情報の例3>
 さらに、切り替え先の候補は複数であってもよい。また、一部のタイミング(一部のセグメント境界)においてのみが切り替えのタイミングの候補とされるようにしてもよい。例えば、一部のセグメント境界のみアラインされるようにしてもよい。
 例えば、図25に示されるMPDの場合、アダプテーションセット(Adaptation Set(a1))のリプレゼンテーション(a1r1)においては、2.8MHzのDSDロスレスストリームのMP4ファイルが管理され、アダプテーションセット(a2)のリプレゼンテーション(a2r1)においては、5.6MHzのDSDロスレスストリームのMP4ファイルが管理されている。さらに、アダプテーションセット(a3)のリプレゼンテーション(a3r1)においては、48kHz,16bitのLPCM(Linear Pulse Code Modulation)のMP4ファイルが管理され、リプレゼンテーション(a3r2)においては、48kHz,24bitのLPCM(Linear Pulse Code Modulation)のMP4ファイルが管理される。
 そして、図25に示されるように、リプレゼンテーション(a1r1)とリプレゼンテーション(a2r1)との間では、全てのセグメント境界においてアラインされている。また、リプレゼンテーション(a3r1)とリプレゼンテーション(a3r2)との間でも、全てのセグメント境界においてアラインされている。そして、リプレゼンテーション(a1r1)およびリプレゼンテーション(a2r1)において4セグメント毎、リプレゼンテーション(a3r1)およびリプレゼンテーション(a3r2)において5セグメント毎に、これらすべてのリプレゼンテーションの間でセグメント境界がアラインされている。
 アダプテーションセット(a3)と、アダプテーションセット(a1)やアダプテーションセット(a2)との間では、セグメントの長さ(再生時間)が互いに異なる。このような場合、両アダプテーションのセグメントの長さの最小公倍数において、セグメント境界がアラインする。例えば、アダプテーションセット(a1)やアダプテーションセット(a2)のセグメントの長さが、アダプテーションセット(a3)のセグメントの長さの4分の5倍であるとすると、図25に示されるように、アダプテーションセット(a1)やアダプテーションセット(a2)において4セグメント毎、アダプテーションセット(a3)において5セグメント毎にセグメント境界がアラインする。
 これらのリプレゼンテーション間であれば、以上のようなアラインされたセグメント境界において切り替えを行うことにより、シームレスな切り替えを行うことができる。
 図26は、図25の場合のMPDの記述例を示す図である。図26の例の場合、アダプテーションセットを超える切り替えに関する情報は、アダプテーションセットに設定されている。
 図26において下線で示されるように、アダプテーションセット(a1)において、属性@ContentSwitchingDestinationIdに値「a2 a3」が設定され、属性@ContentSwitchingAlignmentCycleに値「1 4」が設定されている。つまり、この場合、アダプテーションセット(a1)からみて、切り替え先の候補は、アダプテーションセット(a2)とアダプテーションセット(a3)である。また、アダプテーションセット(a2)への切り替えのタイミングの候補は全セグメント境界であり、アダプテーションセット(a3)への切り替えのタイミングの候補は4つおきのセグメント境界である。
 また、アダプテーションセット(a2)において、属性@ContentSwitchingDestinationIdに値「a1 a3」が設定され、属性@ContentSwitchingAlignmentCycleに値「1 4」が設定されている。つまり、アダプテーションセット(a2)からみて、切り替え先の候補は、アダプテーションセット(a1)とアダプテーションセット(a3)である。また、アダプテーションセット(a1)への切り替えのタイミングの候補は全セグメント境界であり、アダプテーションセット(a3)への切り替えのタイミングの候補は4つおきのセグメント境界である。
 図27は、この場合のMPDの記述例を示す図である。図27に示されるMPDの記述例は、図25の構成に対応する。図27において下線で示されるように、この場合、アダプテーションセット(a3)において、属性@ContentSwitchingDestinationIdに値「a1 a2」が設定され、属性@ContentSwitchingAlignmentCycleに値「5 5」が設定されている。つまり、アダプテーションセット(a3)からみて、切り替え先の候補は、アダプテーションセット(a1)とアダプテーションセット(a2)である。また、アダプテーションセット(a1)またはアダプテーションセット(a2)への切り替えのタイミングの候補は5つおきのセグメント境界である。
 あらかじめスイッチングを想定してコンテンツを制作できる場合は、図23の例のように、各オーディオストリーム固有のオーディオフレーム(オーディオアクセスユニット、オーディオフレームとも呼ばれる。MP4のシステム層からは1MP4サンプルとして参照されることが多い。)の公倍数でセグメントを構成することにより、セグメント境界を同時刻に合わせることができる。図23の例では、1セグメントの時間長が約4.6秒と適切な長さで構成できているが、これはDSDロスレスストリームのブロック長が、AACのオーディオフレーム長を考慮して設計されているためである。
 しかしながら、一般的には、オーディオフレームの公倍数で1セグメントを構成すると、1セグメントが数秒以上と長くなってしまう場合がある。ランダムアクセスの観点ではセグメント時間長は約3秒乃至4秒程度以下にするのが望ましく、ユースケースによっては、1セグメントをオーディオフレームの公倍数で構成できない場合がある。 図25の例ではランダムアクセスの利便性向上のため、セグメント長を約3秒乃至4秒程度に制限しているため、DSDとLPCMで1セグメント長が異なっている。
 しかしながら、セグメント長はアダプテーションセット内で固定であるという性質から、ある周期でセグメント境界が一致する箇所が発生する。このようにある時間周期で、シームレススイッチングを実現できる必要条件を満たすセグメント境界が発生する。
 そこで、この箇所をプレーヤが即座にわかる属性を、上述したようにMPDに設けるようにすることにより、シームレスな切り替えを行うことができるようになる。
  <MPDの構成と記述例4>
 なお、単にセグメント長の公倍数がスイッチング可能箇所であるならば、MPDに記載されたセグメントデュレーション(Segment duration)の情報を用いてアダプテーションセット間でのスイッチングを実現することは不可能ではない。例えば、MPDにはMultipleSegmentBaseInformation elementが定義されており、@duration属性が存在する。しかしながら、属性@durationの説明には、デュレーション(duration)の値は厳密な値ではなく、概算値であるとの説明がある(ISO/IEC23009-1:2014;”If present, specifies the constant approximate Segment duration.”)。このように、MPDにあるデュレーションの情報だけから、時間軸上でセグメント境界が完全に一致しているか否かの判定をすることができない。
 加えて、アダプテーションセット間のスイッチングを許容することにより、コンテンツ制作者や配信側が望まないスイッチングや、操作性に問題があるスイッチングを抑制する機能が求められることが考えられる。これまでストリームのスイッチングはアダプテーションセット内で制限されていたため、コンテンツ制作者や配信側は、プレーヤがどのようなスイッチングを行うかを想定することが出来ていた。しかしながら、アダプテーションセット間のスイッチングまで許容すると、コンテンツ制作者や配信側が想定しないスイッチングが出来てしまう可能性がある。
 そこで、上述した拡張属性(切り替え先に関する情報やタイミングに関する情報)を、このような、配信側が想定しないスイッチングの抑制に利用するようにしてもよい。つまり、具体的には、上述した拡張属性(切り替え先に関する情報やタイミングに関する情報)により、アラインされたセグメント境界の内、一部の境界におけるスイッチングのみを許可するようにしてもよい。
 例えば、図28の例においては、図20の場合と同様に、全てのリプレゼンテーション間において、全てのセグメント境界がアラインされている。したがって、全てのセグメント境界においてスイッチングを許可することもできるが、図28に矢印で示されるように、その内の一部のセグメント境界においてのみスイッチングを許可するようにしてもよい。さらに、例えば1番目のセグメントと2番目のセグメントとの間のセグメント境界のように、一部のリプレゼンテーション間でのみ(例えばAACのリプレゼンテーション間でのみ)スイッチングを許可するようにすることもできる。図29にこのMPDの記述例を示す。図29において下線部分に示されるように、この場合、スイッチングを許可するセグメント境界が、一部のセグメント境界に制限されている。
 例えば、この図28のセグメント構成において、全てのセグメント境界でアダプテーションセット間のスイッチングを行うと、約4.6秒ごとにDSDロスレスデコーダとAACデコーダの切り替えが発生する可能性がある。符号化方式が異なるデコーダの切り替え時にはリセットや初期設定が必要になり、あまり頻繁にスイッチングすると、プレーヤのハードウエアの性能等によっては、操作性低下(応答性の悪化)や再生品質が低減する可能性がある。つまり、アダプテーションセット「内」でのスイッチングを考慮してセグメント長を規定した場合、それが必ずしもアダプテーションセット「間」のスイッチング可能な箇所と一致するとは限らない。
 そこで、 アダプテーションセット間で全てのセグメント境界がアラインされている場合においても、アダプテーションセット間でのスイッチングが可能なセグメント境界を、上述した切り替えに関する情報やタイミングに関する情報等の拡張属性でプレーヤに伝えることにより、プレーヤは、アダプテーションセット間のスイッチングの可否をより高速に判定することができるようになる。また、上述したようにスイッチング可能なセグメント境界が制限される(低減する)ので、プレーヤの操作性や再生品質の低減を抑制しながらシームレスな切り替えを行うことができるようになる。
 なお、以上の拡張属性を解釈することができない従来のプレーヤは、MPDに含まれるその拡張属性を読み飛ばすことができる。従来のプレーヤは、従来通りアダプテーションセット内のスイッチングしか行わないので、この拡張属性を読み飛ばしても、MPDの記述に従って、コンテンツデータの再生を正しく行うことができる。すなわち、上述した属性(第1の管理単位を越える切り替えに関する情報)を拡張する本技術を用いることにより、互換性を維持したまま新しいユーザインタフェース(UI)を提供することができる。
  <配信システム>
 次に、以上のような本技術を適用するシステムについて説明する。図30は、本技術を適用した情報処理システムの一態様である配信システムの構成の一例を示すブロック図である。図30に示される配信システム500は、画像や音声などのデータ(コンテンツ)を配信するシステムである。配信システム500において、ファイル生成装置501、配信サーバ502、および再生端末503は、ネットワーク504を介して互いに通信可能に接続されている。
 ファイル生成装置501は、本技術を適用した情報処理装置の一態様であり、音声データを格納するMP4ファイルやMPDのファイル(MPDファイルとも称する)の生成に関する処理を行う装置である。例えば、ファイル生成装置501は、音声データを生成し、生成した音声データを格納するMP4ファイルやそのMP4ファイルを管理するMPDファイルを生成し、生成したそれらのファイルを配信サーバ502に供給する。
 配信サーバ502は、本技術を適用した情報処理装置の一態様であり、MPEG-DASHを用いたコンテンツデータの配信サービス(すなわち、MPDファイルを用いたMP4ファイルの配信サービス)に関する処理を行うサーバである。例えば、配信サーバ502は、ファイル生成装置501から供給されたMPDファイルやMP4ファイルを取得して管理し、MPEG-DASHを用いた配信サービスを提供する。例えば、配信サーバ502は、再生端末503からの要求に応じて、MPDファイルを再生端末503提供する。また、配信サーバ502は、そのMPDファイルに基づく再生端末503からの要求に応じて、要求されたMP4ファイルを再生端末503に供給する。
 再生端末503は、本技術を適用した情報処理装置の一態様であり、音声データの再生に関する処理を行う装置である。例えば、再生端末503は、MPEG-DASHに従って配信サーバ502に対してMP4ファイルの配信を要求し、その要求に応じて供給されたMP4ファイルを取得する。より具体的には、再生端末503は、配信サーバ502からMPDファイルを取得し、そのMPDファイルの情報に従って、所望のコンテンツデータを格納するMP4ファイルを配信サーバ502から取得する。再生端末503は、その取得したMP4ファイルをデコードし、音声データを再生する。
 ネットワーク504は、任意の通信網であり、有線通信の通信網であってもよいし、無線通信の通信網であってもよいし、それらの両方により構成されるようにしてもよい。また、ネットワーク504が、1の通信網により構成されるようにしてもよいし、複数の通信網により構成されるようにしてもよい。例えば、インターネット、公衆電話回線網、所謂3G回線や4G回線等の無線移動体用の広域通信網、WAN(Wide Area Network)、LAN(Local Area Network)、Bluetooth(登録商標)規格に準拠した通信を行う無線通信網、NFC(Near Field Communication)等の近距離無線通信の通信路、赤外線通信の通信路、HDMI(登録商標)(High-Definition Multimedia Interface)やUSB(Universal Serial Bus)等の規格に準拠した有線通信の通信網等、任意の通信規格の通信網や通信路がネットワーク504に含まれるようにしてもよい。
 ファイル生成装置501、配信サーバ502、再生端末503は、それぞれ、ネットワーク504に通信可能に接続されており、このネットワーク504を介して互いに情報の授受を行うことができる。ファイル生成装置501、配信サーバ502、再生端末503は、ネットワーク504に対して、有線通信により接続されるようにしてもよいし、無線通信により接続されるようにしてもよいし、その両方により接続されるようにしてもよい。
 なお、図30において、配信システム500の構成として、ファイル生成装置501、配信サーバ502、および再生端末503は、1台ずつ示されているが、これらの数は、それぞれ任意であり、互いに同一でなくてもよい。例えば、配信システム500において、ファイル生成装置501、配信サーバ502、再生端末503は、それぞれ、単数であってもよいし、複数であってもよい。
  <ファイル生成装置>
 図31は、ファイル生成装置501の主な構成例を示すブロック図である。図31に示されるように、ファイル生成装置501は、オーディオストリーム生成部511、コンテンツファイル生成部512、MPD生成部513、および通信部514を有する。
 オーディオストリーム生成部511は、コンテンツデータのストリームの生成に関する処理を行う。例えば、オーディオストリーム生成部511は、入力されたオーディオアナログ信号(音声信号とも称する)を変調したり、A/D変換したり、符号化したりして、オーディオデジタルデータ(音声データとも称する)のストリームであるオーディオストリームを生成し、それをコンテンツファイル生成部512に供給する。
 なお、このオーディオストリーム生成部511によるオーディオアナログ信号に対する信号処理の内容は任意である。例えば、変調や符号化を採用する場合、その変調方式や符号化方式は任意である。例えば、オーディオストリーム生成部511は、オーディオアナログ信号から、DSDロスレスストリーム、AACストリーム、LPCMのストリーム等を生成することができる。
 コンテンツファイル生成部512は、オーディオストリーム生成部511から供給されるコンテンツデータを格納するファイル(コンテンツファイル)の生成に関する処理を行う。例えば、コンテンツファイル生成部512は、オーディオストリーム生成部511からコンテンツデータとして供給されるオーディオストリームを格納するコンテンツファイルであるMP4ファイルを生成し、それをMPD生成部513や通信部514に供給する。
 なお、このコンテンツファイル生成部512が生成するコンテンツファイルの仕様は任意である。例えば、コンテンツファイル生成部512は、DSDロスレスストリーム、AACストリーム、LPCMのストリーム等を格納するMP4ファイルを生成することができる。もちろん、コンテンツファイル生成部512がMP4ファイル以外のコンテンツファイルを生成するようにしてもよい。
 MPD生成部513は、コンテンツファイル生成部512が生成したコンテンツファイルの管理情報の生成に関する処理を行う。例えば、MPD生成部513は、コンテンツファイル生成部512から供給されるMP4ファイルについてのMPDファイルを生成し、それを通信部514に供給する。MPD生成部513は、このMPDファイルの生成の際に、上述した本技術を適用し、上述した拡張属性を用いて、アダプテーションセットを越える切り替えに関する情報をMPDに設定する。
 通信部514は、ネットワーク504を介した他の装置との通信に関する処理を行う。例えば、通信部514は、供給されたMPDファイルやMP4ファイルを配信サーバ502に供給する。
 図31に示されるように、MPD生成部513は、ピリオド設定部521、アダプテーションセット設定部522、リプレゼンテーション設定部523、セグメント設定部524、スイッチング先指定情報設定部525、タイミング指定情報設定部526、およびファイル生成部527を有する。
 ピリオド設定部521は、MPDのピリオド(Period)の設定に関する処理を行う。アダプテーションセット設定部522は、MPDのアダプテーションセット(Adaptation Set)の設定に関する処理を行う。リプレゼンテーション設定部523は、MPDのリプレゼンテーション(Representation)の設定に関する処理を行う。セグメント設定部524は、MPDのセグメント(Segment)の設定に関する処理を行う。スイッチング先指定情報設定部525は、再生するMP4ファイルのアダプテーションセットを越えるスイッチングのスイッチング先に関する情報の設定に関する処理を行う。タイミング指定情報設定部526は、再生するMP4ファイルのアダプテーションセットを越えるスイッチングのタイミングに関する情報の設定に関する処理を行う。ファイル生成部527は、MPDファイルの生成に関する処理を行う。
  <配信用データ生成処理の流れ>
 次に、配信システム500のファイル生成装置501において実行される配信用データ生成処理の流れの例を、図32のフローチャートを参照して説明する。ファイル生成装置501は、コンテンツデータのMP4ファイルやMPDファイルを生成する際に、この配信用データ生成処理を行う。
 配信用データ生成処理が開始されると、ファイル生成装置501のオーディオストリーム生成部511は、ステップS501において、オーディオアナログ信号から複数種類のオーディオストリームを生成する。例えば、オーディオストリーム生成部511は、オーディオアナログ信号をΔΣ変調してDSDデータを生成し、さらに、そのDSDデータを上述した新たなDSD可逆圧縮符号化方式で符号化し、DSDロスレスストリームを生成する。また、オーディオストリーム生成部511は、LPCMのストリームやAACのストリーム等も生成することができる。
 ステップS502において、コンテンツファイル生成部512は、ステップS501において生成されたオーディオストリームを格納するコンテンツファイル(例えばMP4ファイル)を生成する。
 ステップS503において、MPD生成部513は、MPDファイル生成処理を実行し、ステップS502において生成されたコンテンツファイル(MP4ファイル)を管理するMPDファイルを生成する。
 ステップS504において、通信部514は、ステップS502において生成されたコンテンツファイルや、ステップS503において生成されたMPDファイルを配信サーバ502に供給(アップロード)する。
 ステップS504の処理が終了すると、配信用データ生成処理が終了する。
  <MPDファイル生成処理の流れ>
 次に、図33のフローチャートを参照して図32のステップS503において実行されるMPDファイル生成処理の流れの例を説明する。
 MPDファイル生成処理が開始されると、MPD生成部513のピリオド設定部521は、ステップS502において生成されたコンテンツファイル(MP4ファイル)について、ステップS511において、ピリオドを設定する。ステップS512において、アダプテーションセット設定部522は、アダプテーションセットを設定する。ステップS513において、リプレゼンテーション設定部523は、リプレゼンテーションを設定する。
 ステップS514において、セグメント設定部524は、セグメント境界を適宜揃えて(アラインさせて)セグメントを設定する。なお、このセグメント境界のアラインは、上述したように全てのセグメント境界において行う必要は無い。つまり、セグメント設定部524は、一部のセグメント境界についてのみアラインさせるようにしてもよい。どのようにセグメント境界をアラインさせるかは、例えば、各符号化方式等の仕様や、ユーザ等の指示等の、任意の情報に基づいて決定される。
 ステップS515において、スイッチング先指定情報設定部525は、アダプテーションセットを越えたスイッチングのスイッチング先として許可するアダプテーションセットやリプレゼンテーション等の任意の管理単位を指定するスイッチング先指定情報を設定する。なお、このスイッチング先指定情報は、上述した切り替え先に関する情報であり、本技術を適用した情報である。つまり、スイッチング先指定情報設定部525は、例えば、本技術を適用した拡張属性@ContentSwitchingDestinationIdを、このスイッチング先指定情報として設定する。
 なお、スイッチング先指定情報は、例えばアダプテーションセットやリプレゼンテーション等の任意の管理単位に設定することができる。スイッチング先指定情報設定部525は、例えば、MP4ファイルの各種情報、ステップS514において設定されたセグメント境界のアライン、ユーザ等の指示等の、任意の情報に基づいてスイッチング先として許可する管理単位を決定し、スイッチング先指定情報を設定する。
 ステップS516において、タイミング指定情報設定部526は、アダプテーションセットを越えたスイッチングを許可するタイミングを指定するタイミング指定情報を設定する。なお、このタイミング指定情報は、上述した切り替えのタイミングに関する情報であり、本技術を適用した情報である。つまり、タイミング指定情報設定部526は、例えば、本技術を適用した拡張属性@ContentSwitchingAlignmentCycleを、このタイミング指定情報として設定する。
 なお、このスイッチング先指定情報は、例えばアダプテーションセットやリプレゼンテーション等の任意の管理単位に設定することができる。タイミング指定情報設定部526は、例えば、MP4ファイルの各種情報、ステップS514において設定されたセグメント境界のアライン、ユーザ等の指示等の、任意の情報に基づいてアダプテーションセットを越えたスイッチングを許可するタイミングを決定し、タイミング指定情報を設定する。
 ステップS517において、ファイル生成部527は、ステップS511乃至ステップS516において行われた各種設定を反映したMPDファイルを生成する。MPDファイルが生成されると、MPDファイル生成処理が終了し、処理は図32に戻る。
 以上のように各処理を実行することにより、ファイル生成装置501は、本技術を適用した拡張属性を有するMPDファイルを生成することができる。すなわち、ファイル生成装置501は、本技術を適用した切り替えに関する情報を設定することができる。これにより、アダプテーションセットを越えるシームレスな切り替えを容易に実現することができ、コンテンツデータをより安定的に伝送することができる。
  <再生端末>
 図34は、再生端末503の主な構成例を示すブロック図である。図33に示されるように、再生端末503は、MPD取得部551、パース部552、コンテンツファイル取得部553、ストリーム抽出部554、復号部555、および出力部556を有する。
 MPD取得部551は、MPDファイルの取得に関する処理を行う。例えば、MPD取得部551は、配信サーバ502に対してMPDファイルを要求し、その配信サーバ502から供給されるMPDファイルを取得する。MPD取得部551は、取得したMPDファイルをパース部552に供給する。
 パース部552は、MPDファイルのパース(解析)に関する処理を行う。例えば、パース部552は、MPD取得部551から供給されるMPDファイルをパースし、そのMPDファイルの記述に応じた制御情報を生成し、それをコンテンツファイル取得部553に供給する。
 コンテンツファイル取得部553は、コンテンツファイルの取得に関する処理を行う。例えば、コンテンツファイル取得部553は、パース部552から供給される制御情報に基づいて、配信サーバ502からコンテンツファイルとしてMP4ファイルを取得し、その取得したMP4ファイルをストリーム抽出部554に供給する。
 ストリーム抽出部554は、ストリームの抽出に関する処理を行う。例えば、ストリーム抽出部554は、コンテンツファイル取得部553から供給されるMP4ファイルからオーディオストリームを抽出する。例えば、そのオーディオストリームを復号して出力する場合、ストリーム抽出部554は、抽出したオーディオストリームを復号部555に供給する。オーディオストリームのまま出力する場合、ストリーム抽出部554は、抽出したオーディオストリームを出力部556に供給する。
 復号部555は、コンテンツデータが符号化された符号化データの復号に関する処理を行う。例えば、復号部555は、ストリーム抽出部554から供給されたオーディオストリームを復号する等して、オーディオアナログ信号を復元する。復号部555は、復元したオーディオアナログ信号を出力部556に供給する。なお、復号部555がオーディオストリームに対して行う処理は、そのストリームに対して正しい方法である限り任意である。例えば、復号だけでなく、復調やD/A変換等も行われるようにしてもよい。
 例えば、オーディオストリームは、DSDロスレスストリームであり、復号部555は、そのDSDロスレスストリームを復号してDSDデータを復元し、さらに復調してオーディオアナログ信号を復元する。また、例えば、オーディオストリームは、LPCMのストリームであってもよいし、AACのストリームであってもよい。復号部555は、それらのデータに応じた処理を行い、オーディオアナログ信号を復元する。
 出力部556は、コンテンツデータの出力に関する処理を行う。例えば、出力部556は、スピーカを有し、復号部555から供給されるオーディオアナログ信号をそのスピーカから出力する。また、例えば、出力部556は、アナログ信号の出力端子を有し、復号部555から供給されるオーディオアナログ信号を、その出力端子を介して他の装置に供給する。さらに、例えば、出力部556は、デジタル信号の出力端子を有し、ストリーム抽出部554から供給されたオーディオストリームを、その出力端子を介して例えば外部デコーダ561等の他の装置に供給する。つまり、オーディオストリームは、再生端末503の外部に設けられた外部デコーダ561において復号することもできる。
 また、図34に示されるように、パース部552は、スイッチング先指定情報解析部571と、タイミング指定情報解析部572とを有する。スイッチング先指定情報解析部571は、MPDファイルに含まれるスイッチング先指定情報(再生するコンテンツデータのアダプテーションセットを越える切り替えの、切り替え先に関する情報)の解析に関する処理を行う。タイミング指定情報解析部572は、MPDファイルに含まれるタイミング指定情報(再生するコンテンツデータのアダプテーションセットを越える切り替えのタイミングに関する情報)の解析に関する処理を行う。
 また、図34に示されるように、コンテンツファイル取得部553は、スイッチング制御部581を有する。スイッチング制御部581は、再生するコンテンツデータのアダプテーションセットを越えるスイッチングの制御に関する処理を行う。例えば、スイッチング制御部581は、スイッチング先指定情報解析部571やタイミング指定情報解析部572の解析結果に基づいて(スイッチング先指定情報解析部571やタイミング指定情報解析部572の解析結果が反映された制御情報に基づいて)このスイッチングの制御を行う。
  <再生処理の流れ>
 次に、配信システム500の再生端末503において実行される再生処理の流れの例を、図35のフローチャートを参照して説明する。再生処理が開始されると、再生端末503のMPD取得部551は、ステップS531において、例えばユーザ等により指定されたMPDファイルを配信サーバ102から取得する。
 ステップS532において、パース部552は、パース処理を実行して、ステップS531において取得されたMPDファイルをパースし、そのパース結果を反映した制御情報を生成する。ステップS533において、コンテンツファイル取得部553は、コンテンツファイル取得処理を実行して、ステップS532のパース結果(制御情報)や、ネットワーク504の空き帯域等の通信状況などに応じて、所望のコンテンツに関するMP4ファイルを、配信サーバ102から取得する。
 ステップS534において、ストリーム抽出部554は、ステップS533において取得されたMP4ファイルからオーディオストリームを抽出する。ステップS535において、復号部555は、そのオーディオストリームを復号するか否かを判定する。復号すると判定された場合、処理はステップS536に進む。ステップS536において、復号部555は、ステップS534において抽出されたオーディオストリームを復号し、オーディオアナログ信号を復元する。オーディオストリームが復号されると処理はステップS537に進む。また、ステップS535において、オーディオストリームを復号しないと判定された場合、処理はステップS537に進む。
 ステップS537において、出力部556は、オーディオストリームまたはオーディオアナログ信号を出力する。ステップS537の処理が終了すると、再生処理が終了する。
  <パース処理の流れ>
 次に、図35のステップS532において実行されるパース処理の流れの例を、図36のフローチャートを参照して説明する。
 パース処理が開始されると、パース部552は、ステップS541においてMPDファイルを解析する。ステップS542において、スイッチング先指定情報解析部571は、MPDファイルに含まれるスイッチング先指定情報を解析する。ステップS543において、タイミング指定情報解析部572は、MPDファイルに含まれるタイミング指定情報を解析する。
 ステップS543の処理が終了するとパース処理が終了し、処理は図35に戻る。以上のようにパース部552は、MPDファイルを解析し、さらに、本技術を適用した拡張属性(@ContentSwitchingDestinationIdや@ContentSwitchingAlignmentCycle等)を解析することができる。
  <コンテンツファイル取得処理の流れ>
 次に、図35のステップS533において実行されるコンテンツファイル取得処理の流れの例を、図37のフローチャートを参照して説明する。コンテンツファイル取得処理が開始されると、コンテンツファイル取得部553は、ステップS551において、パース結果や通信状況などに応じて、取得するコンテンツファイル(MP4ファイル)を選択する。取得するMP4ファイルが決定すると、ステップS552において、コンテンツファイル取得部553は、そのMP4ファイルの取得を開始する。
 ステップS553において、スイッチング制御部581は、取得するMP4ファイルを切り替えるか否かを判定する。例えば伝送帯域の変動などに応じて、取得するMP4ファイルを切り替えると判定された場合、処理はステップS554に進む。
 ステップS554において、スイッチング制御部581は、スイッチング先指定情報の解析結果に基づいて、スイッチング先(すなわち、切り替え後のMP4ファイル)を選択する。ステップS555において、スイッチング制御部581は、タイミング指定情報の解析結果に基づいて、スイッチングを行うタイミングを決定し、そのタイミングにおいて、取得するMP4ファイルを切り替える。
 ステップS555の処理が終了すると、処理はステップS556に進む。また、ステップS553において、取得するMP4ファイルを切り替えないと判定された場合、処理はステップS556に進む。
 ステップS556において、コンテンツファイル取得部553は、MP4ファイルの取得を終了するか否かを判定する。まだ、所望のコンテンツのMP4ファイルの取得が終了しておらず、MP4ファイルの取得を終了しないと判定された場合、処理はステップS553に戻り、それ以降の処理が繰り返される。そして、ステップS556において、所望のコンテンツに関するMP4ファイルの取得が終了したと判定された場合、コンテンツファイル取得処理が終了する。
 以上のように各処理を実行することにより、再生端末503は、本技術を適用した拡張属性を有するMPDファイルに応じてコンテンツファイルを取得することができる。すなわち、再生端末503は、そのMPDファイルに応じて、アダプテーションセットを越えるシームレスな切り替えを容易に実現することができ、コンテンツデータをより安定的な伝送を実現することができる。
 <3.第2の実施の形態>
  <スイッチングの方針の制御>
 第1の実施の形態において説明した本技術を適用することにより、アダプテーションセット間でのスイッチングが許容され、ストリームの切り替えに大きな自由度が生まれる。その自由度により、コンテンツ制作側・配信側が望まないスイッチングの組み合わせも発生する可能性がある。
 例えば、ビデオとオーディオが同程度のビットレートになる場合、伝送路帯域の変動によってビデオとオーディオのどちらをスイッチングすることも考えられる。例えば、オーディオ重視のアプリケーションの場合、伝送帯域が下がった時にはまずビデオのレートを下げて、オーディオはなるべく品質を維持すべきという方針も考えられる。このように、単にビットレート値のみでストリームを選択するのではなく、送り出し側が想定するストリームの優先度に従ってスイッチングすることで、映像と音を合わせた状態での品質を高く維持することができる可能性がある。
 また、別のケースとしては、サンプリング周波数2.8MHzのDSDはすべてのプレーヤが再生可能だが、5.6MHzのDSDは一部のプレーヤのみが対応しているアプリケーションがあるとする。そのとき、DSD5.6MHzからDSD2.8MHzへのスイッチングはプレーヤが自動に行えるが、その逆はユーザが明示的に指示しない限りスイッチングされないようにしたいという方針も考えられる。
 また、図38に示される例のように、DSD5.6MHzからDSD2.8MHzへのスイッチングはプレーヤが自動に行えるが、DSD5.6MHzからLPCMへのスイッチングは抑制したいという方針も考えられる。
 そこで配信側が望むスイッチングの優先順位やスイッチングの方向性(ある方向にはスイッチングし易いがその逆はしにくい)等をプレーヤ側に伝え、プレーヤでのスイッチングを制御するようにしてもよい。
  <切り替え優先順の設定>
 このような切り替えの方針に関する情報として、再生するデータの第1の管理単位を越える切り替えの、優先順に関する情報を設定するようにしてもよい。そして、この優先順に関する情報は、第1の管理単位の優先順を示す情報であるようにしてもよい。
 このような切り替えの優先順に関する情報を設定することにより、プレーヤ側におけるスイッチングの方針を、配信側から制御することができる。したがって、プレーヤ側において配信側が意図しないスイッチングが行われることを抑制することができる。これにより、例えば映像データばかりが伝送される等の、配信側が想定していなかった不安定なコンテンツデータの伝送を抑制することができる。つまり、配信側の意図したとおりに、コンテンツデータを伝送することができる。すなわち、コンテンツデータをより安定的に伝送することができる。
 なお、再生するデータをコンテンツデータ(オーディオストリーム)とし、管理情報をMPEG-DASHのMPDとし、第1の管理単位をアダプテーションセット(Adaptation Set)としてもよい。このようにすることにより、MPEG-DASHを用いた配信をより安定的に行うことができる。
 例えば、この優先順に関する情報として、属性@stabilityRankingを設定するようにしてもよい。この属性@stabilityRankingは、スイッチングの許容性を示す属性であり、例えば、アダプテーションに対して設定するようにしてもよい。例えば、この属性@stabilityRankingには、アダプテーションセットのスイッチングの許容度を示す自然数が設定される。この属性の値が大きくなる程、スイッチングがより許容されることを示し、ストリームのスイッチングを行う際は、この値がより大きい(より下位の)アダプテーションセットから先にスイッチングするように制御される。つまり、この属性の値が「1」のアダプテーションセットが、最もスイッチングさせたくないアダプテーションセットであることを示す。
  <優先ルールの例>
 このような優先順に関する情報に基づく切り替えは、例えば、以下のような規則で行われるようにしてもよい。
 伝送帯域を確保できずビットレートを下げる必要が発生したとき、まずアダプテーションセット内でのリプレゼンテーション間の切り替えを行う。このとき、選択・再生中のストリームのうち、上述の属性@stabilityRankingの値が大きい(下位の)アダプテーションセットから順にリプレゼンテーションの切り替えを行う。
 また、リプレゼンテーションのスイッチでは伝送帯域を確保できず、アダプテーションセットを越えた切り替えが必要な場合、選択・再生中のストリームのうち、属性@stabilityRankingの値が最も大きい(下位の)アダプテーションセットを、属性@stabilityRankingの値がより大きい(より下位の)アダプテーションセットに切り替える。
 さらに、属性@stabilityRankingが最も大きい(下位の)アダプテーションセットをこれ以上スイッチングでき無い場合は、属性@stabilityRankingの値が次に大きい(1つ上の順位の)他のアダプテーションセットのスイッチングを試みる。
 なお、以上においては、属性@stabilityRankingの値を自然数としたが、この属性@stabilityRankingに値「0」を設定することができるようにしてもよい。その場合、値「0」は、単純に優先度を示す自然数とは異なる特別な値として利用するようにしてもよい。
  <属性@stabilityRankingの付与例1>
 例えば、図39のAに示されるようなピリオド構成のMPDファイルの各アダプテーションセットに対して、DSDの配信を優先させるように属性@stabilityRankingを割り当てた例を、図39のBに示す。図39のBの表に示されるように、この場合、DSDのストリームをできるだけ切り替えないように、DSDストリームのアダプテーションセットに対してより若い番号(「1」や「2」)が設定されている。
 例えば、このような構成のMPDに対してプレーヤが、伝送(可能)帯域に合わせて、再生するビデオデータおよびオーディオデータを、そのビットレートの合計が多い順に選択する場合、図40のAの表に示されるような優先順で各データが選択される。したがって、このような優先順では、DSDのストリームを優先的に選択できていない。しかも、低ビットレートのAACのストリームが、高ビットレートのDSDのストリームより優先して選択される等、画音品質の逆転が起きている。
 これに対して、図39のBの表に示されるような値の属性@stabilityRankingを各アダプテーションセットに設定して、それをスイッチング制御に利用することにより、プレーヤは、図40のBの表に示されるような優先順で各データを選択することができる。なお、図40のBの表において、括弧内の数字は、そのアダプテーションセットの優先順(属性@stabilityRankingの値)を示している。
 より具体的に説明すると、まず、オーディオで最上位のもの、ビデオで最上位のものを選び、次に、属性@stabilityRankingの値が大きい(下位の)ビデオのアダプテーションセット内においてリプレゼンテーションのスイッチングをする。次に、属性@stabilityRankingの値が大きい(下位の)ビデオの、アダプテーションセットを越えたスイッチングを行う。ビデオの属性@stabilityRankingの値をこれ以上大きくできなくなる(順位を下げられなくなる)と、次は、オーディオの、アダプテーションセットを越えたスイッチングを行うようにし、オーディオの属性@stabilityRankingの値を大きくしていく(順位を下げていく)。
 このような手順で選択することにより、図40のBに示されるような優先順の選択を行うことができる。このような優先順で伝送路帯域に収まるオーディオとビデオの組み合わせを選択することで、最も高音質なDSD5.6を出来るだけ維持したスイッチングを実現することができる。
 この場合のMPDの記述例を図41に示す。図41には、オーディオデータのアダプテーションセットについてのみ記述例が示されている。図41に示されるように、この場合、各アダプテーションセットに対して、属性@ContentSwitchingDestinationIdと、属性@stabilityRankingとが設定されている。
  <属性@stabilityRankingの付与例2>
 例えば、図39のAに示されるようなピリオド構成のMPDファイルの各アダプテーションセットに対して、ビデオの配信を優先させるように属性@stabilityRankingを割り当てた例を、図42のAに示す。図42のAの表に示されるように、この場合、ビデオのストリームをできるだけ切り替えないように、ビデオのストリーム(4K/30p 20Mbps, 4K/30p 10Mbps)のアダプテーションセットに対して、DSDのアダプテーションセットよりも若い番号(「1」)が設定されている。
 このような値の属性@stabilityRankingを各アダプテーションセットに設定して、それをスイッチング制御に利用することにより、プレーヤは、図42のBの表に示されるような優先順で各データを選択することができる。なお、図42のBの表において、括弧内の数字は、そのアダプテーションセットの優先順(属性@stabilityRankingの値)を示している。
 より具体的に説明すると、まず、オーディオで最上位のもの、ビデオで最上位のものを選び、次に、属性@stabilityRankingの値が大きい(下位の)DSD5.6のリプレゼンテーションのスイッチングをしようとするが、1本しか無いのでビデオのリプレゼンテーションのスイッチを行う。これ以上リプレゼンテーションのスイッチングを行うことができなくなると、属性@stabilityRankingの値がより大きな(より下位の)オーディオのアダプテーションセットを越えたスイッチングを行う。そして、次に、属性@stabilityRankingの値が大きい(下位の)AACのリプレゼンテーションのスイッチングが行われる。そしてまたこれ以上オーディオのアダプテーションセットを越えたスイッチングおよびオーディオのリプレゼンテーションのスイッチングを行うことができなくなると、ビデオのアダプテーションセットを越えたスイッチングを行う。
 このような手順で選択することにより、図42のBに示されるような優先順の選択を行うことができる。このような優先順で伝送路帯域に収まるオーディオとビデオの組み合わせを選択することで、4K動画を出来るだけ維持したスイッチングを実現することができる。
  <ファイル生成装置>
 この場合のファイル生成装置501の主な構成例を図43に示す。この場合も、ファイル生成装置501は、第1の実施の形態(図31)の場合と基本的に同様の構成を有する。ただし、この場合、MPD生成部513は、選択優先順情報設定部701を有する。
 選択優先順情報設定部701は、選択優先順情報の設定に関する処理を行う。この選択優先順情報は、コンテンツデータのアダプテーションセットを越える切り替えの、優先順に関する情報であり、例えばアダプテーションセットの優先順を示す情報であり、例えば、本技術を適用した拡張属性@stabilityRanking等を含む。
  <MPDファイル生成処理の流れ>
 この場合も配信用データ生成処理は、第1の実施の形態(図32)の場合と同様に実行される。図44のフローチャートを参照して、この場合のMPDファイル生成処理の流れの例を説明する。
 この場合も、ステップS571乃至ステップS574の各処理は、図33のステップS511乃至ステップS514の各処理と同様に実行される。
 ステップS575において、選択優先順情報設定部701は、各アダプテーションセットの選択優先順を決定し、その選択優先順を示す選択優先順情報を設定する。選択優先順情報設定部701は、例えば、MP4ファイルの各種情報、ユーザ等の指示等の、任意の情報に基づいてこの選択優先順を決定する。
 ステップS576において、ファイル生成部527は、ステップS571乃至ステップS575において行われた各種設定を反映したMPDファイルを生成する。MPDファイルが生成されると、MPDファイル生成処理が終了し、処理は図32に戻る。
 以上のように各処理を実行することにより、ファイル生成装置501は、本技術を適用した拡張属性を有するMPDファイルを生成することができる。すなわち、ファイル生成装置501は、本技術を適用した切り替えに関する情報を設定することができる。これにより、配信側の意図しないスイッチングを抑制し、配信側の意図したとおりに、コンテンツデータを伝送することができる。すなわち、コンテンツデータをより安定的に伝送することができる。
  <再生端末>
 この場合の再生端末503の主な構成例を図45に示す。この場合も、再生端末503は、第1の実施の形態(図34)の場合と基本的に同様の構成を有する。ただし、この場合、パース部552は、選択優先順情報解析部711を有する。選択優先順情報解析部711は、選択優先順情報の解析に関する処理を行う。
 例えば、コンテンツファイル取得部553のスイッチング制御部581は、選択優先順情報解析部711の解析結果に基づいて(選択順優先情報解析部711の解析結果が反映された制御情報に基づいて)このスイッチングの制御を行う。
  <パース処理の流れ>
 この場合も再生処理は、第1の実施の形態(図35)の場合と同様に実行される。図46のフローチャートを参照して、この場合のパース処理の流れの例を説明する。
 パース処理が開始されると、パース部552は、ステップS581においてMPDファイルを解析する。ステップS582において、選択優先順情報解析部711は、MPDファイルに含まれる選択優先順情報を解析する。
 ステップS582の処理が終了するとパース処理が終了し、処理は図35に戻る。以上のようにパース部552は、MPDファイルを解析し、さらに、本技術を適用した拡張属性(@stabilityRanking等)を解析することができる。
  <コンテンツファイル取得処理の流れ>
 次に、図47のフローチャートを参照して、この場合のコンテンツファイル取得処理の流れの例を説明する。この場合も、ステップS591乃至ステップS593の各処理は、図37のステップS551乃至ステップS553の各処理と同様に実行される。
 ステップS594において、スイッチング制御部581は、スイッチング処理を実行し、選択優先順情報に基づいて取得するコンテンツファイル(MP4ファイル)を切り替える。ステップS594の処理が終了すると処理はステップS595に進む。
 ステップS595の処理は、図37のステップS556の処理と同様に実行される。つまり、ステップS595において所望のコンテンツに関するMP4ファイルの取得が終了したと判定された場合、コンテンツファイル取得処理が終了する。
  <スイッチング処理の流れ>
 次に、図47のステップS594において実行されるスイッチング処理の流れの例を、図48のフローチャートを参照して説明する。
 スイッチング処理が開始されると、スイッチング制御部581は、ステップS601において、選択優先順が最下位のアダプテーションセットを処理対象とする。
 ステップS602において、スイッチング制御部581は、より低ビットレートのリプレゼンテーションへの切り替えが可能であるか否かを判定する。切り替えが不可能であると判定された場合、処理はステップS603に進む。
 ステップS603において、スイッチング制御部581は、異なるメディアタイプのアダプテーションセット内で、より低いビットレートのリプレゼンテーションへの切り替えが可能か否かを判定する。切り替えが可能であると判定された場合、処理はステップS604に進む。なお選択再生中のアダプテーションセットがビデオ、オーディオ、字幕などと3個以上あり、切り替えが可能なアダプテーションセットが2個以上存在した場合は、選択優先順の低いアダプテーションセット内のリプレゼンテーションから切り替えていく。
 また、ステップS602において、切り替え可能であると判定された場合、処理はステップS604に進む。ステップS604において、スイッチング制御部581は、その切り替え可能なリプレゼンテーションの切り替えを行う。ステップS604の処理が終了すると、処理はステップS607に進む。
 また、ステップS603において、切り替えが不可能であると判定された場合、処理はステップS605に進む。ステップS605において、スイッチング制御部581は、同じメディアタイプでより下位のアダプテーションセットが存在するか否かを判定する。存在すると判定された場合、処理はステップS606に進む。
 ステップS606において、スイッチング制御部581は、そのアダプテーションセットを切り替え、その中で最も高ビットレートのリプレゼンテーションを選択する。ステップS606の処理が終了すると、処理はステップS607に進む。
 ステップS607において、スイッチング制御部581は、切り替え後の状態において、伝送帯域を満たすか否かを判定する。伝送帯域が不足していると判定された場合、処理はステップS602に戻り、それ以降の処理が繰り返される。
 また、ステップS607において、伝送帯域を満たすと判定された場合、スイッチング処理が終了し、処理は図47に戻る。
 また、ステップS605において、同じメディアタイプでより下位のアダプテーションセットが存在しないと判定された場合、処理はステップS608に進む。ステップS608において、スイッチング制御部581は、全てのメディアタイプについて処理したか否かを判定する。例えば、ビデオは処理したがオーディオは未処理である等、未処理のメディアタイプが存在すると判定された場合、処理はステップS609に進む。
 ステップS609において、スイッチング制御部581は、メディアタイプが異なり、選択優先順が次に高いアダプテーションセットを処理対象とする。ステップS609の処理が終了すると、処理はステップS602に戻り、それ以降の処理が繰り返される。
 ステップS608において、全てのメディアタイプについて処理が行われたと判定された場合、スイッチング処理が終了し、処理は図47に戻る。
 以上のように各処理を実行することにより、再生端末503は、本技術を適用した拡張属性を有するMPDファイルに応じてコンテンツファイルを取得することができる。すなわち、再生端末503は、そのMPDファイルに応じて、配信側の意図したとおりにスイッチングを行うことができる。つまり、配信側の意図したとおりのコンテンツデータの伝送を実現することができ、コンテンツデータのより安定的な伝送を実現することができる。
 <4.第3の実施の形態>
  <切り替え優先グループの設定>
 第2の実施の形態において説明した、アダプテーションセットの優先順に関する情報を階層化するようにしてもよい。例えば、優先順に関する情報として、さらに、第1の管理単位のグループの優先順を示す情報を設定するようにしてもよい。このように優先順に関する情報を階層化することにより、より多様なスイッチングの制御を行うことができるようになり、配信側が意図しないスイッチングが行われることをより抑制することができる。これにより、配信側のより意図したとおりに、コンテンツデータを伝送することができ、コンテンツデータをより安定的に伝送することができる。
 なお、再生するデータをコンテンツデータ(オーディオストリーム)とし、管理情報をMPEG-DASHのMPDとし、第1の管理単位をアダプテーションセット(Adaptation Set)としてもよい。このようにすることにより、MPEG-DASHを用いた配信をより安定的に行うことができる。
 例えば、この優先順に関する情報として、属性@stabilityRankingGroupを設定するようにしてもよい。この属性@stabilityRankingGroupは、スイッチングの観点での、アダプテーションセットのグループ化とそのグループに対する優先度を示す情報である。この属性@stabilityRankingGroupは、「0」または正の整数の値を取ることができる。この属性@stabilityRankingGroupの値が大きいほど、高品質なアダプテーションセットのグループであると配信側が想定していることを表す。
 なお、値「0」は特別な意味を持ち、通常は選択されないが再生継続のために用意された特別なアダプテーションセットであることを表す。この属性@stabilityRankingGroupの値が「0」のアダプテーションセットは、この属性@stabilityRankingGroupの値が「1」のアダプテーションセットのグループに所属する。つまり、属性@stabilityRankingGroupの値が「0」であることは、そのアダプテーションセットが、グループ1の中で特別な意味を持つアダプテーションセットであることを示す。
 また、この属性@stabilityRankingGroupの値が「0」のアダプテーションセットは、上述した属性@stabilityRankingの値によらず、再生開始時と通常再生中には選択されるべきではないコンテンツであることを表す。これに対してこの属性@stabilityRankingGroupの値が「0」以外の値のとき、属性@stabilityRankingの値はグループ内での相対順位であるとみなす。この属性@stabilityRankingGroupが存在しない(設定されていない)場合、アダプテーションセットのグループ化は省略されている。プレーヤは属性@stabilityRankingに従って選択の優先度を決定する。
  <属性@stabilityRankingGroupの付与例1>
 属性@stabilityRankingと属性@stabilityRankingGroupの両方を用いる場合について説明する。
 上述のように、属性@stabilityRankingGroupは、スイッチングの観点からアダプテーションセットの分類と順位付けを行う属性である。例えばビデオやオーディオ等のメディアタイプ(Media Type)毎に、属性@stabilityRankingGroupが同じ値を持つアダプテーションセット(つまり同一グループのアダプテーションセット)の中から、再生に使われるアダプテーションセットが選択されることが、配信側の意図になっている。属性@stabilityRankingGroupの値が大きいほど、選択される優先度が高いアダプテーションセットであることを表す。属性@stabilityRankingGroupが同じ値を持つアダプテーションセットの、そのグループ内での優先順位は属性@stabilityRankingで決まる。
 例えば、各アダプテーションセットの属性@stabilityRankingの値と、属性@stabilityRankingGroupの値とが、図49のAに示される表のように設定されるとする。図49のAの例の場合、属性@stabilityRankingGroupの値は、「1」乃至「3」の3種類存在する。つまり、各アダプテーションセットは、図49のBに示されるように、グループG1、グループG2、グループG3の3つのグループに分けられる。属性@stabilityRankingGroupの値は大きいほど優先度が高いので、この場合、グループG3のアダプテーションセットの優先度が最も高く、グループG1のアダプテーションセットの優先度が最も低い。
 属性@stabilityRankingは、全てのアダプテーションセットを一列に並べてスイッチングの許容度を順位付けしたものであるが、属性@stabiltyRankingGroupは、そのシーケンシャルな順位に区切りを設定するようなものである。このような属性により、同時に再生されることが適切なアダプテーションセットのセットをプレーヤに伝えることで、より配信側の意図を反映させたスイッチングを実現することができる。
  <属性@stabilityRankingGroupの付与例2>
 属性@stabilityRankingと属性@stabilityRankingGroupの付与の他の例を説明する。例えば、属性@stabilityRankingと属性@stabilityRankingGroupの値を図50のAに示される表のように設定するとする。この場合、属性@stabilityRankingGroupの値として「0」と「1」の2値が用いられている。したがって、全てのアダプテーションセットは、図50のBに示されるように1つのグループG1に属する。ただし、AACのアダプテーションセットと、Still Pictureのアダプテーションセットの属性@stabilityRankingGroupは、値「0」が設定されている。
 このような値の属性@stabilityRankingと属性@stabilityRankingGroupを各アダプテーションセットに設定して、それをスイッチング制御に利用することにより、プレーヤは、図50のCの表に示されるような優先順で各データを選択することができる。なお、図50のCの表において、括弧内の数字は、そのアダプテーションセットの属性@stabilityRankingの値を示している。
 上述のようにStill Pictureのアダプテーションセットの属性@stabilityRankingGroupの値は「0」であるので、この場合、図50のCの表に示されるように、DSD5.6やDSD2.8のオーディオデータが選択されている間は、Still Pictureへの切り替えは行わずに、オーディオデータが切り替えられている。
  <属性@stabilityRankingGroupの付与例3>
 また、例えば、属性@stabilityRankingと属性@stabilityRankingGroupの値を図51のAに示される表のように設定するとする。この場合、属性@stabilityRankingGroupの値として「0」、「1」、「2」の3値が用いられている。したがって、アダプテーションセットは、図51のBに示されるようにグループG1とグループG2に分けられる。ただし、Still Pictureのアダプテーションセットの属性@stabilityRankingGroupの値は「0」である。
 このような値の属性@stabilityRankingと属性@stabilityRankingGroupを各アダプテーションセットに設定して、それをスイッチング制御に利用することにより、プレーヤは、図51のCの表に示されるような優先順で各データを選択することができる。なお、図51のCの表において、括弧内の数字は、そのアダプテーションセットの属性@stabilityRankingの値を示している。
 この場合、図51のCに示されるように、グループG2に属するアダプテーションセットが優先的に選択される。
  <属性@stabilityRankingGroupの付与例4>
 また、例えば、属性@stabilityRankingと属性@stabilityRankingGroupの値を図52のAに示される表のように設定するとする。この場合、属性@stabilityRankingGroupの値として「1」、「2」、「3」の3値が用いられている。したがって、アダプテーションセットは、図52のBに示されるようにグループG1、グループG2、グループG3に分けられる。この場合、図52のCに示されるように、グループG3に属するアダプテーションセットが優先的に選択される。
  <属性@stabilityRankingGroupの付与例5>
 また、例えば、図39のAに示されるようなピリオド構成を有するMPDの各アダプテーションセットに対して、属性@stabilityRankingと属性@stabilityRankingGroupの値を図53のAに示される表のように設定するとする。この場合、属性@stabilityRankingGroupの値として「0」と「1」の2値が用いられている。
 このような値の属性@stabilityRankingと属性@stabilityRankingGroupを各アダプテーションセットに設定して、それをスイッチング制御に利用することにより、プレーヤは、図53のBの表に示されるような優先順で各データを選択することができる。なお、図53のBの表において、括弧内の数字は、そのアダプテーションセットの属性@stabilityRankingの値を示している。
 図53の例の場合、オーディオデータはAACのアダプテーションセットの属性@stabilityRankingGroupの値が「0」に設定され、ビデオデータはStill Pictureのアダプテーションセットの属性@stabilityRankingGroupの値が「0」に設定されている。このように、ビデオやオーディオ等のメディアタイプ毎に最終避難的なアダプテーションセット(なるべく選択するべきではない、フェイルセーフ的なアダプテーションセット)を明示しておくことで、例えばDSD5.6+Still Pictureといった音と映像の品質の差が大きすぎて配信側にとって望ましくない組み合わせを選択することを抑制することができ、よりバランスのとれたスイッチングを実現することができる。
 もちろん、上述した属性@stabilityRankingと属性@stabilityRankingGroupの値は、例を示したものであり、属性@stabilityRankingと属性@stabilityRankingGroupの値はこれらの例に限定されない。
  <ファイル生成装置>
 この場合のファイル生成装置501の主な構成例を図54に示す。この場合も、ファイル生成装置501は、第2の実施の形態(図43)の場合と基本的に同様の構成を有する。ただし、この場合、MPD生成部513は、グループ情報設定部901をさらに有する。
 グループ情報設定部901は、グループ情報の設定に関する処理を行う。このグループ情報は、選択優先順に関するアダプテーションセットをグループ化したり、グループの優先順を示したりする情報であり、例えば、本技術を適用した拡張属性@stabilityRankingGroup等を含む。
  <MPDファイル生成処理の流れ>
 この場合も配信用データ生成処理は、第1の実施の形態(図32)の場合と同様に実行される。図55のフローチャートを参照して、この場合のMPDファイル生成処理の流れの例を説明する。
 この場合も、ステップS621乃至ステップS624の各処理は、図33のステップS511乃至ステップS514の各処理と同様に実行される。
 ステップS625において、グループ情報設定部901は、同時に再生されることが許可されるアダプテーションセットの組を決定し、アダプテーションセットのグループを設定する。この処理により、例えば、図56のAに示されるように、各アダプテーションセットが2つのグループに分類される。
 ステップS626において、グループ情報設定部901は、各グループ間の選択優先順を決定し、グループ情報を設定する再生を継続するための最低限のストリームがある場合、グループ情報の値を「0」に設定する。この処理により、例えば、図56のBに示されるように、各グループに「G1」、「G2」といった選択優先順が付与される。また、例えば、Still Pictureのアダプテーションセットの属性@stabilityRankingGroupの値が「0」に設定される。
 ステップS627において、グループ情報設定部901は、グループ内における各アダプテーションセットの選択優先順を決定する。この処理により、例えば、図56のCに示されるように、各グループ内において、各アダプテーションセットの選択優先順が設定される。図56のCにおいて括弧内の数字が、各アダプテーションセットに割り当てられたグループ内の優先順を示している。
 ステップS628において、選択優先順情報設定部701は、全体における各アダプテーションセットの選択優先順を決定し、選択優先順情報を設定する。この処理により、例えば、図56のDに示されるように、各アダプテーションセットの選択優先順が設定される。図56のDにおいて括弧内の数字が、各アダプテーションセットに割り当てられた選択優先順を示している。
 ステップS629において、ファイル生成部527は、ステップS621乃至ステップS628において行われた各種設定を反映したMPDファイルを生成する。MPDファイルが生成されると、MPDファイル生成処理が終了し、処理は図32に戻る。
 以上のように各処理を実行することにより、ファイル生成装置501は、本技術を適用した拡張属性を有するMPDファイルを生成することができる。すなわち、ファイル生成装置501は、本技術を適用した選択優先順に関する情報やグループに関する情報を設定することができる。これにより、より配信側の意図に沿った、よりバランスのとれたスイッチングを実現することができる。
  <再生端末>
 この場合の再生端末503の主な構成例を図57に示す。この場合も、再生端末503は、第2の実施の形態(図45)の場合と基本的に同様の構成を有する。ただし、この場合、パース部552は、グループ情報解析部911をさらに有する。グループ情報解析部911は、グループ情報の解析に関する処理を行う。
 例えば、コンテンツファイル取得部553のスイッチング制御部581は、グループ情報解析部911の解析結果に基づいて(グループ情報解析部911の解析結果が反映された制御情報に基づいて)このスイッチングの制御を行う。
  <パース処理の流れ>
 この場合も再生処理は、第1の実施の形態(図35)の場合と同様に実行される。図58のフローチャートを参照して、この場合のパース処理の流れの例を説明する。
 パース処理が開始されると、パース部552は、ステップS641においてMPDファイルを解析する。ステップS642において、選択優先順情報解析部711は、MPDファイルに含まれる選択優先順情報を解析する。ステップS643において、グループ情報解析部911は、MPDファイルに含まれるグループ情報を解析する。
 ステップS643の処理が終了するとパース処理が終了し、処理は図35に戻る。以上のようにパース部552は、MPDファイルを解析し、さらに、本技術を適用した拡張属性(@stabilityRankingや@stabilityRankingGroup等)を解析することができる。
  <コンテンツファイル取得処理の流れ>
 次に、図59のフローチャートを参照して、この場合のコンテンツファイル取得処理の流れの例を説明する。この場合も、ステップS651乃至ステップS653の各処理は、図47のステップS591乃至ステップS593の各処理と同様に実行される。
 ステップS654において、スイッチング制御部581は、スイッチング処理を実行し、選択優先順情報やグループ情報に基づいて取得するコンテンツファイル(MP4ファイル)を切り替える。ステップS654の処理が終了すると処理はステップS655に進む。
 ステップS655の処理は、図47のステップS595の処理と同様に実行される。つまり、ステップS655において所望のコンテンツに関するMP4ファイルの取得が終了したと判定された場合、コンテンツファイル取得処理が終了する。
  <スイッチング処理の流れ>
 次に、図59のステップS654において実行されるスイッチング処理の流れの例を、図60のフローチャートを参照して説明する。
 スイッチング処理が開始されると、スイッチング制御部581は、ステップS661において、グループ内で選択優先順が最下位のアダプテーションセットを処理対象とする。
 ステップS662において、スイッチング制御部581は、より低ビットレートのリプレゼンテーションへの切り替えが可能であるか否かを判定する。切り替えが不可能であると判定された場合、処理はステップS663に進む。
 ステップS663において、スイッチング制御部581は、グループ内かつメディアタイプが異なるアダプテーションセット内で、より低いビットレートのリプレゼンテーションへの切り替えが可能か否かを判定する。切り替えが可能であると判定された場合、処理はステップS664に進む。なおグループ内の選択再生中のアダプテーションセットがビデオ、オーディオ、字幕などと3個以上あり、切り替えが可能なアダプテーションセットが2個以上存在した場合は、選択優先順の低いアダプテーションセット内のリプレゼンテーションから切り替えていく。
 また、ステップS662において、切り替えが可能であると判定された場合、処理はステップS664に進む。ステップS664において、スイッチング制御部581は、その切り替え可能なリプレゼンテーションの切り替えを行う。ステップS664の処理が終了すると、処理はステップS667に進む。
 また、ステップS663において、切り替えが不可能と判定された場合、処理はステップS665に進む。ステップS665において、スイッチング制御部581は、グループ内かつ同じメディアタイプでより下位のアダプテーションセットが存在するか否かを判定する。存在すると判定された場合、処理はステップS666に進む。
 ステップS666において、スイッチング制御部581は、そのアダプテーションセットを切り替え、その中で最も高ビットレートのリプレゼンテーションを選択する。ステップS666の処理が終了すると、処理はステップS667に進む。
 ステップS667において、スイッチング制御部581は、切り替え後の状態において、伝送帯域を満たすか否かを判定する。伝送帯域が不足していると判定された場合、処理はステップS662に戻り、それ以降の処理が繰り返される。
 また、ステップS667において、伝送帯域を満たすと判定された場合、スイッチング処理が終了し、処理は図59に戻る。
 また、ステップS665において、同じメディアタイプでより下位のアダプテーションセットが存在しないと判定された場合、処理はステップS668に進む。ステップS668において、スイッチング制御部581は、グループ内の全てのメディアタイプについて処理したか否かを判定する。例えば、ビデオは処理したがオーディオは未処理である等、未処理のメディアタイプが存在すると判定された場合、処理はステップS669に進む。
 ステップS669において、スイッチング制御部581は、同一グループの、メディアタイプが異なり、選択優先順が次に高いアダプテーションセットを処理対象とする。ステップS669の処理が終了すると、処理はステップS662に戻り、それ以降の処理が繰り返される。
 ステップS668において、全てのメディアタイプについて処理が行われたと判定された場合、処理は、ステップS670に進む。ステップS670において、スイッチング制御部581は、より下位のグループが存在するか否かを判定する。存在すると判定された場合、処理はステップS671に進む。
 ステップS671において、スイッチング制御部581は、グループを切り替える。そしてメディアタイプごとに、最上位のアダプテーションセットを選択する。さらに各アダプテーションセットの中で、最も高ビットレートのリプレゼンテーションを選択する。
 ステップS672において、スイッチング制御部581は、切り替え後の状態において、伝送帯域を満たすか否かを判定する。伝送帯域が不足していると判定された場合、処理はステップS661に戻り、それ以降の処理が繰り返される。
 ステップS670において、より下位のグループが存在しないと判定された場合、スイッチング処理が終了し、処理は図59に戻る。また、ステップS672において、伝送帯域を満たすと判定された場合、スイッチング処理が終了し、処理は図59に戻る。
 以上のように各処理を実行することにより、再生端末503は、本技術を適用した拡張属性を有するMPDファイルに応じてコンテンツファイルを取得することができる。すなわち、再生端末503は、そのMPDファイルに応じて、より配信側の意図に沿った、よりバランスのとれたスイッチングを実現することができる。
 <5.その他>
  <規格>
 以上においては、DSDロスレスストリームをMP4ファイルに格納し、MPEG-DASHを利用して配信する場合について説明したが、本技術はこれ以外の例にも適用することができる。例えば、本技術は、DSDロスレスストリーム以外の任意のデータにも適用することができる。また、本技術は、MP4ファイル以外の任意のファイルフォーマットに格納する場合にも適用することができる。さらに、本技術は、MPEG-DASH以外の任意の規格のデータ配信にも適用することができる。
  <本技術の適用分野>
 本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。
 例えば、本技術は、鑑賞の用に供される画像を伝送するシステムやデバイスにも適用することができる。また、例えば、本技術は、交通の用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、セキュリティの用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、スポーツの用に供されるシステムやデバイスにも適用することができる。さらに、例えば、本技術は、農業の用に供されるシステムやデバイスにも適用することができる。また、例えば、本技術は、畜産業の用に供されるシステムやデバイスにも適用することができる。さらに、本技術は、例えば火山、森林、海洋等の自然の状態を監視するシステムやデバイスにも適用することができる。また、本技術は、例えば天気、気温、湿度、風速、日照時間等を観測する気象観測システムや気象観測装置に適用することができる。さらに、本技術は、例えば鳥類、魚類、ハ虫類、両生類、哺乳類、昆虫、植物等の野生生物の生態を観測するシステムやデバイス等にも適用することができる。
  <コンピュータ>
 上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
 図61は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
 図61に示されるコンピュータ1000において、CPU(Central Processing Unit)1001、ROM(Read Only Memory)1002、RAM(Random Access Memory)1003は、バス1004を介して相互に接続されている。
 バス1004にはまた、入出力インタフェース1010も接続されている。入出力インタフェース1010には、入力部1011、出力部1012、記憶部1013、通信部1014、およびドライブ1015が接続されている。
 入力部1011は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部1012は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部1013は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部1014は、例えば、ネットワークインタフェースよりなる。ドライブ1015は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア1021を駆動する。
 以上のように構成されるコンピュータ1000では、CPU1001が、例えば、記憶部1013に記憶されているプログラムを、入出力インタフェース1010およびバス1004を介して、RAM1003にロードして実行することにより、上述した一連の処理が行われる。RAM1003にはまた、CPU1001が各種の処理を実行する上において必要なデータなども適宜記憶される。
 コンピュータ1000が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア1021に記録して適用することができる。その場合、プログラムは、リムーバブルメディア1021をドライブ1015に装着することにより、入出力インタフェース1010を介して、記憶部1013にインストールすることができる。
 また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部1014で受信し、記憶部1013にインストールすることができる。
 その他、このプログラムは、ROM1002や記憶部1013等に、あらかじめインストールしておくこともできる。
  <その他>
 なお、符号化データ(ビットストリーム)に関する各種情報は、符号化データに多重化されて伝送され又は記録されるようにしてもよいし、符号化データに多重化されることなく、符号化データと関連付けられた別個のデータとして伝送され又は記録されるようにしてもよい。ここで、「関連付ける」という用語は、例えば、一方のデータを処理する際に他方のデータを利用し得る(リンクさせ得る)ようにすることを意味する。つまり、互いに関連付けられたデータは、1つのデータとしてまとめられてもよいし、それぞれ個別のデータとしてもよい。例えば、符号化データ(画像)に関連付けられた情報は、その符号化データ(画像)とは別の伝送路上で伝送されるようにしてもよい。また、例えば、符号化データ(画像)に関連付けられた情報は、その符号化データ(画像)とは別の記録媒体(又は同一の記録媒体の別の記録エリア)に記録されるようにしてもよい。なお、この「関連付け」は、データ全体でなく、データの一部であってもよい。例えば、画像とその画像に対応する情報とが、複数フレーム、1フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられるようにしてもよい。
 また、上述したように、本明細書において、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えば符号化データとメタデータとを1つのデータにまとめるといった、複数の物を1つにまとめることを意味し、上述の「関連付ける」の1つの方法を意味する。
 また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
 また、例えば、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
 また、例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、例えば、上述したプログラムは、任意の装置において実行することができる。その場合、その装置が、必要な機能(機能ブロック等)を有し、必要な情報を得ることができるようにすればよい。
 また、例えば、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 なお、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。
 なお、本明細書において複数説明した本技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術を、他の実施の形態において説明した本技術と組み合わせて実施することもできる。また、上述した任意の本技術を、上述していない他の技術と併用して実施することもできる。
 なお、本技術は以下のような構成も取ることができる。
 (1) コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を設定する設定部
 を備える情報処理装置。
 (2) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)である
 (1)に記載の情報処理装置。
 (3) 前記切り替えに関する情報は、再生するデータの前記第1の管理単位を越える切り替えの、切り替え先に関する情報である
 (1)または(2)に記載の情報処理装置。
 (4) 前記切り替え先に関する情報はContentSwitchingDestinationIdである
 (1)乃至(3)のいずれかに記載の情報処理装置。
 (5) 前記切り替え先に関する情報は、前記切り替え先として許可する管理単位を指定する情報である
 (1)乃至(4)のいずれかに記載の情報処理装置。
 (6) 前記管理単位を指定する情報は、前記切り替え先として許可する他の前記第1の管理単位を指定する情報である
 (1)乃至(5)のいずれかに記載の情報処理装置。
 (7) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)である
 (1)乃至(6)のいずれかに記載の情報処理装置。
 (8) 前記管理単位を指定する情報は、前記切り替え先として許可する、他の前記第1の管理単位内の各データを管理する第2の管理単位を指定する情報である
 (1)乃至(7)のいずれかに記載の情報処理装置。
 (9) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)であり、
 前記第2の管理単位は、リプレゼンテーション(Representation)である
 (1)乃至(8)のいずれかに記載の情報処理装置。
 (10) 前記設定部は、前記切り替え先に関する情報を、前記管理情報の前記第1の管理単位に設定する
 (1)乃至(9)のいずれかに記載の情報処理装置。
 (11) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)であり、
 前記設定部は、前記切り替え先に関する情報を、現在の再生対象のデータを管理するアダプテーションセットに設定するように構成される
 (1)乃至(10)のいずれかに記載の情報処理装置。
 (12) 前記設定部は、前記切り替え先に関する情報を、前記管理情報の前記第1の管理単位内の各データを管理する第2の管理単位に設定する
 (1)乃至(11)のいずれかに記載の情報処理装置。
 (13) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)であり、
 前記第2の管理単位は、リプレゼンテーション(Representation)であり、
 前記設定部は、前記切り替え先に関する情報を、現在の再生対象のデータを管理するリプレゼンテーションに設定するように構成される
 (1)乃至(12)のいずれかに記載の情報処理装置。
 (14) 前記切り替えに関する情報は、再生するデータの前記第1の管理単位を越える切り替えのタイミングに関する情報である
 (1)乃至(13)のいずれかに記載の情報処理装置。
 (15) 前記タイミングに関する情報は、再生するデータの前記第1の管理単位を越える切り替えを許可するタイミングを指定する情報である
 (1)乃至(14)のいずれかに記載の情報処理装置。
 (16) 前記タイミングは、前記データの再生時間方向の管理単位である第2の管理単位の境界であり、
 前記タイミングを指定する情報は、再生するデータの前記第1の管理単位を越える切り替えを許可する前記第2の管理単位の境界を指定する情報である
 (1)乃至(15)のいずれかに記載の情報処理装置。
 (17) 前記タイミングを指定する情報は、前記タイミングを、次のタイミングまでの前記第2の管理単位の数で指定する情報である
 (1)乃至(16)のいずれかに記載の情報処理装置。
 (18) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)であり、
 前記第2の管理単位は、セグメント(Segment)である
 (1)乃至(17)のいずれかに記載の情報処理装置。
 (19) 前記タイミングにおいて、切り替え元のデータと切り替え先のデータとの間で再生時刻が一致している
 (1)乃至(18)のいずれかに記載の情報処理装置。
 (20) 前記タイミングに関する情報は、ContentSwitchingAlignmentCycleである
 (1)乃至(19)のいずれかに記載の情報処理装置。
 (21) 前記設定部は、前記タイミングに関する情報を、前記管理情報の前記第1の管理単位に設定する
 (1)乃至(20)のいずれかに記載の情報処理装置。
 (22) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)であり、
 前記設定部は、前記タイミングに関する情報を、現在の再生対象のデータを管理するアダプテーションセットに設定するように構成される
 (1)乃至(21)のいずれかに記載の情報処理装置。
 (23) 前記設定部は、前記タイミングに関する情報を、前記管理情報の前記第1の管理単位内の各データを管理する第2の管理単位に設定する
 (1)乃至(22)のいずれかに記載の情報処理装置。
 (24) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)であり、
 前記第2の管理単位は、リプレゼンテーション(Representation)であり、
 前記設定部は、前記タイミングに関する情報を、現在の再生対象のデータを管理するリプレゼンテーションに設定するように構成される
 (1)乃至(23)のいずれかに記載の情報処理装置。
 (25) 前記切り替えに関する情報は、再生するデータの前記第1の管理単位を越える切り替えの、優先順に関する情報である
 (1)乃至(24)のいずれかに記載の情報処理装置。
 (26) 前記優先順に関する情報は、前記第1の管理単位の優先順を示す情報である
 (1)乃至(25)のいずれかに記載の情報処理装置。
 (27) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)である
 (1)乃至(26)のいずれかに記載の情報処理装置。
 (28) 前記優先順に関する情報は、@stabilityRankingである
 (1)乃至(27)のいずれかに記載の情報処理装置。
 (29) 前記優先順に関する情報は、前記第1の管理単位のグループの優先順を示す情報である
 (1)乃至(28)のいずれかに記載の情報処理装置。
 (30) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)である
 (1)乃至(29)のいずれかに記載の情報処理装置。
 (31) 前記優先順に関する情報は、@stabilityRankingGroupである
 (1)乃至(30)のいずれかに記載の情報処理装置。
 (32) 前記設定部は、前記優先順に関する情報を前記第1の管理単位に設定する
 (1)乃至(31)のいずれかに記載の情報処理装置。
 (33) 前記管理情報は、MPD(Media Presentation Description)であり、
 前記第1の管理単位は、アダプテーションセット(Adaptation Set)である
 (1)乃至(32)のいずれかに記載の情報処理装置。
 (34) 前記データは、オーディオアナログ信号がΔΣ変調されたDSD(Direct Stream Digital)データが可逆符号化されて得られたDSDロスレスストリームを格納する、ISO/IEC14496に準拠したファイルフォーマットのファイルである
 (1)乃至(33)のいずれかに記載の情報処理装置。
 (35) 前記設定部の設定に基づいて前記管理情報のファイルを生成するファイル生成部をさらに備える
 (1)乃至(34)のいずれかに記載の情報処理装置。
 (36) 前記データを生成するデータ生成部をさらに備え、
 前記ファイル生成部は、前記データ生成部により生成されたデータの前記管理情報のファイルを生成するように構成される
 (1)乃至(35)のいずれかに記載の情報処理装置。
 (37) 前記ファイル生成部により生成された前記ファイルを、サーバに送信する送信部をさらに備える
 (1)乃至(36)のいずれかに記載の情報処理装置。
 (38) コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を設定する
 情報処理方法。
 (39) コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を解析する解析部と、
 前記解析部の解析結果に基づいて、再生するデータの切り替えを制御する制御部と
 を備える情報処理装置。
 (40) コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を解析し、
 その解析結果に基づいて、再生するデータの切り替えを制御する
 情報処理方法。
 500 配信システム, 501 ファイル生成装置, 502 配信サーバ, 503 再生端末, 504 ネットワーク, 511 オーディオストリーム生成部, 512 コンテンツファイル生成部, 513 MPD生成部, 514 通信部, 521 ピリオド設定部, 522 アダプテーションセット設定部, 523 リプレゼンテーション設定部, 524 セグメント設定部, 525 スイッチング先指定情報設定部, 526 タイミング指定情報設定部, 527 ファイル生成部, 551 MPD取得部, 552 パース部, 553 コンテンツファイル取得部, 554 ストリーム抽出部, 555 復号部, 556 出力部, 561 外部デコーダ, 571 スイッチング先指定情報解析部, 572 タイミング指定情報解析部, 581 スイッチング制御部, 701 選択優先順情報設定部, 711 選択優先順情報解析部, 901 グループ情報設定部, 911 グループ情報解析部, 1000 コンピュータ

Claims (20)

  1.  コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を設定する設定部
     を備える情報処理装置。
  2.  前記切り替えに関する情報は、再生するデータの前記第1の管理単位を越える切り替えの、切り替え先として許可する管理単位を指定する情報である
     請求項1に記載の情報処理装置。
  3.  前記管理単位を指定する情報は、前記切り替え先として許可する、他の前記第1の管理単位を指定する情報、または、他の前記第1の管理単位内の各データを管理する第2の管理単位を指定する情報である
     請求項2に記載の情報処理装置。
  4.  前記設定部は、前記管理単位を指定する情報を、前記管理情報の前記第1の管理単位、または、前記管理情報の前記第1の管理単位内の各データを管理する第2の管理単位に設定する
     請求項2に記載の情報処理装置。
  5.  前記切り替えに関する情報は、再生するデータの前記第1の管理単位を越える切り替えを許可するタイミングを指定する情報である
     請求項1に記載の情報処理装置。
  6.  前記タイミングは、前記データの再生時間方向の管理単位である第2の管理単位の境界であり、
     前記タイミングを指定する情報は、再生するデータの前記第1の管理単位を越える切り替えを許可する前記第2の管理単位の境界を指定する情報である
     請求項5に記載の情報処理装置。
  7.  前記タイミングを指定する情報は、前記タイミングを、次のタイミングまでの前記第2の管理単位の数で指定する情報である
     請求項6に記載の情報処理装置。
  8.  前記タイミングにおいて、切り替え元のデータと切り替え先のデータとの間で再生時刻が一致している
     請求項5に記載の情報処理装置。
  9.  前記設定部は、前記タイミングを指定する情報を、前記管理情報の前記第1の管理単位、または、前記管理情報の前記第1の管理単位内の各データを管理する第2の管理単位に設定する
     請求項5に記載の情報処理装置。
  10.  前記切り替えに関する情報は、再生するデータの前記第1の管理単位を越える切り替えの、優先順に関する情報である
     請求項1に記載の情報処理装置。
  11.  前記優先順に関する情報は、前記第1の管理単位の優先順を示す情報である
     請求項10に記載の情報処理装置。
  12.  前記優先順に関する情報は、前記第1の管理単位のグループの優先順を示す情報である
     請求項10に記載の情報処理装置。
  13.  前記設定部は、前記優先順に関する情報を前記第1の管理単位に設定する
     請求項10に記載の情報処理装置。
  14.  前記データは、オーディオアナログ信号がΔΣ変調されたDSD(Direct Stream Digital)データが可逆符号化されて得られたDSDロスレスストリームを格納する、ISO/IEC14496に準拠したファイルフォーマットのファイルである
     請求項1に記載の情報処理装置。
  15.  前記設定部の設定に基づいて前記管理情報のファイルを生成するファイル生成部をさらに備える
     請求項1に記載の情報処理装置。
  16.  前記データを生成するデータ生成部をさらに備え、
     前記ファイル生成部は、前記データ生成部により生成されたデータの前記管理情報のファイルを生成するように構成される
     請求項15に記載の情報処理装置。
  17.  前記ファイル生成部により生成された前記ファイルを、サーバに送信する送信部をさらに備える
     請求項15に記載の情報処理装置。
  18.  コンテンツのデータの再生を管理する管理情報において、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を設定する
     情報処理方法。
  19.  コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を解析する解析部と、
     前記解析部の解析結果に基づいて、再生するデータの切り替えを制御する制御部と
     を備える情報処理装置。
  20.  コンテンツのデータの再生を管理する管理情報に含まれる、再生するデータの、互いに同一のコンテンツのデータ群を管理する第1の管理単位を越える切り替えに関する情報を解析し、
     その解析結果に基づいて、再生するデータの切り替えを制御する
     情報処理方法。
PCT/JP2017/010872 2016-03-31 2017-03-17 情報処理装置および方法 WO2017169891A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018509040A JPWO2017169891A1 (ja) 2016-03-31 2017-03-17 情報処理装置および方法
US16/088,357 US20200314163A1 (en) 2016-03-31 2017-03-17 Image processing device and method thereof
CN201780019432.9A CN109155867A (zh) 2016-03-31 2017-03-17 图像处理装置及方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016-072172 2016-03-31
JP2016072172 2016-03-31

Publications (1)

Publication Number Publication Date
WO2017169891A1 true WO2017169891A1 (ja) 2017-10-05

Family

ID=59964284

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/010872 WO2017169891A1 (ja) 2016-03-31 2017-03-17 情報処理装置および方法

Country Status (4)

Country Link
US (1) US20200314163A1 (ja)
JP (1) JPWO2017169891A1 (ja)
CN (1) CN109155867A (ja)
WO (1) WO2017169891A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006222895A (ja) * 2005-02-14 2006-08-24 Sony Corp 多重化装置及び多重化方法、並びに多重化データ送受信システム
WO2014171385A1 (ja) * 2013-04-19 2014-10-23 ソニー株式会社 サーバ装置、コンテンツ提供方法及びコンピュータプログラム
WO2015001986A1 (ja) * 2013-07-02 2015-01-08 ソニー株式会社 コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム
WO2015053895A1 (en) * 2013-10-08 2015-04-16 Qualcomm Incorporated Switching between adaptation sets during media streaming

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013054797A (ja) * 2011-09-02 2013-03-21 Sony Corp 情報処理装置、および情報処理方法、並びにプログラム
JP5843751B2 (ja) * 2012-12-27 2016-01-13 株式会社ソニー・コンピュータエンタテインメント 情報処理装置、情報処理システム、および情報処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006222895A (ja) * 2005-02-14 2006-08-24 Sony Corp 多重化装置及び多重化方法、並びに多重化データ送受信システム
WO2014171385A1 (ja) * 2013-04-19 2014-10-23 ソニー株式会社 サーバ装置、コンテンツ提供方法及びコンピュータプログラム
WO2015001986A1 (ja) * 2013-07-02 2015-01-08 ソニー株式会社 コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム
WO2015053895A1 (en) * 2013-10-08 2015-04-16 Qualcomm Incorporated Switching between adaptation sets during media streaming

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"ISO/IEC 23009-1 Draft third edition 2015-07- 31", ISO/IEC, 17 August 2015 (2015-08-17), pages 1 - 15 , 20-34, Retrieved from the Internet <URL:http://www.3gpp.org/ftp/tsg_sa/wg4_codec/TSGS4_85/Docs/S4-150984.zip> [retrieved on 20170417] *

Also Published As

Publication number Publication date
JPWO2017169891A1 (ja) 2019-02-14
US20200314163A1 (en) 2020-10-01
CN109155867A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
KR101868280B1 (ko) 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기록 매체
JP6876928B2 (ja) 情報処理装置および方法
EP2897369B1 (en) Content supply device, content supply method, program, and content supply system
US9191725B2 (en) Method and apparatus for streaming video
KR100928998B1 (ko) 사용자 단말기에 멀티미디어 컨텐츠와 코덱을 제공하는적응적 멀티미디어 시스템 및 그 방법
US9042449B2 (en) Systems and methods for dynamic transcoding of indexed media file formats
CA2844648A1 (en) Method and apparatus for adaptive transcoding of multimedia stream
JP2013524603A (ja) チャンクの形態でストリーミングされたコンテンツを回復する方法
JP6439691B2 (ja) ファイル生成装置および方法、並びにコンテンツ再生装置および方法
WO2013145419A1 (ja) コンテンツデータ記録装置、コンテンツデータ記録方法、制御プログラムおよび記録媒体
CN108886626B (zh) 信息处理装置、信息处理方法以及信息处理系统
KR102137858B1 (ko) 송신 장치, 송신 방법, 수신 장치, 수신 방법 및 프로그램
US20190088265A1 (en) File generation device and file generation method
US20190103122A1 (en) Reproduction device and reproduction method, and file generation device and file generation method
EP2625874B1 (en) Apparatus and method for multimedia service
WO2017169891A1 (ja) 情報処理装置および方法
WO2018142947A1 (ja) 情報処理装置および方法
CN105122821A (zh) 服务器装置、内容提供方法以及计算机程序
WO2018142945A1 (ja) 情報処理装置および方法
WO2018079293A1 (ja) 情報処理装置および方法
US11949929B2 (en) Systems and methods for delay manifests in ABR content delivery
JP2023161219A (ja) 送信装置、受信装置及びそれらのプログラム
KR20110101512A (ko) 미디어 컨텐츠 재생 장치 및 방법

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2018509040

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17774432

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 17774432

Country of ref document: EP

Kind code of ref document: A1