JP7226335B2

JP7226335B2 - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: JP7226335B2
Application number: JP2019562790A
Authority: JP
Inventors: 充勝股; 光浩平林; 俊也浜田
Original assignee: Sony Corp; Sony Group Corp
Current assignee: Sony Corp; Sony Group Corp
Priority date: 2017-12-28
Filing date: 2018-10-23
Publication date: 2023-02-21
Anticipated expiration: 2038-10-23
Also published as: BR112020012494A2; JP2023053131A; EP3734594A4; EP3734594A1; KR20200101349A; WO2019130763A1; JPWO2019130763A1; RU2020120328A3; TW201939960A; RU2020120328A; CN111512634A; US20200321015A1

Description

本開示は、情報処理装置、情報処理方法およびプログラムに関する。

近年、インターネット上のストリーミングサービスの主流がＯＴＴ－Ｖ（Over The Top Video）となっている。この基盤技術として普及し始めているのがMPEG-DASH（Moving Picture Experts Group phase
－ Dynamic Adaptive Streaming over HTTP）である（例えば、非特許文献１参照）。

MPEG-DASHを用いて行われるオーディオコンテンツの配信においては、配信サーバがオブジェクト毎にオーディオデータを用意し（当該データを「オブジェクトオーディオデータ」と呼称する）、クライアントが伝送路の状況等に応じて最適なオブジェクトオーディオデータ群を要求することにより、適応型のストリーミング配信が実現される。

MPEG-DASH(Dynamic Adaptive Streaming over HTTP)（URL: http://standards.iso.org/ittf/PubliclyAvailableStandards/index.html）

しかし、非特許文献１に示されているMPEG-DASHの規格においては、オブジェクトオーディオデータ単位で優先度を設定することができなかった。そのため、クライアントは一度オーディオファイルを取得、換言すれば、本来不要なはずのデータを含めたファイル全体を取得した上で、オーディオファイルのオブジェクトオーディオメタデータをパースしなければならず、帯域幅を有効活用できず、またクライアントには処理のオーバーヘッドが生じるという課題があった。

そこで、本開示は、上記問題に鑑みてなされたものであり、本開示の目的とするところは、取得されたオブジェクトオーディオデータごとに優先度を設定することが可能な、新規かつ改良された情報処理装置、情報処理方法およびプログラムを提供することにある。

本開示によれば、取得されたオブジェクトオーディオデータごとに優先度を設定し、前記優先度に基づいて、１または２以上の前記オブジェクトオーディオデータから、生成されるセグメントファイルに含める前記オブジェクトオーディオデータを決定し、前記優先度に基づいて、生成された前記セグメントファイルに対し設定する新たな優先度を優先度情報として生成する処理部を備える、情報処理装置が提供される。

また、本開示によれば、取得されたオブジェクトオーディオデータごとに設定された優先度に基づいて１または２以上の前記オブジェクトオーディオデータから決定された前記オブジェクトオーディオデータを含めて生成されるセグメントファイルに対して、前記優先度に基づき新たな優先度が設定されたストリームデータを情報処理することを有する、コンピュータにより実行される情報処理方法が提供される。

また、本開示によれば、取得されたオブジェクトオーディオデータごとに設定された優先度に基づいて１または２以上の前記オブジェクトオーディオデータから決定された前記オブジェクトオーディオデータを含めて生成されるセグメントファイルに対して、前記優先度に基づき新たな優先度が設定されたストリームデータを情報処理すること、をコンピュータに実現させるためのプログラムが提供される。

以上説明したように本開示によれば、取得されたオブジェクトオーディオデータごとに優先度を設定することが可能となる。

なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。

本開示の背景を説明する図である。本開示の背景を説明する図である。本開示の背景を説明する図である。本開示の背景を説明する図である。本開示の背景を説明する図である。本実施形態に係る情報処理システムのシステム構成例を示す図である。本実施形態に係るサーバ１００の機能構成例を示すブロック図である。本実施形態に係るクライアント２００の機能構成例を示すブロック図である。優先度に基づくオーディオファイルの生成例について説明する図である。優先度に基づくオーディオファイルの生成例について説明する図である。優先度に基づくオーディオファイルの生成例について説明する図である。優先度に基づくオーディオファイルの生成例について説明する図である。優先度が時間の経過に伴って変化しない場合の、優先度情報のシグナリング例を説明する図である。優先度が時間の経過に伴って変化する場合のファイル構成を説明する図である。 MPEG-H 3D AudioでのオーディオファイルのISOBMFFを説明する図である。 ISOBMFFのBox構造を説明するための図である。 MPEG-H 3D AudioでのメタデータファイルのISOBMFF（実施例１、RAW方式）を説明する図である。 MPEG-H 3D AudioでのメタデータファイルのISOBMFF（実施例１、MHAS方式）を説明する図である。 MPEG-H 3D AudioでのメタデータファイルのISOBMFF（実施例２、RAW方式）を説明する図である。 MPEG-H 3D AudioでのメタデータファイルのISOBMFF（実施例２、MHAS方式）を説明する図である。 AAC 3D AudioでのオーディオファイルのISOBMFFを説明する図である。 AAC 3D AudioでのメタデータファイルのISOBMFF（実施例３）を説明する図である。 AAC 3D AudioでのメタデータファイルのISOBMFF（実施例４）を説明する図である。オーディオファイルとメタデータファイルの対応付け例を説明するための図である。オーディオファイルとメタデータファイルの対応付け例（実施例１）を説明する図である。オーディオファイルとメタデータファイルの対応付け例（実施例２）を説明する図である。オーディオファイルとメタデータファイルの対応付け例（実施例３）を説明する図である。オーディオファイルとメタデータファイルの対応付け例（実施例４）を説明する図である。オーディオファイルとメタデータファイルの対応付け例（実施例５）を説明する図である。ビットレートが時間の経過に伴って変化しない場合のシグナリング例（実施例１）を説明する図である。ビットレートが時間の経過に伴って変化しない場合のシグナリング例（実施例２）を説明する図である。ビットレートが時間の経過に伴って変化しない場合のシグナリング例（実施例３）を説明する図である。ビットレートが時間の経過に伴って変化しない場合のシグナリング例（実施例４）を説明する図である。ビットレートが時間の経過に伴って変化する場合のシグナリング例を説明するための図である。ビットレートが時間の経過に伴って変化する場合のシグナリング例（実施例５）を説明する図である。ビットレートが時間の経過に伴って変化する場合のシグナリング例（実施例６）を説明する図である。ビットレートが時間の経過に伴って変化する場合のシグナリング例（実施例７）を説明する図である。ビットレートが時間の経過に伴って変化する場合のシグナリング例（実施例８）を説明する図である。ディスクリプション情報のシグナリング例を説明する図である。優先度が時間の経過に伴って変化しない場合において、クライアント２００がオーディオコンテンツの再生に用いるオーディオファイルを取得するまでの処理例を示すフローチャートである。優先度が時間の経過に伴って変化しない場合において、クライアント２００がオーディオコンテンツの再生に用いるオーディオファイルを取得するまでの処理例を説明するための図である。優先度が時間の経過に伴って変化する場合において、クライアント２００がオーディオコンテンツの再生に用いるオーディオファイルを取得するまでの処理例を示すフローチャートである。優先度が時間の経過に伴って変化する場合において、クライアント２００がオーディオコンテンツの再生に用いるオーディオファイルを取得するまでの処理例を説明するための図である。サーバ１００またはクライアント２００を具現する情報処理装置９００のハードウェア構成例を示すブロック図である。 3da_meta_data()の構造を示す図である。 DSEに格納された3da_meta_data()の構造を示す図である。 DSEの構造を示す図である。 DSEにおけるdata_stream_byteに格納される3da_ancillary_dataの構造を示す図である。

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

なお、説明は以下の順序で行うものとする。
１．背景
２．構成例
３．優先度に基づくファイル生成例
４．優先度情報のシグナリング例
５．ビットレート情報のシグナリング例
６．ディスクリプション情報のシグナリング例
７．クライアント２００の処理例
８．ハードウェア構成例

＜１．背景＞
まず、本開示の背景について説明する。

MPEG－H 3D AudioおよびAAC 3D Audioは、オブジェクト毎に生成されたオーディオデータであるオブジェクトオーディオデータを扱うことができる規格である。オーディオコンテンツは、音源の波形データである複数のオブジェクトオーディオデータと、オブジェクトの位置、音の広がり、もしくは、各種エフェクト等に関する情報を含むオブジェクトメタデータによって構成される。

例えば、図１に示すように、オブジェクトメタデータと複数のオブジェクトオーディオデータ（図１においては、オブジェクトオーディオデータ１～オブジェクトオーディオデータｎが示されている）がサーバ等によってクライアントへ提供される。オブジェクトレンダラ―として機能するクライアントは、オブジェクトメタデータとオブジェクトオーディオデータを受信すると、再生環境情報（例えば、スピーカの位置または数等）に基づいてレンダリングを行い、スピーカ等の再生環境に対して波形データを提供することで、オーディオコンテンツの再生を実現する。

ここで、MPEG－H 3D AudioおよびAAC 3D Audioにおいては、全てのオブジェクトオーディオデータが必ずレンダリングされなくてもよい。これは、例えば、サーバが、レンダリングの対象外となるオブジェクトオーディオデータ自体をクライアントに提供しない、または、オブジェクトメタデータからレンダリングの対象外となるオブジェクトオーディオデータを除外する等の方法が考えられる。

また、これらの規格においては、複数のオブジェクトオーディオデータが互いに異なるビットレートによって再生されてもよい。例えば、図２の２Ａに示すように、オーディオコンテンツが、オブジェクトメタデータと、高ビットレートおよび低ビットレートがそれぞれ用意されたオブジェクトオーディオデータ１～オブジェクトオーディオデータ３と、を有するとする。この場合、再生されるオブジェクトオーディオデータのビットレートの組合せは自由である。例えば、２Ｂに示すように、オブジェクトオーディオデータ１およびオブジェクトオーディオデータ２が高ビットレートで再生され、オブジェクトオーディオデータ３が低ビットレートで再生されてもよい。

オーディオコンテンツが提供される場合には、オブジェクトオーディオデータは、オーディオファイルに格納されてクライアントへ伝送される。ここで、図３を参照して具体例を説明する。図３の３Ａに示すように、オブジェクトオーディオデータ１～オブジェクトオーディオデータ３と、これらのデータに対応するオブジェクトメタデータが存在する場合、オーディオファイルに格納する態様は３Ｂ－１～３Ｂ－３に示すように複数の組み合わせが考えられる。

より具体的には、３Ｂ－１に示すように、全てのデータが１つのオーディオファイルに格納されてもよいし、３Ｂ－３に示すように、１つのオブジェクトオーディオデータとそれに対応するオブジェクトメタデータが１つのオーディオファイルに格納されてもよい。また、３Ｂ－２に示すように、１または２以上のオブジェクトオーディオデータとそれらに対応するオブジェクトメタデータがそれぞれオーディオファイルに格納されてもよい。

ところで、オーディオコンテンツがMPEG-DASHで提供される場合、互いにビットレートの異なるオーディオファイルが生成され、クライアントは、これらのオーディオファイルの中から所望のオーディオファイルを選択することが可能になる。

例えば、図４に示すように、６４[kbps]と３２[kbps]のビットレートを有するオブジェクトオーディオデータ１～オブジェクトオーディオデータ３がそれぞれ生成されたとする。この場合、クライアントが取得可能なオーディオファイルの組合せは２^３通り存在する。例えば、ファイル１－１、ファイル２－１、ファイル３－２の組合せ（合計で１６０[kbps]）や、ファイル１－１、ファイル２－２、ファイル３－１の組合せ（合計で１６０[kbps]）のように、合計のビットレートが同一となる組み合せが存在する。

しかし、クライアントは、合計のビットレートに関する情報だけでは、いずれの組合せがより適切であるかを判断することができない。そこで、クライアントがより適切な組合せを判断できるように、どのオブジェクトオーディオデータの音質をより高く（換言すると、ビットレートをより高く）再生すべきかを示す情報として優先度を設定することが検討され得る。

優先度情報として利用され得るオブジェクトメタデータの１つとして、MPEG－H 3D Audio等における「Priority」が挙げられる。しかし、Priorityは、オブジェクトメタデータに格納されるデータであるため、PriorityがMPEG-DASHへ適用される場合、クライアントは、一旦オーディオファイルを取得し、オブジェクトメタデータからPriorityを取得することでオーディオファイルのビットレートを決定することなる。換言すると、クライアントは、不要なデータを取得しなければならなくなる。

そこで、本件の開示者は上記事情に鑑みて、本開示に係る技術を創作するに至った。本開示は、取得されたオブジェクトオーディオデータごとに優先度を設定し、効率よく取得することを可能にし、当該優先度に基づいて適切なオーディオコンテンツの配信および再生を実現することができる。

また、MPEG-DASHにおいては、クライアントは、基本的にオーディオファイルのビットレートに基づいて取得するオーディオファイルを決定する。そのため、上記優先度情報が無い状況下においては、例えば、図５に示すようなオブジェクトオーディオデータ１とオブジェクトオーディオデータ２のビットレートの組み合わせによる４種類のオーディオファイルが生成された場合、ファイル２とファイル３のビットレートは共に９６[kbps]であるため、クライアントは、ビットレートに関する情報だけではどちらのオーディオファイルがより適切であるかを判断することができず、また、コンテンツ者は、意図したオブジェクトオーディオデータとそのビットレートの組合せをクライアントに提供することができない。

一方、本開示は、オーディオファイルに格納されるオブジェクトオーディオデータ単位のビットレート情報をクライアントへ提供することができる。これによって、クライアントは、上記の優先度情報も併せて考慮することで、ファイル２とファイル３のいずれのオーディオファイルがより適切であるかを判断することができる。

また、本開示は、オブジェクトオーディオデータのDescription情報をクライアントへ提供することができる。これによって、クライアントを操作するユーザは、所望のオブジェクトオーディオデータを高ビットレートで再生させることができる。

以降では、本開示の一実施形態についてより詳細に説明していく。

＜２．構成例＞
上記では、本開示の背景について説明した。続いて、図６～図８を参照して、本開示の一実施形態に係る情報処理システムの構成例について説明する。

（２－１．システム構成例）
まず、図６を参照して、本実施形態に係る情報処理システムのシステム構成例について説明する。

図６に示すように、本実施形態に係る情報処理システムは、サーバ１００と、クライアント２００と、を備える。そして、サーバ１００とクライアント２００は、インターネット３００によって互いに接続されている。

サーバ１００は、MPEG－DASHに基づいて、オーディオコンテンツに用いられるオブジェクトオーディオデータをクライアント２００に配信（ストリーミング）する情報処理装置（送信装置）である。より具体的には、サーバ１００は、オーディオコンテンツに用いられるオーディオデータをオブジェクト毎に取得し、オブジェクト単位で当該データを符号化することでストリームデータを生成する。そして、サーバ１００は、セグメントと呼ばれる数秒から１０秒程度の時間単位ごとに、もしくはコンテンツすべてについて、当該ストリームデータをファイル化することでオーディオファイルを生成する。

なお、オブジェクトとは、音源であり、各オブジェクトのオーディオデータは、そのオブジェクトに取り付けられたマイクロフォン等により取得される。オブジェクトは、固定されたマイクスタンド等の物体であってもよいし、人物等の動体であってもよい。

また、サーバ１００は、各オブジェクトの位置情報等を含むオブジェクトメタデータを符号化する。サーバ１００は、オブジェクトメタデータの符号化データをセグメント単位でファイル化することでメタデータファイルを生成する。

さらに、サーバ１００は、オーディオファイルを管理するＭＰＤ（Media Presentation Description）ファイル（制御情報）を生成する。

そして、サーバ１００は、クライアント２００からの要求に応じて、上記のオーディオファイル、メタデータファイル、または、ＭＰＤファイル等をクライアント２００に送信する。

クライアント２００は、オーディオコンテンツを再生する情報処理装置（受信装置）である。より具体的には、クライアント２００は、サーバ１００からＭＰＤファイルを取得し、当該ＭＰＤファイルに基づいてサーバ１００からメタデータファイルおよびオーディオファイルを取得する。そして、クライアント２００は、サーバ１００から取得されたオーディオファイルを復号し、合成して出力することでオーディオコンテンツの再生を実現する。

以上、本実施形態に係る情報処理システムの構成例について説明した。なお、図６を参照して説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理システムの構成は係る例に限定されない。例えば、サーバ１００の機能の一部は、クライアント２００またはその他の外部装置に備えられてもよい。例えば、サーバ１００の機能の一部を提供するソフトウェア（例えば、所定のＡＰＩ（Application Programming Interface）が使用されたＷＥＢアプリケーション等）がクライアント２００上で実行されてもよい。また、逆に、クライアント２００の機能の一部は、サーバ１００またはその他の外部装置に備えられてもよい。本実施形態に係る情報処理システムの構成は、仕様や運用に応じて柔軟に変形可能である。

（２－２．サーバ１００の機能構成例）
上記では、本実施形態に係る情報処理システムのシステム構成例について説明した。続いて、図７を参照して、サーバ１００の機能構成例について説明する。

図７に示すように、サーバ１００は、処理部１１０と、制御部１２０と、通信部１３０と、記憶部１４０と、を備える。

処理部１１０は、オーディオコンテンツの提供に関する処理を行う機能構成である。図７に示すように、処理部１１０は、データ取得部１１１と、符号化処理部１１２と、セグメントファイル生成部１１３と、ＭＰＤファイル生成部１１４と、を備える。

データ取得部１１１は、オーディオコンテンツに用いられるオーディオデータをオブジェクト毎に取得する（換言すると、オブジェクトオーディオデータを取得する）機能構成である。データ取得部１１１は、サーバ１００内から当該オブジェクトオーディオデータを取得してもよいし、サーバ１００に接続している外部装置からオブジェクトオーディオデータを取得してもよい。また、データ取得部１１１は、所得したオブジェクトオーディオデータ毎に優先度を設定してもよいし、予め優先度が設定されたオブジェクトオーディオデータを取得してもよい。データ取得部１１１は、取得したオブジェクトオーディオデータを符号化処理部１１２に提供する。

符号化処理部１１２は、データ取得部１１１から提供されるオブジェクトオーディオデータをオブジェクトごとに符号化することでストリームデータを生成する機能構成である。また、符号化処理部１１２は、外部から入力される各オブジェクトのオブジェクト位置情報等を含むオブジェクトメタデータを符号化する。符号化処理部１１２は、各オブジェクトのストリームデータとオブジェクトメタデータの符号化データをセグメントファイル生成部１１３に提供する。

セグメントファイル生成部１１３は、オーディオコンテンツとして配信可能な単位のデータであるセグメントファイルを生成する機能構成である。より具体的には、セグメントファイル生成部１１３は、符号化処理部１１２から提供される各オブジェクトのストリームデータをセグメント単位でファイル化することでオーディオファイルを生成する。オーディオファイルの生成については様々な態様が存在する。例えば、セグメントファイル生成部１１３は、オブジェクトオーディオデータ毎の優先度に基づいて１または２以上のオブジェクトオーディオデータを１つのオーディオファイルに格納することでオーディオファイルを生成する。さらに、セグメントファイル生成部１１３は、当該ファイル毎に優先度情報を設定することもできる。優先度に基づくオーディオファイルの生成の詳細については後述する。

また、セグメントファイル生成部１１３は、符号化処理部１１２から提供される、オブジェクトメタデータの符号化データをセグメント単位でファイル化することで、オブジェクトメタデータのみを格納するメタデータファイルを生成することもできる。メタデータファイルの内容や、メタデータファイルが生成されるケースについては後述する。

ＭＰＤファイル生成部１１４は、ＭＰＤファイルを生成する機能構成である。本実施形態において、ＭＰＤファイル生成部１１４は、優先度情報、ビットレート情報またはディスクリプション情報を含むＭＰＤファイルを生成する。ＭＰＤファイルの内容の詳細については後述する。

制御部１２０は、サーバ１００が行う処理全般を統括的に制御する機能構成である。例えば、制御部１２０は、通信部１３０を介して受信されるクライアント２００からの要求情報等に基づいて各構成の起動や停止を制御することができる。なお、制御部１２０の制御内容は特に限定されない。例えば、制御部１２０は、汎用コンピュータ、ＰＣ、タブレットＰＣ等において一般的に行われる処理を制御してもよい。

通信部１３０は、クライアント２００との各種通信を行う機能構成である（送信部としても機能する）。例えば、通信部１３０は、クライアント２００からの要求情報を受信したり、当該要求情報への応答としてＭＰＤファイル、メタデータファイルまたはオーディオファイル等をクライアント２００へ送信したりする。なお、通信部１３０の通信内容はこれらに限定されない。

記憶部１４０は、各種情報を記憶する機能構成である。例えば、記憶部１４０は、オブジェクトオーディオデータ、オーディオファイル、オブジェクトメタデータ、メタデータファイルまたはＭＰＤファイル等を記憶したり、サーバ１００の各機能構成によって使用されるプログラムまたはパラメータ等を記憶したりする。なお、記憶部１４０が記憶する情報はこれらに限定されない。

以上、サーバ１００の機能構成例について説明した。なお、図７を用いて説明した上記の機能構成はあくまで一例であり、サーバ１００の機能構成は係る例に限定されない。例えば、サーバ１００は、図７に示す機能構成の全てを必ずしも備えなくてもよい。また、サーバ１００の機能構成は、仕様や運用に応じて柔軟に変形可能である。

（２－３．クライアント２００の機能構成例）
上記では、サーバ１００の機能構成例について説明した。続いて、図８を参照して、クライアント２００の機能構成例について説明する。

図８に示すように、クライアント２００は、処理部２１０と、制御部２２０と、通信部２３０と、記憶部２４０と、を備える。

処理部２１０は、オーディオコンテンツの再生に関する処理を行う機能構成である。図８に示すように、処理部２１０は、ＭＰＤファイル取得部２１１と、ＭＰＤファイル処理部２１２と、セグメントファイル選択部２１３と、セグメントファイル取得部２１４と、復号処理部２１５と、合成処理部２１６と、を備える。

ＭＰＤファイル取得部２１１は、オーディオコンテンツの再生に先立ってサーバ１００からＭＰＤファイルを取得する機能構成である。より具体的には、ＭＰＤファイル取得部２１１は、ユーザ操作等に基づいてＭＰＤファイルの要求情報を生成し、通信部２３０を介して当該要求情報をサーバ１００へ提供することで、ＭＰＤファイルをサーバ１００から取得する。ＭＰＤファイル取得部２１１は、取得したＭＰＤファイルをＭＰＤファイル処理部２１２に提供する。

ＭＰＤファイル処理部２１２は、ＭＰＤファイル取得部２１１から提供されるＭＰＤファイルに関する処理を行う機能構成である。より具体的には、ＭＰＤファイル処理部２１２は、ＭＰＤファイルを解析することで、オーディオファイルもしくはそれに対応するメタデータファイルの取得に必要な情報（例えば、URL等）を認識したり、各オブジェクトオーディオデータ（またはオーディオファイル）の優先度もしくはビットレート等を認識したりする。ＭＰＤファイル処理部２１２は、これらの情報をセグメントファイル選択部２１３に提供する。

セグメントファイル選択部２１３は、取得対象となるセグメントファイルを選択する機能構成である。より具体的には、セグメントファイル選択部２１３は、ＭＰＤファイル処理部２１２から提供される上記の各種情報に基づいて取得対象となるオーディオファイルまたはメタデータファイルを選択する。例えば、セグメントファイル選択部２１３は、優先度のより高いオーディオファイルのビットレートがより高くなるように、取得対象となるオーディオファイルを選択する。その際、セグメントファイル選択部２１３は、利用可能な伝送帯域も考慮し、例えば、利用可能な伝送帯域においてビットレートの最も高いオーディオファイルを選択する。

なお、取得対象となるファイルの選択方法は上記に限定されない。例えば、セグメントファイル選択部２１３は、ユーザからの入力に基づいてユーザ所望のオーディオファイルを取得対象として選択してもよい。セグメントファイル選択部２１３は、取得対象となるファイルに関する情報をセグメントファイル取得部２１４に提供する。

セグメントファイル取得部２１４は、セグメントファイルの取得を行う機能構成である。より具体的には、セグメントファイル取得部２１４は、セグメントファイル選択部２１３から提供される各種情報に基づいてオーディオファイルまたはメタデータファイルの要求情報を生成し、通信部２３０を介して当該要求情報をサーバ１００へ提供することで、これらのファイルをサーバ１００から取得する。セグメントファイル取得部２１４は、取得したこれらのファイルを復号処理部２１５に提供する。

復号処理部２１５は、セグメントファイル取得部２１４から提供されるオーディオファイルまたはメタデータファイルに含まれるデータを復号する機能構成である。復号処理部２１５は、復号処理によって得られるオブジェクトオーディオデータ等を合成処理部２１６に提供する。

合成処理部２１６は、復号処理部２１５から提供される複数のオブジェクトオーディオデータを合成し、出力する機能構成である。合成処理部２１６は、合成後のデータを制御部２２０に提供する。

制御部２２０は、クライアント２００が行う処理全般を統括的に制御する機能構成である。例えば、制御部２２０は、ディスプレイまたはスピーカ等の出力部（図示なし）を制御し、合成処理部２１６によって提供される合成後のデータを出力することで、オーディオコンテンツをユーザに提供する。また、制御部２２０は、ユーザによってマウス、キーボード等の入力部（図示なし）を用いて行われる入力に基づいて各種処理を制御する。なお、制御部２２０の制御内容は特に限定されない。例えば、制御部２２０は、汎用コンピュータ、ＰＣ、タブレットＰＣ等において一般的に行われる処理を制御してもよい。

通信部２３０は、サーバ１００との各種通信を行う機能構成である（受信部としても機能する）。例えば、通信部２３０は、ユーザ入力等に基づいてサーバ１００へ要求情報を送信したり、当該要求情報への応答としてＭＰＤファイル、メタデータファイルまたはオーディオファイル等をサーバ１００から受信したりする。なお、通信部２３０の通信内容はこれらに限定されない。

記憶部２４０は、各種情報を記憶する機能構成である。例えば、記憶部２４０は、サーバ１００から提供されたオブジェクトオーディオデータ、オーディオファイル、オブジェクトメタデータ、メタデータファイルまたはＭＰＤファイル等を記憶したり、クライアント２００の各機能構成によって使用されるプログラムまたはパラメータ等を記憶したりする。なお、記憶部２４０が記憶する情報はこれらに限定されない。

以上、クライアント２００の機能構成例について説明した。なお、図８を用いて説明した上記の機能構成はあくまで一例であり、クライアント２００の機能構成は係る例に限定されない。例えば、クライアント２００は、図８に示す機能構成の全てを必ずしも備えなくてもよい。また、クライアント２００の機能構成は、仕様や運用に応じて柔軟に変形可能である。

＜３．優先度に基づくオーディオファイル生成例＞
上記では、クライアント２００の機能構成例について説明した。続いて、優先度に基づくオーディオファイルの生成例について説明する。

上記のとおり、サーバ１００のセグメントファイル生成部１１３は、オブジェクトオーディオデータ毎の優先度情報を用いて、１または２以上のオブジェクトオーディオデータを組み合わせて１つのオーディオファイルに格納することでオーディオファイルを生成する。さらに、セグメントファイル生成部１１３は、当該ファイル毎に優先度情報を設定することもできる。

ここで、図９～図１２を参照して、優先度に基づくオーディオファイルの生成例について説明する。例えば、図９の９Ａに示すように、オブジェクトオーディオデータ１～オブジェクトオーディオデータ４が存在し、これらのデータに予め優先度が設定されているとする。より具体的には、オブジェクトオーディオデータ１の優先度が３であり、オブジェクトオーディオデータ２およびオブジェクトオーディオデータ３の優先度が２であり、オブジェクトオーディオデータ４の優先度が１であるとする（なお、値が高いほど、より優先度が高いとする）。

この場合、セグメントファイル生成部１１３は、互いの優先度がより近い（優先度の差が所定値以下である）オブジェクトオーディオデータを組み合わせて１つのオーディオファイルに格納してもよい。例えば、９Ｂに示すように、セグメントファイル生成部１１３は、一連のデータのうちの最初のデータであるオブジェクトオーディオデータ１と、当該データの優先度３により近い（例えば、優先度の差が１以下である）優先度２を有するオブジェクトオーディオデータ２およびオブジェクトオーディオデータ３を組み合わせて１つのオーディオファイルに格納してもよい。そして、セグメントファイル生成部１１３は、残りのオブジェクトオーディオデータ４を別のオーディオファイルに格納してもよい。

そして、セグメントファイル生成部１１３は、１つのオーディオファイルに格納されるオブジェクトオーディオデータの優先度のうちの最も高い優先度を、当該オーディオファイルの優先度として設定してもよい。例えば、９Ｂに示すように、セグメントファイル生成部１１３は、オブジェクトオーディオデータ１～オブジェクトオーディオデータ３の優先度のうちの最も高い優先度３を、これらのデータが格納されるオーディオファイルの優先度として設定してもよい。なお、オーディオファイルの優先度の設定方法はこれに限定されない。例えば、セグメントファイル生成部１１３は、１つのオーディオファイルに格納されるオブジェクトオーディオデータの優先度のうち、同一の優先度を有するデータ数が最も多い優先度を、当該オーディオファイルの優先度として設定してもよい。また、セグメントファイル生成部１１３は、１つのオーディオファイルに格納されるオブジェクトオーディオデータの優先度の平均値を、当該オーディオファイルの優先度として設定してもよい。

また、図１０の１０Ａに示すように、オブジェクトオーディオデータ１～オブジェクトオーディオデータ４に優先度が設定されていない場合または優先度が全て同一である場合には、１０Ｂに示すように、セグメントファイル生成部１１３は、全てのオブジェクトオーディオデータを同一のオーディオファイルに格納してもよい。そして、セグメントファイル生成部１１３は、オーディオファイルの優先度を設定しなくてもよいし、各オブジェクトオーディオデータに設定されている同一の優先度を、オーディオファイルの優先度として設定してもよい。

また、図１１の１１Ａに示すように、オブジェクトオーディオデータ１～オブジェクトオーディオデータ４の優先度がそれぞれ異なる場合には、１１Ｂに示すように、セグメントファイル生成部１１３は、各オブジェクトオーディオデータをそれぞれ異なるオーディオファイルに格納してもよい。そして、セグメントファイル生成部１１３は、各オブジェクトオーディオデータの優先度と同一の値を各オーディオファイルの優先度として設定してもよい。

また、図１２の１２Ａに示すように、オブジェクトオーディオデータ１～オブジェクトオーディオデータ３の優先度が２であり、オブジェクトオーディオデータ４の優先度が１であるとする。この場合、１２Ｂに示すように、セグメントファイル生成部１１３は、同一の優先度を有するオブジェクトオーディオデータ１～オブジェクトオーディオデータ３を１つのオーディオファイルに格納し、異なる優先度を有するオブジェクトオーディオデータ４を別のオーディオファイルに格納してもよい。１２Ｂにおいても、各オブジェクトオーディオデータの優先度と同一の値が、各オーディオファイルの優先度として設定されている。

ここで、MPEG-DASHにおいては、クライアント２００は、オーディオファイル単位で取得制御を行う。そのため、図９の９Ｂ、図１０の１０Ｂ、図１２の１２Ｂに示したように、セグメントファイル生成部１１３が、１つのオーディオファイルに複数のオブジェクトオーディオデータを格納することによって、コンテンツ制作者は、オブジェクトオーディオデータとそのビットレートの組合せを制御することができる。換言すると、コンテンツ制作者は、意図したオブジェクトオーディオデータとビットレートの組合せでオーディオコンテンツを提供することができる。一方、ユーザにとっては、オブジェクトオーディオデータの取得の自由度が低くなる。

これに対して、図１１の１１Ｂに示したように、１つのオーディオファイルに１つのオブジェクトオーディオデータが格納される場合、ユーザは、所望のオブジェクトオーディオデータだけを取得することができるため、オブジェクトオーディオデータの取得の自由度が高くなる。一方、コンテンツ制作者にとっては、オブジェクトオーディオデータとビットレートの意図しない組合せでオーディオコンテンツが再生されることを防ぐことが困難となる。以上によって、コンテンツ制作者は、ユーザによるオブジェクトオーディオデータの取得の自由度をどの程度にするかを、オーディオファイルへのオブジェクトオーディオデータの格納の態様によって調整することができる。

なお、優先度に基づくオーディオファイルの生成方法、または、オーディオファイルの優先度の設定方法は上記に限定されず、適宜変更されてもよい。

＜４．優先度情報のシグナリング例＞
上記では、優先度に基づくオーディオファイルの生成例について説明した。続いて、優先度情報のシグナリング例について説明する。

（４－１．優先度が時間の経過に伴って変化しない場合のシグナリング例）
まず、優先度が時間の経過に伴って変化しない場合のシグナリング例について説明する。

同一オブジェクトオーディオデータが格納されるビットレート違いのオーディオファイルの優先度は互いに同一になる。そのため、ＭＰＤファイルのAdaptationSetによるシグナリングが適切である。より具体的には、本開示は、SupplementalPropertyを利用して、優先度情報であることを示すschemeIdUriを新たに規定し、サーバ１００のＭＰＤファイル生成部１１４は、valueに優先度情報を格納する。

ここで、図１３を参照して、優先度情報のシグナリング例を説明する。図１３の１３Ａに示すように、オブジェクトオーディオデータ１およびオブジェクトオーディオデータ２が格納されたオーディオファイルのビットレート違いと、オブジェクトオーディオデータ３が格納されたオーディオファイルのビットレート違いが存在する場合について考える（図中では、便宜的にオブジェクトオーディオデータを「obj」と表記している）。そして、オブジェクトオーディオデータ１とオブジェクトオーディオデータ２が格納されたオーディオファイルの優先度は２、オブジェクトオーディオデータ３が格納されたオーディオファイルの優先度は１であるとする。

この場合、ＭＰＤファイル生成部１１４は、１３Ｂに示すようなＭＰＤファイルを生成する。より具体的には、PreselectionのpreselectionComponentsにて、オーディオコンテンツで同時に再生されるオブジェクトオーディオデータを含むAdaptationSetが列挙される。１つ目のAdaptationSetは、オブジェクトオーディオデータ１とオブジェクトオーディオデータ２が格納されたオーディオファイルのAdaptationSet（AdaptationSetのidがo1であるもの）である。ＭＰＤファイル生成部１１４は、優先度が２であることを示すSupplementalPropertyを当該AdaptationSetに設定する。

２つ目のAdaptationSetは、オブジェクトオーディオデータ３が格納されたオーディオファイルのAdaptationSet（AdaptationSetのidがo2であるもの）である。ＭＰＤファイル生成部１１４は、優先度が１であることを示すSupplementalPropertyを当該AdaptationSetに設定する。これによって、クライアント２００のＭＰＤファイル処理部２１２
は、当該ＭＰＤファイルに基づいて各オーディオファイルの優先度を把握することができる。

なお、上記はあくまで一例であり、シグナリング方法は上記に限定されない。例えば、SupplementalPropertyが利用されるのではなく、AdaptationSetのAttributeとしてobjectAcquisitionPriorityが追加されてもよい。より具体的には、サーバ１００のＭＰＤファイル生成部１１４は、ＭＰＤファイルにおいて、SupplementalPropertyを利用することなく、「<AdaptationSet
id=”o1” objectAcquisitionPriority
=”2”>」、「<AdaptationSet id=”o2” objectAcquisitionPriority =”1”>」と記載してもよい。

（４－２．優先度が時間の経過に伴って変化する場合のシグナリング例）
上記では、優先度が時間の経過に伴って変化しない場合のシグナリング例について説明した。続いて、優先度が時間の経過に伴って変化する場合のシグナリング例について説明する。

優先度が時間の経過に伴って変化する場合、オブジェクトメタデータが時間の経過に伴って変化する。そのため、ＭＰＤまたはISOBMFFのファイルのMovieBox領域に記載すると、サーバの処理の負荷やクライアントの処理のオーバーヘッド増大の観点から適切ではない。そこで、サーバ１００のセグメントファイル生成部１１３は、各オブジェクトオーディオデータに対応するオブジェクトメタデータのみを格納するメタデータファイルを生成する。

例えば、図１４に示すように、オブジェクトオーディオデータ１、オブジェクトオーディオデータ２およびそれぞれに対応するオブジェクトメタデータ１＋２が格納されたオーディオファイル１と、オブジェクトオーディオデータ３およびこれに対応するオブジェクトメタデータ３が格納されたオーディオファイル２が存在する場合について考える。この場合、セグメントファイル生成部１１３は、オブジェクトメタデータ１＋２およびオブジェクトメタデータ３を統合したオブジェクトメタデータ１＋２＋３をファイル化することでメタデータファイルを生成する。なお、メタデータファイルは、オブジェクトメタデータのみを格納するファイルであることを想定しているが、これに限定されず、メタデータファイルはその他のデータを適宜格納してもよい。

ここで、メタデータファイルのファイルサイズは、オブジェクトオーディオデータが格納されるオーディオファイルのファイルサイズよりも小さいため、クライアント２００は、オーディオファイルの取得前に、当該メタデータファイルを取得することで、当該ファイルに格納されたオブジェクトメタデータ１＋２＋３の優先度情報に基づいてオーディオファイルの取得制御を適切に行うことができる。

メタデータファイルのISOBMFFへの格納方法およびMPEG-DASHでの扱いは規定されていないため、本開示にて新たに規定する。以降では、MPEG-H 3D AudioとAAC 3D AudioでのメタデータファイルのISOBMFF（ISO Base Media File Format）、および、当該メタデータファイルに格納されるオブジェクトメタデータとオブジェクトオーディオデータとの対応付けの方法について説明していく。

（４－２－１．MPEG-H 3D AudioのISOBMFF）
MPEG-H 3D AudioでのメタデータファイルのISOBMFFを説明する前に、まず、既存のファイルフォーマットについて説明する。MPEG-H 3D Audioでは、オブジェクトオーディオデータとオブジェクトメタデータをオーディオファイルに格納する方法が規定されている。例えば、図１５の１５Ａに示すように、オブジェクトオーディオデータ１、オブジェクトオーディオデータ２、オブジェクトメタデータ１＋２が格納されるオーディオファイル１、および、オブジェクトオーディオデータ３、オブジェクトメタデータ３が格納されるオーディオファイル２が存在する場合について考える。

この場合、オーディオファイル１およびオーディオファイル２それぞれのISOBMFFは１５Ｂのようになる。より具体的には、各オーディオファイルにおいては、MovieBox(‘moov’)のSampleEntryに含まれるMHAConfigurationBox(‘mhaC’)のMHADecoderConfigurationRecordに、sampleに含まれるオブジェクトのConfigurationが記載される。また、SampleEntryに含まれるMHAMultiStreamBox(‘maeM’)には、オーディオコンテンツが複数のオーディオファイルで提供される場合のそれぞれのオーディオファイルをユニークに識別するためのstreamIDが記載される。MediaDataBox(‘mdat’)に含まれる各sampleデータには、各時間のオブジェクトオーディオデータ（ES（Elementary Stream））とオブジェクトメタデータが含まれる。

なお、図１５および以降で説明するISOBMFFのBox構造は適宜省略されている。より具体的には、図１５の１５Ｂに示したMovieBoxは、図１６に示すように、Track Box等の様々な構成要素を含んでいる。そして、SampleEntryは、当該Box構造中のSample Description Boxに含まれている。

（４－２－１－１．MPEG-H 3D AudioでのメタデータファイルのISOBMFF（実施例１））
上記では、MPEG-H 3D AudioでのオーディオファイルのISOBMFFについて説明した。続いて、図１７を参照して、MPEG-H 3D AudioでのメタデータファイルのISOBMFF（実施例１）について説明する。より具体的には、図１５の１５Ａに示した、オブジェクトオーディオデータ１～オブジェクトオーディオデータ３に対応するオブジェクトメタデータ１＋２＋３が格納される、MPEG-H 3D AudioでのメタデータファイルのISOBMFFについて説明する。また、MPEG-H 3D Audioにおいては、RAW方式とMHAS方式という２種類の格納方式が存在するところ、以下では、まず、RAW方式について説明する。

ここで、本開示は、MHAMetadataSampleEntry(’mham’)を新たに規定する。図１７の１７Ａおよび１７Ｂに示すように、SampleEntryには、メタデータファイルに対応するオーディオファイルに関する情報として、num_reference_streamIDおよびreference_streamIDが記載される。より具体的には、num_reference_streamIDによって、当該メタデータファイルが対応するオーディオファイル数が示され、reference_streamIDによって、当該メタデータファイルが対応するオーディオファイルのstreamIDが示される。

さらに、SampleEntryには、それぞれのオブジェクトメタデータの内容を示すためのMHAMetadataConfigurationBox(‘mhmC’)が含まれる。MHAMetadataConfigurationBox(‘mhmC’)には、図１５の１５Ｂに示したオーディオファイルと同じMHADecoderConfigurationRecordが含まれる。ただし、メタデータファイルのMHADecoderConfigurationRecordでは、Elementary
streamに関連するConfigurationが除かれることで、オブジェクトメタデータのみが含まれていることを示すことが可能である。

MediaDataBox(‘mdat’)のsampleには、各streamIDが示すオーディオファイルに対応するオブジェクトメタデータが格納される。換言すると、サーバ１００のセグメントファイル生成部１１３は、各オーディオファイルに格納されるオブジェクトメタデータを、メタデータファイルにおけるsampleに格納する。その際、各オブジェクトメタデータの先頭には、各オブジェクトメタデータのデータサイズを示すsizeが付加される。

なお、本実施例では、num_reference_streamIDおよびreference_streamID等は、ISOBMFFのBox構造におけるSampleEntryにて示されたが、これに限定されない。例えば、num_reference_streamIDおよびreference_streamID等は、Sample Description Box、Sample GroupやSub-Sample Information Boxにて示されてもよい。

続いて、図１８を参照して、MHAS方式のISOBMFFについて説明する。図１８に示すように、MHAS方式においては、MHAMetadataSampleEntry(’mhmm’)が用いられる。また、MHAS方式では、MHAMetadataConfigurationBoxは、sampleにてMHAConfigurationBoxとして格納され得るため、SampleEntryに格納されなくてもよい（図中では、MHAMetadataConfigurationBoxがSampleEntryに格納される例を示している）。その他の点については、上記で説明したRAW方式と同一であるため説明を省略する。

（４－２－１－２．MPEG-H 3D AudioでのメタデータファイルのISOBMFF（実施例２））
続いて、図１９を参照して、MPEG-H 3D AudioでのメタデータファイルのISOBMFF（実施例２）のRAW方式について説明する。

当該実施例では、図１５の１５Ａに示したオーディオファイル１に格納されるオブジェクトメタデータ１＋２と、オーディオファイル２に格納されるオブジェクトメタデータ３が統合されたオブジェクトメタデータ１＋２＋３が、sampleに格納される。換言すると、サーバ１００の符号化処理部１１２が、オブジェクトメタデータ１＋２とオブジェクトメタデータ３を統合することでオブジェクトメタデータ１＋２＋３を生成し、セグメントファイル生成部１１３が、メタデータファイルを生成する際に当該オブジェクトメタデータ１＋２＋３をsampleに格納する。

当該実施例においては、sampleに格納されるオブジェクトメタデータのオブジェクト数がstreamID毎に示される。より具体的には、図１９の１９Ａに示すように、streamID(reference_streamID)が１であるオーディオファイル１に対応するオブジェクトメタデータのオブジェクト数(object_num)は２であることが示されている。換言すると、streamIDが１であるオーディオファイル１には、オブジェクトオーディオデータ１とオブジェクトオーディオデータ２が格納されていることが示されている。また、streamID(reference_streamID)が２であるオーディオファイル２に対応するオブジェクトメタデータのオブジェクト数(object_num)は１であることが示されている。換言すると、streamIDが２であるオーディオファイル２には、オブジェクトオーディオデータ２の次のオブジェクトオーディオデータ３が格納されていることが示されている。

図１９の１９Ａおよび１９Ｂに示すMHAMetadataConfigurationBoxをはじめとするその他の事項は、図１７を参照して説明したものと同一であるため説明を省略する。なお、本実施例では、reference_streamID等は、ISOBMFFのBox構造におけるSampleEntryにて示されたが、これに限定されない。例えば、reference_streamID等は、Sample Description Box、Sample GroupやSub-Sample Information Boxにて示されてもよい。

図２０は、本実施例におけるMHAS方式のISOBMFFを示す図である。オブジェクトメタデータのオブジェクト数(object_num)が示される点以外は、図１８を参照して説明したものと同一であるため説明を省略する。

（４－２－２．AAC 3D AudioのISOBMFF）
上記では、MPEG-H 3D AudioのISOBMFFについて説明した。続いて、AAC 3D AudioのISOBMFFについて説明する。

AAC
3D AudioでのメタデータファイルのISOBMFFを説明する前に、まず、既存のファイルフォーマットについて説明する。AAC 3D Audioでは、複数のオーディオファイルをシグナリングする方法は規定されていないため、本開示にて新たに規定する。

より具体的には、図２１の２１Ａおよび２１Ｂに示すように、SampleEntryについては、複数のオーディオファイルが用いられることを示すAAC3DAudioSampleEntry(‘a3a2’)が使用される（１つのファイルが用いられる場合はSampleEntry(‘a3a1’)が使用される）。また、複数のオーディオファイルをシグナリングするための情報としては、MPEG-H 3D Audioと同様に、MHAMultiStreamBox(‘maeM’)が使用される。これによって、MPEG-H
3D Audioと同様にstreamIDを用いてオーディオファイル間の関係を示すことが可能となる。

また、Track間の関係は、track referenceによって示される。より具体的には、main track（図２１においては、オブジェクトオーディオデータ１とオブジェクトオーディオデータ２を含むfile1）からauxiliary track（図２１においては、オブジェクトオーディオデータ３を含むfile2）への繋がりは、main trackのtrack reference（’maux’）によって示される。また、auxiliary trackからmain trackへの繋がりは、auxiliary trackのtrack reference（’mbas’）によって示される。

なお、図２１を参照して説明したISOBMFFのBox構造も適宜省略されている。より具体的には、図２１の２１Ａおよび２１Ｂに示したMovieBoxは、図１６に示すように、Track Box等の様々な構成要素を含んでいる。そして、SampleEntryは、当該Box構造中のSample Description Boxに含まれている（ただし、Sample Entryは、図１６に示した（’mham’）ではなく（’a3a2’）である）。

（４－２－２－１．AAC 3D AudioでのメタデータファイルのISOBMFF（実施例３））
上記では、AAC 3D AudioでのオーディオファイルのISOBMFFについて説明した。続いて、図２２を参照して、AAC 3D AudioでのメタデータファイルのISOBMFF（実施例３）について説明する。換言すると、図１５の１５Ａに示した、オブジェクトオーディオデータ１～オブジェクトオーディオデータ３に対応するオブジェクトメタデータ１＋２＋３が格納される、AAC 3D AudioでのメタデータファイルのISOBMFFについて説明する。

本開示においては、AAC 3D Audioでのメタデータファイルであることを示すA3AMetadataSampleEntry(’a3am’)が新たに規定される。図２２の２２Ａおよび２２Ｂに示すように、SampleEntryには、メタデータファイルに対応するオーディオファイルに関する情報として、num_reference_streamIDおよびreference_streamIDが記載される。より具体的には、num_reference_streamIDによって、当該メタデータファイルが対応するオーディオファイル数が示され、reference_streamIDによって、当該メタデータファイルが対応するオーディオファイルのstreamIDが示される。なお、AAC 3D Audioにおいて、オブジェクトメタデータのConfigurationは、MediaDataBox(‘mdat’)のsampleに格納されるため、SampleEntryではシグナリングされない。

ここで、sampleの構造については、AAC 3D Audioの3da_meta_data()が使用されてもよいし、AAC 3D AudioのElementary streamで使用される、DSEに格納された3da_meta_data()が使用されてもよい。なお、3da_meta_data()の構造は図４５に示すものであり、DSEに格納された3da_meta_data()の構造は図４６に示すものであり、DSEの構造は図４７に示すものである。なお、図４７に示す、DSEにおけるdata_stream_byteに格納される3da_ancillary_dataの構造は図４８に示すものである。ただし、DSEのdata_stream_byteの最大サイズより3da_meta_data()のサイズが大きい場合においては、3da_meta_data()は分割されて複数のDSEに格納される。

なお、図２２および以降で説明するISOBMFFのBox構造も適宜省略されている。より具体的には、図２２の２２Ａに示したMovieBoxは、図１６に示すように、Track Box等の様々な構成要素を含んでいる。そして、SampleEntryは、当該Box構造中のSample Description Boxに含まれている（ただし、Sample Entryは、図１６に示した（’mham’）ではなく（’a3am’）である）。

また、本実施例では、num_reference_streamIDおよびreference_streamID等は、ISOBMFFのBox構造におけるSampleEntryにて示されたが、これに限定されない。例えば、num_reference_streamIDおよびreference_streamID等は、Sample Description Box、Sample GroupやSub-Sample Information Boxにて示されてもよい。

（４－２－２－２．AAC 3D AudioでのメタデータファイルのISOBMFF（実施例４））
続いて、図２３を参照して、AAC 3D AudioでのメタデータファイルのISOBMFF（実施例４）について説明する。

当該実施例では、図１５の１５Ａに示したオーディオファイル１に格納されるオブジェクトメタデータ１＋２と、オーディオファイル２に格納されるオブジェクトメタデータ３が統合されたオブジェクトメタデータ１＋２＋３が、sampleに格納される。換言すると、符号化処理部１１２が、オブジェクトメタデータ１＋２とオブジェクトメタデータ３を統合することでオブジェクトメタデータ１＋２＋３を生成し、セグメントファイル生成部１１３が、メタデータファイルを生成する際に当該オブジェクトメタデータ１＋２＋３をsampleに格納する。

当該実施例においては、sampleに格納されるオブジェクトメタデータのオブジェクト数がstreamID毎に示される。より具体的には、図２３の２３Ａに示すように、streamID(reference_streamID)が１であるオーディオファイル１に対応するオブジェクトメタデータのオブジェクト数(object_num)は２であることが示されている。換言すると、streamIDが１であるオーディオファイル１には、オブジェクトオーディオデータ１とオブジェクトオーディオデータ２が格納されていることが示されている。また、streamID(reference_streamID)が２であるオーディオファイル２に対応するオブジェクトメタデータのオブジェクト数(object_num)は１であることが示されている。換言すると、streamIDが２であるオーディオファイル２には、オブジェクトオーディオデータ２の次のオブジェクトオーディオデータ３が格納されていることが示されている。

ここで、sampleの構造については、AAC 3D Audioの3da_meta_data()が使用されてもよいし、AAC 3D AudioのElementary streamで使用される、DSEに格納された3da_meta_data()が使用されてもよい。

図２３の２３Ａおよび２３Ｂに示すその他の事項は、図２２を参照して説明したものと同一であるため説明を省略する。なお、本実施例では、reference_streamID等は、ISOBMFFのBox構造におけるSampleEntryにて示されたが、これに限定されない。例えば、reference_streamID等は、Sample Description Box、Sample GroupやSub-Sample Information Boxにて示されてもよい。

（４－２－３．オーディオファイルとメタデータファイルの対応付け例）
続いて、オーディオファイルとメタデータファイルの対応付け例について説明する。本開示は、ＭＰＤファイルを用いてオーディオファイルとメタデータファイルの対応付けを実現する。ここで、ＭＰＤファイルに関する規定においては、オーディオファイルのシグナリング方法は規定されているが、メタデータファイルのシグナリング方法は規定されていない。そこで、本開示にて、ＭＰＤファイルにおけるメタデータファイルのシグナリング方法を規定する。

例えば、図２４に示すように、オブジェクトオーディオデータ１およびオブジェクトオーディオデータ２が格納されたオーディオファイルのビットレート違いと、オブジェクトオーディオデータ３が格納されたオーディオファイルのビットレート違いと、これらのオーディオファイルに対応するメタデータファイルと、が存在する場合について考える。

（４－２－３－１．オーディオファイルとメタデータファイルの対応付け例（実施例１））
当該実施例は、Preselection elementにPropertyを追加し、メタデータファイルの取得を容易にする方法である。図２５を参照して、当該実施例について詳細に説明する。

図２５に示すように、ＭＰＤファイルにおけるPreselectionによって、再生に用いられるオブジェクトオーディオデータを含むAdaptationSetがpreselectionComponentsに示されることによってオーディオコンテンツの再生が実現される。このように、Preselectionを起点に再生が行われるため、メタデータファイルの取得を容易にするために、本開示は、PreselectionにメタデータファイルのAdaptationSetをシグナリングする。

より具体的には、本開示は、「SupplementalProperty schemeIdUri=“urn:mpeg:dash:objectAudio:objectMetadataFile” value=“**”」を追加する。ここで、valueは、メタデータファイルを含むAdaptationSetのidを示す。例えば、図２５のＭＰＤファイルを取得したクライアント２００のＭＰＤファイル処理部２１２は、Preselectionに含まれるSupplementalPropertyから、メタデータファイルを含むAdaptationSetのidが”m1”（図中の符号１０）であることを認識することができる。

そして、オーディオファイルとメタデータファイルの対応付けについては、既存のRepresentationのassociationIdが用いられる。より具体的には、クライアント２００のＭＰＤファイル処理部２１２は、associationIdが”o1-1”、”o1-2”、”o2-1”、”o2-2”（図中の符号１１）であることに基づいて、当該メタデータファイルが対応するオーディオファイルを認識することができる。

しかし、当該実施例の方法では、クライアント２００は、メタデータファイルに含まれているstreamIDと、各オーディオファイルのstreamIDの一致を確認するために、メタデータファイルのstreamIDを確認した後に、さらに、各オーディオファイルを取得し、当該オーディオファイルのMovieBox(‘moov’)部分を確認する必要がある。換言すると、クライアント２００は、再生に用いない不要なオーディオファイルまで取得することになる。

また、オブジェクトメタデータはオブジェクトが同一であればビットレートに関係なく同じ内容である。つまり、同一のAdaptationSetに含まれるオーディオファイルに対応するオブジェクトメタデータは互いに同一である。そのため、associationIdにて行われる対応付けは、Representation単位ではなく、AdaptationSet単位で行われればよい。換言すると、オーディオファイルとメタデータファイルの対応付けに関する記載にも無駄が存在する。

（４－２－３－２．オーディオファイルとメタデータファイルの対応付け例（実施例２））
当該実施例は、上記の実施例１に対して、オーディオファイルのstreamIDを示す方法を追加したものである。より具体的には、図２６に示すように、各オーディオファイルを含むAdaptationSetで、「SupplementalProperty
schemeIdUri=“urn:mpeg:dash:objectAudio:objectMetadataStreamID”value=“**”」（図中の符号１２）が追加される。valueは、オーディオファイルのstreamIDを示す。

これによって、クライアント２００のＭＰＤファイル処理部２１２は、ＭＰＤファイルにて、メタデータファイルに含まれているstreamIDと、各オーディオファイルのstreamIDの一致を確認することができる。換言すると、クライアント２００は、再生に用いない不要なオーディオファイルを取得する必要がなくなる。なお、オーディオファイルとメタデータファイルの対応付けをはじめとするその他の内容については、図２５に示したＭＰＤファイルと同一であるため説明を省略する。

（４－２－３－３．オーディオファイルとメタデータファイルの対応付け例（実施例３））
当該実施例は、上記の実施例２に対して、オーディオファイルとメタデータファイルの対応付けの無駄を省略したものである。メタデータファイルを含むAdaptationSetと、各オーディオファイルを含むAdaptationSetとの対応付けを行うassociationIdを、AdaptationSetのattributeとして設定可能とする。より具体的には、図２７に示すように、オーディオファイルのAdaptationSetを示すassociationId（図中の符号１３）を、メタデータファイルを含むAdaptationSetのattributeとして設定可能とする。これによって、オーディオファイルとメタデータファイルの対応付けに関する記載の無駄が削減される。なお、その他の内容については、図２６に示したＭＰＤファイルと同一であるため説明を省略する。

（４－２－３－４．オーディオファイルとメタデータファイルの対応付け例（実施例４））
当該実施例は、PreselectionにメタデータファイルのAdaptationSet等をシグナリングする方法である。より具体的には、図２８に示すように、「SupplementalProperty
schemeIdUri=“urn:mpeg:dash:objectAudio:objectMetadataFileAndStreamID” value=“metadataASid,num_streamID,streamID1,audioASid1,streamID2,audioASid2,…,streamIDk,audioASidk”」（図中の符号１４）が追加される。

valueについて、metadataASidは、メタデータファイルを含むAdaptationSetのidを示し、num_streamIDは、当該メタデータファイルが対応するオーディオファイル数を示す（換言すると、ISOBMFFにおけるnum_reference_streamIDと同じである）。そして、streamIDkは、当該メタデータファイルが対応するオーディオファイルのstreamIDを示し、audioASidkは、そのstreamIDのオーディオファイルを含むAdaptationSetのidを示す。

（４－２－３－５．オーディオファイルとメタデータファイルの対応付け例（実施例５））
当該実施例は、実施例４におけるnum_streamID、streamIDk、audioASidkをメタデータァイルのAdaptationSetでシグナリングするものである。より具体的には、図２９に示すように、メタデータァイルのAdaptationSetに「SupplementalProperty
schemeIdUri=“urn:mpeg:dash:objectAudio:objectMetadataStreamID” value= “num_streamID,streamIDk,audioASidk”」（図中の符号１５）が追加される。なお、その他の内容については、図２８に示したＭＰＤファイルと同一であるため説明を省略する。

＜５．ビットレート情報のシグナリング例＞
上記では、優先度情報のシグナリング例について説明した。続いて、ビットレート情報のシグナリング例について説明する。より具体的には、１つのオーディオファイルに複数のオブジェクトオーディオデータが格納される場合について、それぞれのオブジェクトオーディオデータのビットレート情報をＭＰＤファイルで示す方法の例について説明する。

（５－１．ビットレートが時間の経過に伴って変化しない場合のシグナリング例）
まず、ビットレートが時間の経過に伴って変化しない場合のシグナリング例について説明する。

（５－１－１．ビットレートが時間の経過に伴って変化しない場合のシグナリング例（実施例１））
当該実施例は、オーディオファイルに格納される複数のオブジェクトオーディオデータのビットレートが互いに等しい場合にのみ使用可能なビットレート情報のシグナリング例である。

例えば、図３０の３０Ａに示すように、互いに等しいビットレート（６４[kbps]）を有するオブジェクトオーディオデータ１～オブジェクトオーディオデータ３が１つのオーディオファイルに格納されている場合について考える。この場合、サーバ１００のＭＰＤファイル生成部１１４は、３０Ｂに示すようなＭＰＤファイルを生成する。

より具体的には、ＭＰＤファイルのRepresentationに、「SupplementalProperty
schemeIdUri=”urn:mpeg:dash:objectAudio:objectNumber” value=“**”」（図中の符号１６）が追加される。valueは、オーディオファイルに格納されているオブジェクトオーディオデータ数を示す。これによって、クライアント２００のＭＰＤファイル処理部２１２は、オーディオファイル全体のビットレート（図中の「bitrate=“192000”」）をオブジェクトオーディオデータ数で除算して得られる値を、各オブジェクトオーディオデータのビットレートとして算出することができる。なお、図３０および以降で説明するＭＰＤファイルの内容は適宜省略されている。

（５－１－２．ビットレートが時間の経過に伴って変化しない場合のシグナリング例（実施例２））
当該実施例は、オーディオファイルに格納される複数のオブジェクトオーディオデータのビットレートが互いに異なる場合であっても使用可能なビットレート情報のシグナリング例である。

例えば、図３１の３１Ａに示すように、６４[kbps]のビットレートを有するオブジェクトオーディオデータ１とオブジェクトオーディオデータ２、および、３２[kbps]のビットレートを有するオブジェクトオーディオデータ３が１つのオーディオファイルに格納されている場合について考える。この場合、サーバ１００のＭＰＤファイル生成部１１４は、３１Ｂに示すようなＭＰＤファイルを生成する。

より具体的には、ＭＰＤファイルのRepresentationに、「SupplementalProperty schemeIdUri=”urn:mpeg:dash:objectAudio:objectBitrate”value=“bitrate1,bitrate2,…,bitratek”」（図中の符号１７）が追加される。valueは、オーディオファイルに格納されている各オブジェクトオーディオデータのビットレートを、オブジェクトオーディオデータの格納順に示すものである。これによって、クライアント２００のＭＰＤファイル処理部２１２は、各オブジェクトオーディオデータのビットレートを認識することができる。

（５－１－３．ビットレートが時間の経過に伴って変化しない場合のシグナリング例（実施例３））
当該実施例は、オーディオファイルに格納される複数のオブジェクトオーディオデータのビットレートが互いに異なる場合であっても使用可能なビットレート情報のシグナリング例である。

例えば、図３１の３１Ａに示すように、６４[kbps]のビットレートを有するオブジェクトオーディオデータ１とオブジェクトオーディオデータ２、および、３２[kbps]のビットレートを有するオブジェクトオーディオデータ３が１つのオーディオファイルに格納されている場合について考える。この場合、サーバ１００のＭＰＤファイル生成部１１４は、図３２に示すようなＭＰＤファイルを生成してもよい。

より具体的には、ＭＰＤファイルのRepresentationに、「SupplementalProperty
schemeIdUri=”urn:mpeg:dash:objectAudio:objectBitrateRatio”value=“ratio1,ratio2,…,ratiok”」（図中の符号１８）が追加される。valueは、オーディオファイルに格納されている各オブジェクトオーディオデータのビットレートの比を、オブジェクトオーディオデータの格納順に示すものである。図３２の例では、valueは、オブジェクトオーディオデータ１～オブジェクトオーディオデータ３のビットレートの比が「２：２：１」であることを示している。

これによって、クライアント２００のＭＰＤファイル処理部２１２は、オーディオファイル全体のビットレート（図中の「bitrate=“160000”」）と各オブジェクトオーディオデータのビットレートの比を用いて各オブジェクトオーディオデータのビットレートを算出することができる。より具体的には、ＭＰＤファイル処理部２１２は、最初に格納されているオブジェクトオーディオデータ１のビットレートがオーディオファイル全体のビットレート（１６０[kbps]）の２／５であることを認識し、オブジェクトオーディオデータ１のビットレートを６４[kbps]と算出することができる。オブジェクトオーディオデータ２およびオブジェクトオーディオデータ３のビットレートについても同様の方法で算出可能である。

（５－１－４．ビットレートが時間の経過に伴って変化しない場合のシグナリング例（実施例４））
当該実施例は、上記の実施例１および実施例２を組み合せたビットレート情報のシグナリング例である。

例えば、図３１の３１Ａに示すように、６４[kbps]のビットレートを有するオブジェクトオーディオデータ１とオブジェクトオーディオデータ２、および、３２[kbps]のビットレートを有するオブジェクトオーディオデータ３が１つのオーディオファイルに格納されている場合について考える。この場合、サーバ１００のＭＰＤファイル生成部１１４は、図３３に示すようなＭＰＤファイルを生成してもよい。

より具体的には、ＭＰＤファイルのRepresentationに、「SupplementalProperty
schemeIdUri=”urn:mpeg:dash:objectAudio:objectNumberBitrate”value=“number,bitrate1,bitrate2,…,bitratek”」（図中の符号１９）が追加される。valueにおけるnumberは、オーディオファイルに格納されているオブジェクトオーディオデータ数を示し、bitratekは、各オブジェクトオーディオデータのビットレートを、オブジェクトオーディオデータの格納順に示す。

当該実施例においては、サーバ１００のＭＰＤファイル生成部１１４が上記のnumberまたはbitratekのいずれかを適宜省略しても、クライアント２００のＭＰＤファイル処理部２１２は、各オブジェクトオーディオデータのビットレートを適切に算出することができる。

なお、上記の実施例１および実施例２が組み合わされるのではなく、実施例１と実施例３が組み合わされてもよい。換言すると、オーディオファイルに格納されているオブジェクトオーディオデータ数の情報と、各オブジェクトオーディオデータのビットレートの比がオブジェクトオーディオデータの格納順に示された情報がＭＰＤファイルに示されてもよい。

（５－２．ビットレートが時間の経過に伴って変化する場合のシグナリング例）
続いて、ビットレートが時間の経過に伴って変化する場合のシグナリング例について説明する。ここでは、ビットレートが優先度に応じて時間の経過と共に変化する場合のシグナリング例について説明する。

例えば、図３４に示すように、オブジェクトオーディオデータ１～オブジェクトオーディオデータ３が１つのオーディオファイルに格納される場合について考える。そして、時刻ｔ１においては、オブジェクトオーディオデータ１の優先度が３でビットレートが６４[kbps]であり、オブジェクトオーディオデータ２の優先度が２でビットレートが６４[kbps]であり、オブジェクトオーディオデータ３の優先度が１でビットレートが３２[kbps]である。そして、その後の時刻ｔ２においては、オブジェクトオーディオデータ２の優先度が１に、ビットレートが３２[kbps]に変化し、オブジェクトオーディオデータ３の優先度が２に、ビットレートが６４[kbps]に変化したとする。

（５－２－１．ビットレートが時間の経過に伴って変化する場合のシグナリング例（実施例５））
当該実施例は、オーディオファイルに格納されるオブジェクトオーディオデータのビットレートが時間の経過に伴って変化することだけを示すシグナリング例である。

より具体的には、図３５に示すように、ＭＰＤファイルのRepresentationに、「SupplementalProperty schemeIdUri=“urn:mpeg:dash:objectAudio:objectDynamicBitrate”」（図中の符号２０）が追加される。これによって、クライアント２００のＭＰＤファイル処理部２１２は、オブジェクトオーディオデータのビットレートが時間の経過に伴って変化することを認識することができ、任意の用途に活用することができる。なお、図３５および以降で説明するＭＰＤファイルの内容は適宜省略されている。

（５－２－２．ビットレートが時間の経過に伴って変化する場合のシグナリング例（実施例６））
当該実施例は、オーディオファイルに格納されるオブジェクトオーディオデータのビットレートが優先度に応じて決まることを示すことで、オブジェクトオーディオデータのビットレートが時間の経過に伴って変化することを示すシグナリング例である。

より具体的には、図３６に示すように、ＭＰＤファイルのRepresentationに、「SupplementalProperty schemeIdUri=“urn:mpeg:dash:objectAudio:objectBitratePriority”value=“bitrate1,bitreta2,…,bitratek”」（図中の符号２１）が追加される。valueは、優先度の高い順に並べられたオブジェクトオーディオデータのビットレートを示す。これによって、クライアント２００のＭＰＤファイル処理部２１２は、各オブジェクトオーディオデータのビットレートを認識することができる。

（５－２－３．ビットレートが時間の経過に伴って変化する場合のシグナリング例（実施例７））
当該実施例は、オーディオファイルに格納されるオブジェクトオーディオデータのビットレートの比が優先度に応じて決まることを示すことで、オブジェクトオーディオデータのビットレートが時間の経過に伴って変化することを示すシグナリング例である。

より具体的には、図３７に示すように、ＭＰＤファイルのRepresentationに、「SupplementalProperty schemeIdUri=“urn:mpeg:dash:objectAudio:objectBitrateRatioPriority”
value=“ratio1, ratio2,…,ratiok”」（図中の符号２２）が追加される。valueは、優先度の高い順に並べられたオブジェクトオーディオデータのビットレートの比を示す。

これによって、クライアント２００のＭＰＤファイル処理部２１２は、オーディオファイル全体のビットレート（図中の「bitrate=“160000”」）と各オブジェクトオーディオデータのビットレートの比を用いて各オブジェクトオーディオデータのビットレートを算出することができる。

（５－２－４．ビットレートが時間の経過に伴って変化する場合のシグナリング例（実施例８））
当該実施例は、ビットレートをオーディオファイルへの格納順で示す方法と、ビットレートを優先度の高い順で示す方法とを切り替えることができるシグナリング例である。

より具体的には、図３８に示すように、ＭＰＤファイルのRepresentationに、「SupplementalProperty
schemeIdUri=“urn:mpeg:dash:objectAudio:objectBitrate” value=“flag,bitrate1,bitrate2,…,bitratek”」（図中の符号２３）が追加される。valueにおけるflagは、ビットレートがオーディオファイルへの格納順で並んでいるのか、優先度の高い順で並んでいるのかを示す。例えば、flagが0であることは、ビットレートがオーディオファイルへの格納順で並んでいることを示し、flagが1であることは、ビットレートが優先度の高い順で並んでいることを示す。また、valueにおけるbitratekは、各オブジェクトオーディオデータのビットレートを示す。

なお、valueにおけるbitratekによって各オブジェクトオーディオデータのビットレートが示されるのではなく、ratiokによって各オブジェクトオーディオデータのビットレートの比が示されてもよい。また、オーディオファイルに含まれるオブジェクトオーディオデータの優先度が互いに同一であっても、オブジェクトオーディオデータのビットレートが互いに異なるオーディオファイルが作成され、上記のようなシグナリングが行われてもよい。この場合、クライアント２００は、ユーザ所望のオーディオファイルを選択することができる。

＜６．ディスクリプション情報のシグナリング例＞
上記では、ビットレート情報のシグナリング例について説明した。続いて、ディスクリプション情報のシグナリング例について説明する。

ここで、ディスクリプション情報とは、オーディオファイルに格納されるオブジェクトオーディオデータの内容（または、種類、種別、カテゴリー等）を示す情報である。例えば、図３９の３９Ａに示すように、オブジェクトオーディオデータ１～オブジェクトオーディオデータ３が１つのオーディオファイルに格納されており、それぞれの内容が、メインボーカル、コーラス、バンドであるとする。この場合、サーバ１００のＭＰＤファイル生成部１１４は、３９Ｂに示すようなＭＰＤファイルを生成する。

より具体的には、ＭＰＤファイルのRepresentationに、「SupplementalProperty
schemeIdUri=“urn:mpeg:dash:objectAudio:objectDescription”value=“description1,description2,…,descriptionk”」（図中の符号２４）が追加される。valueは、オブジェクトオーディオデータのディスクリプション情報を、オブジェクトオーディオデータの格納順に示すものである。例えば、valueには、３９Ｂに示すように、「“メインボーカル,コーラス,バンド”」が格納される。

これによって、クライアント２００を操作するユーザは、各オブジェクトオーディオデータの内容を認識することができるため、所望のオーディオファイルを容易に選択することができる。なお、図３９の３９Ｂに示したＭＰＤファイルの内容は適宜省略されている。

＜７．クライアント２００の処理例＞
上記では、ディスクリプション情報のシグナリング例について説明した。続いて、クライアント２００の処理例について説明する。

（７－１．優先度が時間の経過に伴って変化しない場合のクライアント２００の処理例）
まず、図４０を参照して、優先度が時間の経過に伴って変化しない場合のクライアント２００の処理例について説明する。図４０は、優先度が時間の経過に伴って変化しない場合において、クライアント２００がオーディオコンテンツの再生に用いるオーディオファイルを取得するまでの処理例を示すフローチャートである。

ステップＳ１０００では、クライアント２００のＭＰＤファイル処理部２１２がＭＰＤファイルのAdaptationSetの各オーディオファイルに格納されるオブジェクトオーディオデータのビットレート情報をＭＰＤファイルから取得する（または、ＭＰＤファイルの情報に基づいて算出する）。ステップＳ１００４では、ＭＰＤファイル処理部２１２がAdaptationSetのSupplementalPropertyのobjectAcquisitionPriorityから優先度情報を取得する。

ステップＳ１００８では、セグメントファイル選択部２１３が、優先度のより高いオーディオファイルに格納されるオブジェクトオーディオデータのうちの最低のビットレートが、優先度のより低いオーディオファイルに格納されるオブジェクトオーディオデータのうちの最高のビットレート以上となるようなオーディオファイルの組合せを出力する。換言すると、セグメントファイル選択部２１３は、優先度のより高いオーディオファイルのオブジェクトオーディオデータのビットレートがより高くなるような組合せを出力する。そして、セグメントファイル選択部２１３は、出力したオーディオファイルを、合計のビットレートの高い順に並べる。

ここで、図４１を参照して具体例について説明する。図４１の４１Ａに示すように、オブジェクトオーディオデータ１～オブジェクトオーディオデータ３が格納されたオーディオファイル１のビットレート違いであるオーディオファイル１－１～オーディオファイル１－３と、オブジェクトオーディオデータ４が格納されたオーディオファイル２のビットレート違いであるオーディオファイル２－１およびオーディオファイル２－２が存在する場合について考える。そして、オーディオファイル１の優先度は２、オーディオファイル２の優先度は１であるとする。

この場合、ステップＳ１００８における、優先度のより高いオーディオファイルに格納されるオブジェクトオーディオデータのうちの最低のビットレートが、優先度のより低いオーディオファイルに格納されるオブジェクトオーディオデータのうちの最高のビットレート以上となるようなオーディオファイルの組合せは、４１Ｂに示す組合せ１～組合せ４である。

そして、ステップＳ１０１２にて、セグメントファイル選択部２１３は、利用可能な伝送帯域を決定する。ステップＳ１０１６では、セグメントファイル選択部２１３が、利用可能な伝送帯域に基づいて最も高いビットレートで伝送可能な組合せを、ステップＳ１００８で出力した組合せの中から選択し、セグメントファイル取得部２１４が当該組合せのオーディオファイルをサーバ１００から取得する。

その後、次の時刻のセグメントデータがある場合（ステップＳ１０２０／Ｎｏ）、ステップＳ１０１２およびステップＳ１０１６の処理が継続して行われる。次の時刻のセグメントデータがない場合（ステップＳ１０２０／Ｙｅｓ）、すなわち、コンテンツの最後までセグメントデータを取得した場合は、オーディオファイルの取得に関する一連の処理が終了する。ステップＳ１０１６で取得されたセグメントデータは、復号処理部２１５および合成処理部２１６によって、オブジェクトオーディオデータの復号処理および合成処理等を行われることで、オーディオコンテンツがユーザに提供される。

（７－２．優先度が時間の経過に伴って変化する場合のクライアント２００の処理例）
続いて、図４２を参照して、優先度が時間の経過に伴って変化する場合のクライアント２００の処理例について説明する。図４２は、優先度が時間の経過に伴って変化する場合において、クライアント２００がオーディオコンテンツの再生に用いるオーディオファイルを取得するまでの処理例を示すフローチャートである。

ステップＳ１１００では、クライアント２００のＭＰＤファイル処理部２１２がＭＰＤファイルのAdaptationSetの各オーディオファイルに格納されるオブジェクトオーディオデータのビットレート情報をＭＰＤファイルから取得する（または、ＭＰＤファイルの情報に基づいて算出する）。ステップＳ１１０４では、セグメントファイル選択部２１３が、メタデータファイルから、次の再生時刻の再生に必要なすべてのオブジェクトオーディオデータの優先度を取得する。

ステップＳ１１０８では、セグメントファイル選択部２１３が、優先度のより高いオーディオファイルに格納されるオブジェクトオーディオデータのうちの最低のビットレートが、優先度のより低いオーディオファイルに格納されるオブジェクトオーディオデータのうちの最高のビットレート以上となるようなオーディオファイルの組合せを出力する。換言すると、セグメントファイル選択部２１３は、優先度のより高いオーディオファイルのオブジェクトオーディオデータのビットレートがより高くなるような組合せを出力する。そして、セグメントファイル選択部２１３は、出力したオーディオファイルを、合計のビットレートの高い順に並べる。

ここで、図４３を参照して具体例について説明する。図４３の４３Ａに示すように、オブジェクトオーディオデータ１～オブジェクトオーディオデータ３が格納されたオーディオファイル１のビットレート違いであるオーディオファイル１－１～オーディオファイル１－３と、オブジェクトオーディオデータ４が格納されたオーディオファイル２のビットレート違いであるオーディオファイル２－１およびオーディオファイル２－２が存在する場合について考える。そして、オブジェクトオーディオデータ１の優先度が４、オブジェクトオーディオデータ２の優先度が３、オブジェクトオーディオデータ３の優先度が２、オブジェクトオーディオデータ４の優先度が１であり、これらの優先度が時間の経過に伴って変化するとする。そして、オーディオファイル１およびオーディオファイル２の優先度は、それぞれに格納された各オブジェクトオーディオデータの優先度の変化に伴って変化するとする。

この場合、ステップＳ１１０８における、優先度のより高いオーディオファイルに格納されるオブジェクトオーディオデータのうちの最低のビットレートが、優先度のより低いオーディオファイルに格納されるオブジェクトオーディオデータのうちの最高のビットレート以上となるようなオーディオファイルの組合せは、４３Ｂに示す組合せ１～組合せ４である。

そして、ステップＳ１１１２にて、セグメントファイル選択部２１３は、利用可能な伝送帯域を決定する。ステップＳ１１１６では、セグメントファイル選択部２１３が、利用可能な伝送帯域に基づいて最も高いビットレートで伝送可能な組合せを、ステップＳ１１０８で出力した組合せの中から選択し、セグメントファイル取得部２１４が当該組合せのオーディオファイルをサーバ１００から取得する。

その後、次の時刻のセグメントデータがある場合（ステップＳ１１２０／Ｎｏ）、ステップＳ１１０４～ステップＳ１１１６の処理が継続して行われる。換言すると、優先度が時間の経過に伴って変化するため、セグメントファイル選択部２１３は、随時取得されるメタデータファイルから、次の再生時刻の再生に必要なすべてのオブジェクトオーディオデータの優先度を取得し続けることで、優先度の変化に適切に対応する。次の時刻のセグメントデータがない場合（ステップＳ１１２０／Ｙｅｓ）、すなわち、コンテンツの最後までセグメントデータを取得した場合は、オーディオファイルの取得に関する一連の処理が終了する。ステップＳ１１１６で取得されたセグメントデータは、復号処理部２１５および合成処理部２１６によって、オブジェクトオーディオデータの復号処理および合成処理等を行われることで、オーディオコンテンツがユーザに提供される。

なお、図４０および図４２のフローチャートにおける各ステップは、必ずしも記載された順序に沿って時系列に処理される必要はない。すなわち、フローチャートにおける各ステップは、記載された順序と異なる順序で処理されても、並列的に処理されてもよい。

＜８．ハードウェア構成例＞
上記では、クライアント２００の処理例について説明した。続いて、図４４を参照して、サーバ１００またはクライアント２００のハードウェア構成例について説明する。

図４４は、サーバ１００またはクライアント２００を具現する情報処理装置９００のハードウェア構成例を示すブロック図である。情報処理装置９００は、ＣＰＵ（Central Processing Unit）９０１と、ＲＯＭ（Read Only
Memory）９０２と、ＲＡＭ（Random Access Memory）９０３と、ホストバス９０４と、ブリッジ９０５と、外部バス９０６と、インタフェース９０７と、入力装置９０８と、出力装置９０９と、ストレージ装置（ＨＤＤ）９１０と、ドライブ９１１と、通信装置９１２とを備える。

ＣＰＵ９０１は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置９００内の動作全般を制御する。また、ＣＰＵ９０１は、マイクロプロセッサであってもよい。ＲＯＭ９０２は、ＣＰＵ９０１が使用するプログラムや演算パラメータ等を記憶する。ＲＡＭ９０３は、ＣＰＵ９０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはＣＰＵバスなどから構成されるホストバス９０４により相互に接続されている。当該ＣＰＵ９０１、ＲＯＭ９０２およびＲＡＭ９０３の協働により、サーバ１００の処理部１１０もしく制御部１２０、または、クライアント２００の処理部２１０もしくは制御部２２０の各機能が実現される。

ホストバス９０４は、ブリッジ９０５を介して、ＰＣＩ（Peripheral Component Interconnect/Interface）バスなどの外部バス９０６に接続されている。なお、必ずしもホストバス９０４、ブリッジ９０５および外部バス９０６を分離構成する必要はなく、１つのバスにこれらの機能を実装してもよい。

入力装置９０８は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチおよびレバーなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、ＣＰＵ９０１に出力する入力制御回路などから構成されている。情報処理装置９００を使用するユーザは、該入力装置９０８を操作することにより、各装置に対して各種のデータを入力したり処理動作を指示したりすることができる。

出力装置９０９は、例えば、ＣＲＴ（Cathode Ray Tube）ディスプレイ装置、液晶ディスプレイ（ＬＣＤ）装置、ＯＬＥＤ（Organic Light Emitting Diode）装置およびランプなどの表示装置を含む。さらに、出力装置９０９は、スピーカおよびヘッドホンなどの音声出力装置を含む。出力装置９０９は、例えば、再生されたコンテンツを出力する。具体的には、表示装置は再生された映像データ等の各種情報をテキストまたはイメージで表示する。一方、音声出力装置は、再生された音声データ等を音声に変換して出力する。

ストレージ装置９１０は、データ格納用の装置である。ストレージ装置９１０は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置９１０は、例えば、ＨＤＤ（Hard Disk Drive）で構成される。このストレージ装置９１０は、ハードディスクを駆動し、ＣＰＵ９０１が実行するプログラムや各種データを格納する。当該ストレージ装置９１０によって、サーバ１００の記憶部１４０またはクライアント２００の記憶部２４０の機能が実現される。

ドライブ９１１は、記憶媒体用リーダライタであり、情報処理装置９００に内蔵、あるいは外付けされる。ドライブ９１１は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体９１３に記録されている情報を読み出して、ＲＡＭ９０３に出力する。また、ドライブ９１１は、リムーバブル記憶媒体９１３に情報を書き込むこともできる。

通信装置９１２は、例えば、通信網９１４に接続するための通信デバイス等で構成された通信インタフェースである。通信装置９１２によって、サーバ１００の通信部１３０またはクライアント２００の通信部２３０の機能が実現される。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）
オブジェクトオーディオデータ単位で優先度が設定されたストリームデータを送信する送信部を備える、
送信装置。
（２）
前記ストリームデータは、MPEG-DASH（Dynamic Adaptive
Streaming over Http）によって規定されたデータである、
前記（１）に記載の送信装置。
（３）
前記優先度に基づいて１または２以上の前記オブジェクトオーディオデータをオーディオファイルに含めることで前記ストリームデータを生成する処理部をさらに備える、
前記（１）または（２）に記載の送信装置。
（４）
前記処理部は、前記優先度に基づいて前記オーディオファイル単位で別の優先度を設定する、
前記（３）に記載の送信装置。
（５）
前記処理部は、前記ストリームデータについてのＭＰＤファイル、または、前記オブジェクトオーディオデータに対応するオブジェクトメタデータを含むメタデータファイルのいずれかに前記優先度に関する情報を含める、
前記（３）または（４）に記載の送信装置。
（６）
前記優先度が時間の経過に伴って変化しない場合、前記処理部は、前記ＭＰＤファイルに前記優先度に関する情報を含める、
前記（５）に記載の送信装置。
（７）
前記処理部は、前記ＭＰＤファイルのアダプテーションセット（AdaptationSet）に前記優先度に関する情報を含める、
前記（６）に記載の送信装置。
（８）
前記優先度が時間の経過に伴って変化する場合、前記処理部は、前記メタデータファイルに前記優先度に関する情報を含める、
前記（５）に記載の送信装置。
（９）
前記処理部は、前記ＭＰＤファイルを用いて前記メタデータファイルと前記オーディオファイルを対応付ける、
前記（８）に記載の送信装置。
（１０）
前記処理部は、前記オブジェクトオーディオデータのビットレートに関する情報を前記ＭＰＤファイルに含める、
前記（５）から（９）のいずれか１項に記載の送信装置。
（１１）
前記処理部は、前記ビットレートに関する情報を、前記オブジェクトオーディオデータごとに前記ＭＰＤファイルに含める、
前記（１０）に記載の送信装置。
（１２）
前記処理部は、前記ビットレートに関する情報を、前記優先度ごとに前記ＭＰＤファイルに含める、
前記（１０）に記載の送信装置。
（１３）
前記処理部は、前記ビットレートに関する情報を、前記オブジェクトオーディオデータごとに前記ＭＰＤファイルに含めるか、前記優先度ごとに前記ＭＰＤファイルに含めるかを示すflagを前記ＭＰＤファイルに含める、
前記（１１）または（１２）に記載の送信装置。
（１４）
前記処理部は、前記オブジェクトオーディオデータのディスクリプション情報を前記ＭＰＤファイルに含める、
前記（５）から（１３）のいずれか１項に記載の送信装置。
（１５）
オブジェクトオーディオデータ単位で優先度が設定されたストリームデータを送信することを有する、
コンピュータにより実行される送信方法。
（１６）
オブジェクトオーディオデータ単位で優先度が設定されたストリームデータを送信すること、
をコンピュータに実現させるためのプログラム。
（１７）
オブジェクトオーディオデータ単位で優先度が設定されたストリームデータを受信する受信部を備える、
受信装置。
（１８）
前記ストリームデータは、MPEG-DASH（Dynamic Adaptive
Streaming over Http）によって規定されたデータである、
前記（１７）に記載の受信装置。
（１９）
前記ストリームデータについてのＭＰＤファイル、または、前記オブジェクトオーディオデータに対応するオブジェクトメタデータを含むメタデータファイルのいずれかに含まれる前記優先度に関する情報に基づいて前記ストリームデータの受信処理を行う処理部をさらに備える、
前記（１７）または（１８）に記載の受信装置。
（２０）
前記優先度が時間の経過に伴って変化しない場合、前記処理部は、前記ＭＰＤファイルに含まれる前記優先度に関する情報に基づいて前記ストリームデータの受信処理を行う、
前記（１９）に記載の受信装置。
（２１）
前記優先度が時間の経過に伴って変化する場合、前記処理部は、前記メタデータファイルに含まれる前記優先度に関する情報に基づいて前記ストリームデータの受信処理を行う、
前記（１９）に記載の受信装置。
（２２）
前記処理部は、前記ＭＰＤファイルに含まれる、前記オブジェクトオーディオデータのビットレートに関する情報に基づいて前記ストリームデータの選択および前記受信処理を行う、
前記（１９）から（２１）のいずれか１項に記載の受信装置。
（２３）
前記処理部は、前記ＭＰＤファイルに含まれる、前記オブジェクトオーディオデータのディスクリプション情報に基づいて前記ストリームデータの選択および前記受信処理を行う、
前記（１９）から（２２）のいずれか１項に記載の受信装置。
（２４）
オブジェクトオーディオデータ単位で優先度が設定されたストリームデータを受信することを有する、
コンピュータにより実行される受信方法。
（２５）
オブジェクトオーディオデータ単位で優先度が設定されたストリームデータを受信すること、
をコンピュータに実現させるためのプログラム。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）
オブジェクトオーディオデータとオブジェクトメタデータを含むオーディオファイル、および、前記オブジェクトオーディオデータを含まず前記オブジェクトメタデータを含むメタデータファイルを生成する処理部を備える、
情報処理装置。
（２）
前記メタデータファイルは、複数の前記オーディオファイルのそれぞれに含まれるオブジェクトメタデータを含む、
前記（１）に記載の情報処理装置。
（３）
前記メタデータファイルは、前記オブジェクトオーディオデータ単位で設定された優先度に関する情報を含む、
前記（１）または（２）に記載の情報処理装置。
（４）
前記メタデータファイルおよび前記オーディオファイルは、MP4（ISO/IEC Part 12 ISO Base Media File Format）によって規定されたファイルである、
前記（１）から（３）のいずれか１項に記載の情報処理装置。
（５）
前記処理部は、前記メタデータファイルを生成する際、前記メタデータファイルが対応する前記オーディオファイルの特定に用いられる情報を前記MP4におけるMovie Boxに含める、
前記（４）に記載の情報処理装置。
（６）
前記処理部は、前記メタデータファイルが対応する前記オーディオファイルの特定に用いられる情報を前記Movie BoxにおけるSample Description Boxに含める、
前記（５）に記載の情報処理装置。
（７）
前記処理部は、前記メタデータファイルが対応する前記オーディオファイルの特定に用いられる情報を前記Sample Description BoxにおけるSample Entryに含める、
前記（６）に記載の情報処理装置。
（８）
前記オーディオファイルの特定に用いられる情報は、streamIDを含み、
前記メタデータファイルに含まれる前記オブジェクトメタデータは、前記streamIDによって前記オーディオファイルと対応付けられる、
前記（５）から（７）のいずれか１項に記載の情報処理装置。
（９）
前記オブジェクトメタデータおよび前記オブジェクトオーディオデータは、MPEG-H 3D AudioまたはAAC 3D Audioによって規定されたデータである、
前記（１）から（８）のいずれか１項に記載の情報処理装置。
（１０）
前記オブジェクトメタデータおよび前記オブジェクトオーディオデータが前記AAC 3D Audioによって規定されたデータである場合、
前記処理部は、前記オーディオファイルを生成する際、前記オーディオファイルを含む複数のオーディオファイル間の対応関係を示す情報をMP4におけるMovie Boxに含める、
前記（９）に記載の情報処理装置。
（１１）
オブジェクトオーディオデータとオブジェクトメタデータを含むオーディオファイル、および、前記オブジェクトオーディオデータを含まず前記オブジェクトメタデータを含むメタデータファイルを生成することを有する、
コンピュータにより実行される情報処理方法。
（１２）
オブジェクトオーディオデータとオブジェクトメタデータを含むオーディオファイル、および、前記オブジェクトオーディオデータを含まず前記オブジェクトメタデータを含むメタデータファイルを生成すること、
をコンピュータに実現させるためのプログラム。
（１３）
オブジェクトオーディオデータとオブジェクトメタデータを含むオーディオファイル、および、前記オブジェクトオーディオデータを含まず前記オブジェクトメタデータを含むメタデータファイルに対する受信処理を行う処理部を備える、
情報処理装置。
（１４）
前記メタデータファイルは、複数の前記オーディオファイルのそれぞれに含まれるオブジェクトメタデータを含む、
前記（１３）に記載の情報処理装置。
（１５）
前記メタデータファイルは、前記オブジェクトオーディオデータ単位で設定された優先度に関する情報を含む、
前記（１３）または（１４）に記載の情報処理装置。
（１６）
前記メタデータファイルおよび前記オーディオファイルは、MP4（ISO/IEC Part 12 ISO Base Media File Format）によって規定されたファイルである、
前記（１３）から（１５）のいずれか１項に記載の情報処理装置。
（１７）
前記処理部は、前記メタデータファイルに対する受信処理の際、前記MP4におけるMovie Boxに含まれる情報を用いて前記メタデータファイルが対応する前記オーディオファイルを特定する、
前記（１６）に記載の情報処理装置。
（１８）
前記処理部は、前記Movie BoxにおけるSample Description Boxに含まれる情報を用いて前記メタデータファイルが対応する前記オーディオファイルを特定する、
前記（１７）に記載の情報処理装置。
（１９）
前記処理部は、前記Sample Description BoxにおけるSample Entryに含まれる情報を用いて前記メタデータファイルが対応する前記オーディオファイルを特定する、
前記（１８）に記載の情報処理装置。
（２０）
前記メタデータファイルに含まれる前記オブジェクトメタデータは、streamIDによって前記オーディオファイルと対応付けられる、
前記（１７）から１９のいずれか１項に記載の情報処理装置。
（２１）
前記オブジェクトメタデータおよび前記オブジェクトオーディオデータは、MPEG-H 3D AudioまたはAAC 3D Audioによって規定されたデータである、
前記（１３）から（２０）のいずれか１項に記載の情報処理装置。
（２２）
前記オブジェクトメタデータおよび前記オブジェクトオーディオデータが前記AAC 3D Audioによって規定されたデータである場合、
前記処理部は、前記オーディオファイルに対する受信処理の際、MP4におけるMovie Boxに含まれる情報を用いて前記オーディオファイルを含む複数のオーディオファイル間の対応関係を認識する、
前記（２１）に記載の情報処理装置。
（２３）
オブジェクトオーディオデータとオブジェクトメタデータを含むオーディオファイル、および、前記オブジェクトオーディオデータを含まず前記オブジェクトメタデータを含むメタデータファイルに対する受信処理を行うことを有する、
コンピュータにより実行される情報処理方法。
（２４）
オブジェクトオーディオデータとオブジェクトメタデータを含むオーディオファイル、および、前記オブジェクトオーディオデータを含まず前記オブジェクトメタデータを含むメタデータファイルに対する受信処理を行うこと、
をコンピュータに実現させるためのプログラム。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）
取得されたオブジェクトオーディオデータごとに優先度を設定し、
前記優先度に基づいて、１または２以上の前記オブジェクトオーディオデータから、生成されるセグメントファイルに含める前記オブジェクトオーディオデータを決定し、
前記優先度に基づいて、生成された前記セグメントファイルに対し設定する新たな優先度を優先度情報として生成する処理部を備える、
情報処理装置。
（２）
前記処理部は、更に、前記オブジェクトオーディオデータに対応する符号化されたオブジェクトメタデータを有するメタデータファイルを生成し、
前記オブジェクトメタデータには前記優先度情報が含まれる、
前記（１）に記載の情報処理装置。
（３）
前記優先度情報が時間の経過に伴って変化しない場合、前記処理部は、更に、前記セグメントファイルについてのＭＰＤファイルを生成し、前記ＭＰＤファイルに前記優先度情報を含める、
前記（１）に記載の情報処理装置。
（４）
前記処理部は、前記ＭＰＤファイルのアダプテーションセット（AdaptationSet）に前記優先度情報を含める、
前記（３）に記載の情報処理装置。
（５）
前記優先度情報が時間の経過に伴って変化する場合、前記処理部は、更に、前記セグメントファイル及び前記メタデータファイルについてのＭＰＤファイルを生成する、
前記（２）に記載の情報処理装置。
（６）
前記処理部は、前記オブジェクトオーディオデータのビットレートに関する情報を、前記オブジェクトオーディオデータごとに前記ＭＰＤファイルに含める、
前記（４）または（５）に記載の情報処理装置。
（７）
前記処理部は、前記セグメントファイルの特定に用いられる情報を、前記メタデータファイルのMovie BoxのSample Description Boxに格納する、
前記（２）に記載の情報処理装置。
（８）
前記処理部は、前記セグメントファイルの特定に用いられる情報を、前記Sample Description BoxにおけるSample Entryに格納する
前記（７）に記載の情報処理装置。
（９）
前記セグメントファイルの特定に用いられる情報には、前記セグメントファイルをユニークに識別するためのstreamIDが含まれる
前記（８）に記載の情報処理装置。
（１０）
取得されたオブジェクトオーディオデータごとに優先度が設定されたストリームデータを情報処理することを有する、
コンピュータにより実行される情報処理方法。
（１１）
取得されたオブジェクトオーディオデータごとに優先度が設定されたストリームデータを情報処理すること、
をコンピュータに実現させるためのプログラム。

１００サーバ
１１０処理部
１１１データ取得部
１１２符号化処理部
１１３セグメントファイル生成部
１１４ＭＰＤファイル生成部
１２０制御部
１３０通信部
１４０記憶部
２００クライアント
２１０処理部
２１１ＭＰＤファイル取得部
２１２ＭＰＤファイル処理部
２１３セグメントファイル選択部
２１４セグメントファイル取得部
２１５復号処理部
２１６合成処理部
２２０制御部
２３０通信部
２４０記憶部
３００インターネット

Claims

取得されたオブジェクトオーディオデータごとに優先度を設定し、
前記優先度に基づいて、１または２以上の前記オブジェクトオーディオデータから、生成されるセグメントファイルに含める前記オブジェクトオーディオデータを決定し、
前記優先度に基づいて、生成された前記セグメントファイルに対し設定する新たな優先度を優先度情報として生成する処理部を備える、
情報処理装置。
前記処理部は、更に、前記オブジェクトオーディオデータに対応する符号化されたオブジェクトメタデータを有するメタデータファイルを生成し、
前記オブジェクトメタデータには前記優先度情報が含まれる、
請求項１に記載の情報処理装置。
前記優先度情報が時間の経過に伴って変化しない場合、前記処理部は、更に、前記セグメントファイルについてのＭＰＤファイルを生成し、前記ＭＰＤファイルに前記優先度情報を含める、
請求項１に記載の情報処理装置。
前記処理部は、前記ＭＰＤファイルのアダプテーションセット（AdaptationSet）に前記優先度情報を含める、
請求項３に記載の情報処理装置。
前記優先度情報が時間の経過に伴って変化する場合、前記処理部は、更に、前記セグメントファイル及び前記メタデータファイルについてのＭＰＤファイルを生成する、
請求項２に記載の情報処理装置。
前記処理部は、前記オブジェクトオーディオデータのビットレートに関する情報を、前記オブジェクトオーディオデータごとに前記ＭＰＤファイルに含める、
請求項４または５に記載の情報処理装置。
前記処理部は、前記セグメントファイルの特定に用いられる情報を、前記メタデータファイルのMovie BoxのSample Description Boxに格納する、
請求項２に記載の情報処理装置。
前記処理部は、前記セグメントファイルの特定に用いられる情報を、前記Sample Description BoxにおけるSample Entryに格納する
請求項７に記載の情報処理装置。
前記セグメントファイルの特定に用いられる情報には、前記セグメントファイルをユニークに識別するためのstreamIDが含まれる
請求項８に記載の情報処理装置。
取得されたオブジェクトオーディオデータごとに設定された優先度に基づいて１または２以上の前記オブジェクトオーディオデータから決定された前記オブジェクトオーディオデータを含めて生成されるセグメントファイルに対して、前記優先度に基づき新たな優先度が設定されたストリームデータを情報処理することを有する、
コンピュータにより実行される情報処理方法。
取得されたオブジェクトオーディオデータごとに設定された優先度に基づいて１または２以上の前記オブジェクトオーディオデータから決定された前記オブジェクトオーディオデータを含めて生成されるセグメントファイルに対して、前記優先度に基づき新たな優先度が設定されたストリームデータを情報処理すること、
をコンピュータに実現させるためのプログラム。