JP7517324B2

JP7517324B2 - 情報処理装置、情報処理方法及び情報処理プログラム

Info

Publication number: JP7517324B2
Application number: JP2021504982A
Authority: JP
Inventors: 義行小林; 俊也浜田
Original assignee: Sony Corp; Sony Group Corp
Current assignee: Sony Corp; Sony Group Corp
Priority date: 2019-03-08
Filing date: 2020-03-05
Publication date: 2024-07-17
Anticipated expiration: 2040-03-05

Description

本開示は、情報処理装置、情報処理方法及び情報処理プログラムに関する。

ストリーミング再生において、視点切り替えや音声の言語切り替え等によりコンテンツが切り替えられた場合、ビットストリームを分割したセグメント単位でコンテンツの切り替えが実行される。

Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio, AMENDMENT 2: MPEG-H 3D Audio File Format Support INTERNATIONAL STANDARD ISO/IEC 14496-12 Information technology - Coding of audio-visual objects - Part 12: ISO base media file format INTERNATIONAL STANDARD ISO/IEC 23009-1 Information technology - Dynamic adaptive streaming over HTTP (DASH) - Part 1: Media presentation description and segment formats

しかしながら、コンテンツ製作者により設定されたセグメント長が長い場合、セグメント単位でコンテンツの切り替えが実行されているため、切り替え後のコンテンツの出力を開始するまでに時間がかかり、切り替え遅延としてユーザに認識されていた。

そこで、本開示では、コンテンツの切り替えにかかる時間を短縮することができる情報処理装置、情報処理方法及び情報処理プログラムを提案する。

上記の課題を解決するために、本開示に係る一形態の情報処理装置は、複数のセグメントを有するセグメントファイルと、前記セグメントファイルが属するグループが設定された設定ファイルとを受信する受信部と、前記受信部が受信した前記セグメントファイルの前記セグメントに１以上含まれるＭＰ４サンプルを抽出して、当該ＭＰ４サンプルの再生開始時間を含む属性情報を当該ＭＰ４サンプルに付加する抽出部と、受け付けた前記グループを切り替える操作と、前記属性情報に基づいて、切り替え後の前記グループに属する前記セグメントファイルを出力させる切り替え位置を前記ＭＰ４サンプル単位で決定する決定部と、前記切り替え位置から切り替え後の前記グループに属する前記セグメントファイルから生成した出力信号を前記出力装置に出力する出力部と、を備える。

本開示の第１の実施形態に係るストリーミングシステムの構成例を示す図である。本開示の第１の実施形態に係るサーバ装置の構成例を示す図である。本開示の第１の実施形態に係るセグメントファイルのデータ構成例を示す図である。本開示の第１の実施形態に係るメディアセグメントのデータ構成例を示す図である。本開示の第１の実施形態に係るＭＰＤファイルのデータ構成例を示す図である。本開示のセグメントファイルのグループの一例を説明する図である。本開示の第１の実施形態に係るクライアント装置の構成例を示す図である。本開示の第１の実施形態に係るＨＴＴＰアクセス制御部の構成例を示す図である。本開示の第１の実施形態に係るセグメントバッファに記憶されたセグメントのデータ構成例を示す図である。本開示の第１の実施形態に係るメディアエンジンの構成例を示す図である。本開示の第１の実施形態に係るＭＰ４サンプルバッファに記憶されたＭＰ４サンプルのデータ構成例を示す図である。本開示の第１の実施形態に係る３Ｄオーディオデコーダの構成例を示す図である。本開示の第１の実施形態に係る出力バッファに記憶された出力信号のデータ構成例を示す図である。本開示の第１の実施形態に係るクライアント装置が実行するストリーミング再生処理の一例を示すフローチャートである。本開示の第１の実施形態に係るＨＴＴＰアクセス制御部が実行するダウンロード処理の一例を示すフローチャートである。本開示の第１の実施形態に係るメディアエンジンが実行するメディアエンジン処理の一例を示すフローチャートである。本開示の第１の実施形態に係る抽出部が実行するデマルチプレックス処理の一例を示すフローチャートである。本開示の第１の実施形態に係る抽出部が実行するデコード処理の一例を示すフローチャートである。本開示の第１の実施形態に係る３Ｄオーディオデコーダが実行する１次デコード処理の一例を示すフローチャートである。本開示の第１の実施形態に係る３Ｄオーディオデコーダが実行する２次デコード処理の一例を示すフローチャートである。本開示の第１の実施形態に係るクライアント装置が実行するコンテンツのグループ切り替え処理の一例を示すフローチャートである。本開示の第１の実施形態に係るクライアント装置が実行する処理時間算出処理の一例を示すフローチャートである。本開示の第１の実施形態に係る出力バッファでの切り替えの一例を示す説明図である。本開示の図２３に示す図において切り替え後のグループに属するメタデータＢのビットストリームを受信した場合の一例を示す説明図である。本開示の第１の実施形態に係るＭＰ４サンプルバッファでの切り替えの一例を示す説明図である。本開示の図２５に示す図において切り替え後のグループに属するメタデータＢのビットストリームを受信した場合の一例を示す説明図である。本開示の第１の実施形態に係るセグメントバッファでの切り替えの一例を示す説明図である。本開示の図２７に示す図において切り替え後のグループに属するメタデータＢのビットストリームを受信した場合の一例を示す説明図である。本開示の第１の実施形態に係るクライアント装置が実行するグループの切り替え位置の決定処理の一例を示すフローチャートである。本開示の切り替え後のセグメントファイルのダウンロードの一例を示す説明図である。本開示の第１の実施形態に係るクライアント装置が実行する切り替え後のグループのダウンロード処理の一例を示すフローチャートである。本開示の第１の実施形態に係るクライアント装置が実行する切り替え後のグループに属するセグメントのデマルチプレックス処理の一例を示すフローチャートである。本開示の第１の実施形態に係るクライアント装置が実行する切り替え後のグループに属するＭＰ４サンプルのデコード処理の一例を示すフローチャートである。本開示の第１の実施形態に係るクライアント装置が実行する切り替え後のグループに属する出力信号の出力処理の一例を示すフローチャートである。本開示の変形例（１）に係るＭＰ４サンプルバッファに記憶されたＭＰ４サンプルのデータ構成例を示す図である。本開示の変形例（１）に係る抽出部が実行するデマルチプレックス処理の一例を示すフローチャートである。本開示の変形例（１）に係るクライアント装置が実行するグループの切り替え位置の決定処理の一例を示すフローチャートである。

以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

例えば、ＭＰＥＧ（Moving Picture Experts Group）－ＤＡＳＨ（Dynamic Adaptive Streaming over HTTP）規格によりコンテンツのストリーミング再生を実行する場合、クライアントは、ＭＰＤ（Media Presentation Description）ファイルをサーバ装置から取得する。そして、クライアントは、ＭＰＤファイルに基づいて、コンテンツが有する一又は複数のセグメントファイルを取得する。すなわち、クライアントは、サーバ装置から送信されたセグメントファイルのビットストリームを受信する。

セグメントファイルは、例えば音声オブジェクトや、メタデータ等のデータである。音声オブジェクトは、音場を生成するための構成要素となる素材音である。例えば、音楽の場合、音声オブジェクトは、ギターの音や、ドラムの音など楽器の音等である。なお、何を音声オブジェクトとして扱うかについてはコンテンツ製作者により決定される。メタデータは、所定の基準となる視聴位置からの相対位置により表される音声オブジェクトの定位情報である。また、音声オブジェクトと、メタデータとは、グループ化により関連付けられている。すなわち、セグメントファイルは、グループ化により関連付けられている。そして、クライアントは、メタデータに基づいて、音声オブジェクトを再生させることで、ユーザの視聴位置に応じた音声を再生することができる。

ところで、視聴位置の切り替えや音声言語の切り替え等によりコンテンツのグループが切り替えられた場合、クライアントは、切り替え後のグループのビットストリームを受信する。この時、クライアントは、セグメントファイルを形成するセグメント単位で、グループの切り替えを行っている。すなわち、クライアントは、バッファに記憶された切り替え前のグループのビットストリームを再生した後に、セグメント単位で切り替え後のグループのビットストリームを再生している。

セグメント長は、コンテンツ製作者により設定される。そのため、セグメント長が長く設定されている場合、クライアントは、切り替え前のグループのビットストリームの再生が終了するまでに時間がかかっていた。すなわち、クライアントは、切り替え後のグループのビットストリームの再生を開始するまでに時間がかかり、切り替え遅延としてユーザに認識されていた。

そこで、以下の実施形態により、コンテンツの切り替えにかかる時間を短縮することができる情報処理装置、情報処理方法及び情報処理プログラムについて説明する。

（第１の実施形態）
［第１の実施形態に係るシステムの構成］
図１は、第１の実施形態に係るストリーミングシステム１の構成例を示す図である。ストリーミングシステム１は、サーバ装置１０と、クライアント装置２０と、出力装置３０とを備えている。サーバ装置１０と、クライアント装置２０とは、インターネット等のネットワークを介して通信可能に接続されている。また、クライアント装置２０と、出力装置３０とは、通信可能に接続されている。図１には、サーバ装置１０と、クライアント装置２０と、出力装置３０とが一台ずつ記載されているが、各装置の台数は複数台であってもよい。なお、第１の実施形態では、ストリーミング再生の対象が音声である場合を例に説明する。しかし、ストリーミング再生の対象は、音声に限らず、動画であってもよいし、音声と動画との組み合わせであってもよい。

この場合、サーバ装置１０は、例えばテクスチャと、頂点データとを分離して配信する。更に詳しくは、サーバ装置１０は、テクスチャ群を一枚のビデオフレームにまとめてＭＰＥＧ４－ＡＶＣで圧縮したビデオストリームとテクスチャマッピングに使用する頂点データ（ポリゴン）を異なるＭＰ４ファイルで配信する。そして、クライアント装置２０は、テクスチャの一次デコードではビデオストリームを復号してＹＵＶ信号を出力する。また、クライアント装置２０は、頂点データの一次デコードでは頂点データを復号して２次元の座標データのリストを出力する。そして、クライアント装置２０は、二次デコードではテクスチャマッピングを実行しベースバンドのＹＵＶ信号を出力する。

サーバ装置１０は、例えばＨＴＴＰ(Hypertext Transfer Protocol)サーバである。サーバ装置１０は、クライアント装置２０からの要求に応じて、音声や動画等のコンテンツを送信する。この時、サーバ装置１０は、コンテンツとして、ＭＰＥＧ－Ｈ３ＤＡｕｄｉｏ方式で符号化されたビットストリームを送信する。

クライアント装置２０は、サーバ装置１０から送信されたコンテンツを再生する情報処理装置である。クライアント装置２０は、例えば、通信機能、一次デコード機能、二次デコード機能、及び出力機能を備えている。通信機能は、ＨＴＴＰプロトコルに準拠した通信を行う機能である。例えば、通信機能は、ＭＰＥＧ－Ｈ３ＤＡｕｄｉｏ方式で符号化されたビットストリームを受信する。

ここで、ＭＰＥＧ－Ｈ３ＤＡｕｄｉｏ符号化方式では、音声オブジェクトと、メタデータとを独立して符号化することができる。そして、ＭＰＥＧ－Ｈ３ＤＡｕｄｉｏ符号化方式では、音声オブジェクトと、メタデータとを別々に伝送することができる。このように、音声オブジェクトとメタデータを別々に伝送することで、従来の符号化方式では困難だった特定の音源を再生時に容易に加工（例えば、音量の調整や、エフェクトの追加など）することができる。さらに、対応するメタデータを用いて音声オブジェクトのレンダリングを実行し、再生環境（スピーカー配置等）を構成する各スピーカーにレンダリングしたデータを割り当てることで、３次元的に音声を再生することができる。

一次デコード機能は、圧縮された音声オブジェクトの信号データを伸張する処理と、符号化されたメタデータから位置情報を取り出す処理とを実行する機能である。二次デコード機能は、対応するメタデータを用いて音声オブジェクトのレンダリングを実行する機能である。出力機能は、二次デコード後の音声データをスピーカー等の出力装置３０に出力する機能である。

出力装置３０は、例えば、スピーカー等の音声出力装置である。なお、出力装置３０は、音声出力装置に限らず、ディスプレイ等の画像出力装置であってもよい。

［第１の実施形態に係るサーバ装置１０の構成］
図２は、第１の実施形態に係るサーバ装置１０の構成例を示す図である。サーバ装置１０は、通信部１１と、記憶部１２と、制御部１３とを備える。

通信部１１は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。通信部１１は、ネットワークを介して、クライアント装置２０との間で情報の送受信を行う。

記憶部１２は、例えば、ＲＡＭ（Random Access Memory)、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部１２は、例えば、セグメントファイル１２１と、ＭＰＤファイル１２２とを記憶する。なお、セグメントファイル１２１と、ＭＰＤファイル１２２とは、サーバ装置１０に限らず、他の装置が記憶していてもよい。

セグメントファイル１２１は、音声オブジェクト等のメディアがセグメント単位で分割されたＭＰ４形式のファイルである。また、セグメントファイル１２１は、ＭＰＤファイル１２２で参照されている。ここで、図３は、第１の実施形態に係るセグメントファイル１２１のデータ構成例を示す図である。セグメントファイル１２１は、イニシャライゼーションセグメントと、一又は複数のメディアセグメントとを有している。そして、図３に示すセグメントファイル１２１は、Ｎ個のメディアセグメント有している状態を示している。イニシャライゼーションセグメントは、復号処理の初期化情報などである。メディアセグメントは、音声オブジェクト等のメディアがセグメント単位で分割された情報である。

ここで、図４は、第１の実施形態に係るメディアセグメントのデータ構成例を示す図である。図４に示すメディアセグメントは、図３のメディアセグメント（１）を示している。メディアセグメントは、メディアセグメントを細分化したＭＰ４サンプルと呼ばれるデータを有している。そして、図４に示すメディアセグメントは、Ｋ個のＭＰ４サンプルを有している状態を示している。

図２に戻り、ＭＰＤファイル１２２は、ストリーミング再生に必要な情報がＸＭＬ（Extensible Markup Language）形式で記述されたファイルである。ここで、図５は、第１の実施形態に係るＭＰＤファイル１２２のデータ構成例を示す図である。ＭＰＤファイル１２２には、一又は複数のＰｅｒｉｏｄ要素を有している。Ｐｅｒｉｏｄ要素には、番組やコンテンツ等の単位の情報が記述されている。また、Ｐｅｒｉｏｄ要素には、一又は複数のＡｄａｐｔａｔｉｏｎＳｅｔ要素を有している。

ＡｄａｐｔａｔｉｏｎＳｅｔ要素には、映像、音声、テキスト等のメディア種別が記述されている。また、ＡｄａｐｔａｔｉｏｎＳｅｔ要素には、字幕や、吹き替え等の異なる用途の情報が記述されていてもよい。また、ＡｄａｐｔａｔｉｏｎＳｅｔ要素には、一又は複数のＲｅｐｒｅｓｅｎｔａｔｉｏｎ要素を有している。Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ要素には、動画、音声のコーデック、ビットレート、動画の解像度等の情報が記述されている。また、Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ要素には、セグメントファイル１２１の格納場所等が記述されている。

また、Ｐｅｒｉｏｄ要素には、一又は複数のｐｒｅｓｅｌｅｃｔｉｏｎ要素を有している。ｐｒｅｓｅｌｅｃｔｉｏｎ要素には、セグメントファイル１２１が属するグループが記述されている。更に詳しくは、ｐｒｅｓｅｌｅｃｔｉｏｎ要素には、ｐｒｅｓｅｌｅｃｔｉｏｎＣｏｍｐｏｎｅｎｔｓ属性において列挙されたＲｅｐｒｅｓｅｎｔａｔｉｏｎ要素が示すセグメントファイル１２１が属するグループが記述されている。

ここで、図６は、セグメントファイル１２１のグループの一例を説明する図である。図６に示すＰｅｒｉｏｄ要素は、３つのＡｄａｐｔａｔｉｏｎＳｅｔ要素を有している。また、各ＡｄａｐｔａｔｉｏｎＳｅｔ要素は、Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ要素が含まれている。そして、Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ要素では、コンテンツを構成するセグメントファイル１２１が指し示されている。

ＩＤ属性が「１」のｐｒｅｓｅｌｅｃｔｉｏｎ要素において、メタデータを有する「メタデータＡ．ｍｐ４」と、音声オブジェクトを有する「メディアＣ．ｍｐ４」とがグループ化されたことが示されている。また、ＩＤ属性が「２」のｐｒｅｓｅｌｅｃｔｉｏｎ要素において、メタデータを有する「メタデータＢ．ｍｐ４」と、音声オブジェクトを有する「メディアＣ．ｍｐ４」とがグループ化されたことが示されている。すなわち、「メディアＣ．ｍｐ４」は、両グループにおいて共用されることを示している。なお、以下において、ＭＰＤファイル１２２に記述されたｐｒｅｓｅｌｅｃｔｉｏｎ要素の登場順をグループ情報と呼称する。また、ＭＰＤファイル１２２に記述されたＲｅｐｒｅｓｅｎｔａｔｉｏｎ要素の登場順をビットストリーム番号と呼称する。

図２に戻り、制御部１３は、サーバ装置１０の動作を統括的に制御する。例えば、制御部１３は、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）等のプロセッサにより実現される。例えば、制御部１３は、記憶部等に記憶されている各種プログラムを、ＲＡＭ（Random Access Memory）等を作業領域として実行することにより各種機能を実現する。なお、制御部１３は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現されてもよい。

制御部１３は、例えば通信制御部１３１、及び生成部１３２を備えている。

通信制御部１３１は、通信部１１を制御して、クライアント装置２０との通信を実行する。

生成部１３２は、通信制御部１３１がクライアント装置２０から受信した要求に応じた情報を生成する。そして、生成部１３２は、生成した情報を通信制御部１３１に送信させる。例えば、生成部１３２は、ＭＰＤファイル１２２やセグメントファイル１２１を通信制御部１３１に送信させる。

［第１の実施形態に係るクライアント装置２０の構成］
図７は、第１の実施形態に係るクライアント装置２０の構成例を示す図である。クライアント装置２０は、通信部２１と、入力部２２と、記憶部２３と、制御部２４とを備える。

通信部２１は、例えば、ＮＩＣ等によって実現される。通信部２１は、ネットワークを介して、クライアント装置２０との間で情報の送受信を行う。

入力部２２は、ユーザからの操作を受け付ける入力装置である。例えば、入力部２２は、コンテンツのグループを切り替える操作を受け付ける。

記憶部２３は、例えば、ＲＡＭや、フラッシュメモリ等の半導体メモリ素子、または、ハードディスクや、光ディスク等の記憶装置によって実現される。

制御部２４は、クライアント装置２０の動作を統括的に制御する。例えば、制御部２４は、ＣＰＵ、ＭＰＵ等のプロセッサにより実現される。例えば、制御部２４は、記憶部等に記憶されている各種プログラムを、ＲＡＭ等を作業領域として実行することにより各種機能を実現する。なお、制御部２４は、ＡＳＩＣやＦＰＧＡ等の集積回路により実現されてもよい。

制御部２４は、例えば、ＨＴＴＰアクセス制御部２５、アプリケーション制御部２６、及びメディアエンジン２７を備えている。

ＨＴＴＰアクセス制御部２５は、通信部２１を制御して、ＨＴＴＰプロトコルに準拠した通信を実行する。例えば、ＨＴＴＰアクセス制御部２５は、ＭＰＤファイル１２２及びセグメントファイル１２１を受信する。また、ＨＴＴＰアクセス制御部２５は、ＭＰＤファイル１２２を受信した場合に、ＭＰＤファイル１２２をアプリケーション制御部２６に出力する。また、ＨＴＴＰアクセス制御部２５は、セグメントファイル１２１を受信した場合に、イニシャライゼーションセグメントをアプリケーション制御部２６に出力する。

また、ＨＴＴＰアクセス制御部２５は、メディアセグメント等のセグメントを受信した場合に、受信したセグメントをセグメントバッファ２５２（図８参照）に記憶させる。この時、ＨＴＴＰアクセス制御部２５は、後述するセグメント属性情報を付加して、セグメントバッファ２５２（図８参照）に記憶させる。

また、ＨＴＴＰアクセス制御部２５は、セグメントバッファ２５２（図８参照）に記憶したセグメント属性情報をアプリケーション制御部２６に出力する。さらに、ＨＴＴＰアクセス制御部２５は、セグメントバッファ２５２（図８参照）に記憶したセグメント属性情報が付加されたセグメントをメディアエンジン２７に出力する。

アプリケーション制御部２６は、入力部２２を制御して、ストリーミング再生を制御する操作を受け付ける。例えば、アプリケーション制御部２６は、ストリーミング再生開始、及びストリーミング再生停止、コンテンツのグループの切り替え等の操作を受け付ける。また、アプリケーション制御部２６は、コンテンツのグループを切り替える操作を受け付けた場合に、切り替え位置（出力時刻、セグメント番号、ＭＰ４サンプル番号、および、ビットストリーム番号）を特定する。なお、切り替え位置のセグメント番号、ＭＰ４サンプル番号は、ビットストリームごとに異なる場合があるためビットストリーム番号も必要となる。

また、アプリケーション制御部２６は、ＨＴＴＰアクセス制御部２５がＭＰＤファイル１２２を受信した場合に、ＭＰＤファイル１２２に指定されているイニシャライゼーションセグメントから初期化情報を抽出して、３Ｄオーディオデコーダ２７３（図１０参照）を初期化する。

また、アプリケーション制御部２６は、ＭＰＤファイル１２２からダウンロードすべきセグメントファイル１２１を選択する。また、アプリケーション制御部２６は、ＭＰＤファイル１２２からｐｒｅｓｅｌｅｃｔｉｏｎ要素を読み出し、セグメントファイル１２１のビットストリームをグループ化する。

メディアエンジン２７は、ＨＴＴＰアクセス制御部２５から出力されたセグメントを復号化した出力信号を出力装置３０に出力する。また、メディアエンジン２７は、ＭＰ４サンプルバッファ２７２（図８参照）に記憶されているＭＰ４サンプルに付加されたＭＰ４サンプル属性情報をアプリケーション制御部２６に出力する。

［第１の実施形態に係るＨＴＴＰアクセス制御部２５の構成］
図８は、第１の実施形態に係るＨＴＴＰアクセス制御部２５の構成例を示す図である。ＨＴＴＰアクセス制御部２５は、セグメントバッファ２５２と、ダウンロード部２５１とを備えている。

セグメントバッファ２５２は、セグメントファイル１２１のビットストリームをセグメント単位で記憶する。

ダウンロード部２５１は、ＨＴＴＰプロトコルに準拠した通信により、複数のセグメントを有するセグメントファイル１２１と、セグメントファイル１２１が属するグループが設定された設定ファイル等のＭＰＤファイル１２２とを受信する。更に詳しくは、ダウンロード部２５１は、ＭＰＤファイル１２２、及び再生対象のセグメントファイル１２１の送信要求をサーバ装置１０に送信する。ダウンロード部２５１は、サーバ装置１０からＭＰＤファイル１２２を受信する。そして、ダウンロード部２５１は、サーバ装置１０から受信したＭＰＤファイル１２２をセグメントバッファ２５２に記憶させる。

また、ダウンロード部２５１は、ＭＰＤファイル１２２で示されたセグメントファイル１２１をサーバ装置１０から受信する。そして、ダウンロード部２５１は、セグメントファイル１２１を受信した場合に、セグメント単位でセグメントバッファ２５２に記憶させる。この時、セグメントバッファ２５２に記憶させる対象がメディアセグメントの場合、ダウンロード部２５１は、セグメントに対してヘッダ領域を設定する。そして、ダウンロード部２５１は、ヘッダ領域にセグメント属性情報を付加して、セグメントバッファ２５２に記憶させる。

また、ダウンロード部２５１は、アプリケーション制御部２６からの指示に基づいて、メタデータと、オブジェクトデータとを交互に受信する。そして、ダウンロード部２５１は、受信したメタデータと、オブジェクトデータとをセグメントファイル１２１に記憶させる。

ここで、図９は、第１の実施形態に係るセグメントバッファ２５２に記憶されたセグメントのデータ構成例を示す図である。セグメント属性情報には、グループ情報、ビットストリーム番号、セグメント番号、出力時刻、及びＵｓａｇｅデータが含まれている。

グループ情報は、セグメントが属するグループの番号を示す情報である。グループ情報には、ＭＰＤファイル１２２においてｐｒｅｓｅｌｅｃｔｉｏｎ要素が登場した通番が設定される。

ビットストリーム番号は、セグメントが含まれていたセグメントファイル１２１のビットストリームの番号を示す情報である。ビットストリーム番号には、ＭＰＤファイル１２２においてＲｅｐｒｅｓｅｎｔａｔｉｏｎ要素が登場した通番が設定される。また、ビットストリーム番号は、ビットストリームの同一性判定に使用される。なお、ビットストリーム番号は、ビットストリームのＵＲＬ（Uniform Resource Locator）であってもよいが、ＵＲＬを比較するよりも処理が容易なため数値であることが好ましい。

セグメント番号は、ビットストリーム内の先頭からのセグメントの通番を示す情報である。なお、記録するセグメントがイニシャライゼーションセグメントの場合には、セグメント属性情報のセグメント番号には０ｘＦＦＦＦＦＦＦＦが設定される。

出力時刻は、セグメントの出力開始時刻を示す情報である。出力時刻には、メディアセグメントに含まれる先頭のｍｏｏｆｂｏｘのｂａｓｅＭｅｄｉａＤｅｃｏｄｅＴｉｍｅの値が設定される。すなわち、出力時刻は、対象のセグメントをコンテンツにおける、どの時間から再生を開始するかが示された再生開始時間である。

Ｕｓａｇｅデータは、ＭＰ４サンプルに含まれるデータの利用法を示す情報である。Ｕｓａｇｅデータには、ＭＰＤファイル１２２のＲｅｐｒｅｓｅｎｔａｔｉｏｎ要素のｃｏｄｅｃｓ属性に数値を追加しておいて、この数値を設定する。Ｕｓａｇｅデータが０の場合、ＭＰ４サンプルから音声オブジェクト、及びメタデータを抽出する。Ｕｓａｇｅデータが１の場合、ＭＰ４サンプルから音声オブジェクトを抽出する。すなわち、ＭＰ４サンプルに音声オブジェクト、及びメタデータが含まれている場合にメタデータを捨てる。Ｕｓａｇｅデータが２の場合、ＭＰ４サンプルからメタデータを抽出する。すなわち、ＭＰ４サンプルに音声オブジェクト、及びメタデータが含まれていた場合に音声オブジェクトを捨てる。なお、記録するセグメントがイニシャライゼーションセグメントの場合、Ｕｓａｇｅデータには０ｘＦＦが設定される。

［第１の実施形態に係るメディアエンジン２７の構成］
図１０は、第１の実施形態に係るメディアエンジン２７の構成例を示す図である。メディアエンジン２７は、ＭＰ４サンプルバッファ２７２と、出力バッファ２７４と、抽出部２７１と、３Ｄオーディオデコーダ２７３とを備える。

ＭＰ４サンプルバッファ２７２は、抽出部２７１から出力されたＭＰ４サンプルを記憶する。出力バッファ２７４は、３Ｄオーディオデコーダ２７３から出力された出力信号を記憶する。

抽出部２７１は、デマルチプレックス処理により、ダウンロード部２５１が受信したセグメントファイル１２１のビットストリームのセグメントに１以上含まれるＭＰ４サンプルを抽出して、ＭＰ４サンプルの再生開始時間を含むＭＰ４サンプル属性情報をＭＰ４サンプルに付加する。更に詳しくは、抽出部２７１は、セグメントバッファ２５２に記憶された音声オブジェクトのセグメントから音声オブジェクトのＭＰ４サンプルを抽出する。また、抽出部２７１は、ＭＰ４サンプルに対してヘッダ領域を設定する。そして、抽出部２７１は、ヘッダ領域にＭＰ４サンプル属性情報を付加して、ＭＰ４サンプルバッファ２７２に記憶させる。

ここで、図１１は、第１の実施形態に係るＭＰ４サンプルバッファ２７２に記憶されたＭＰ４サンプルのデータ構成例を示す図である。ＭＰ４サンプル属性情報には、グループ情報、ビットストリーム番号、セグメント番号、ＭＰ４サンプル番号、Ｕｓａｇｅデータ、及び出力時刻が含まれている。

グループ情報には、ＭＰ４サンプルが属していたセグメントのセグメント属性情報から取得したグループ情報が設定される。ビットストリーム番号は、ＭＰ４サンプルが属していたセグメントのセグメント属性情報から取得したビットストリーム番号が設定される。セグメント番号は、ＭＰ４サンプルが属していたセグメントのセグメント属性情報から取得したセグメント番号が設定される。ＭＰ４サンプル番号には、ＭＰ４サンプルが属していたセグメントで、対象のＭＰ４サンプルが登場した通番が設定される。なお、ｆｒａｇｍｅｎｔｅｄＭＰ４の場合、ＭＰ４サンプル番号には、複数のｍｏｏｆｂｏｘを跨いだセグメント内の通番（インデックス）が設定される。Ｕｓａｇｅデータは、ＭＰ４サンプルが属していたセグメントのセグメント属性情報から取得したＵｓａｇｅデータが設定される。出力時刻には、対象のＭＰ４サンプルのＣｏｍｐｏｓｉｔｉｏｎＴｉｍｅの値が設定される。すなわち、出力時刻は、対象のＭＰ４サンプルをコンテンツにおけるどの時間から再生を開始するかが示された再生開始時間である。

３Ｄオーディオデコーダ２７３は、音声オブジェクトのＭＰ４サンプル、及びメタデータのＭＰ４サンプルが其々１つずつ入力された場合に、出力信号（出力チャンネル分のＰＣＭ信号）を生成する。この時、３Ｄオーディオデコーダ２７３は、ＭＰ４サンプル属性情報のＵｓａｇｅデータが付加されたＭＰ４サンプルを受け付ける。

３Ｄオーディオデコーダ２７３は、解析処理において、入力されたＭＰ４サンプルからＵｓａｇｅデータで指定された所望のデータを抽出する。すなわち、３Ｄオーディオデコーダ２７３は、Ｕｓａｇｅデータに基づいて、音声オブジェクト、メタデータ、又は音声オブジェクトとメタデータの両方を抽出する。これにより、３Ｄオーディオデコーダ２７３は、音声オブジェクトの復号と、メタデータの復号との両方を実行した後で、所望のデータだけを取捨するという冗長性を排除できる。そして、３Ｄオーディオデコーダ２７３は、生成した出力信号を出力時刻の順に整列して出力バッファ２７４に記憶させる。

［第１の実施形態に係る３Ｄオーディオデコーダ２７３の構成］
図１２は、第１の実施形態に係る３Ｄオーディオデコーダ２７３の構成例を示す図である。３Ｄオーディオデコーダ２７３は、出力中間バッファ２７３４と、解析部２７３１と、オブジェクトデコーダ２７３２と、メタデータデコーダ２７３３と、レンダリング部２７３５とを備えている。

出力中間バッファ２７３４は、復号化された音声データや、復号化されたメタデータを記憶する。

解析部２７３１は、ＭＰ４サンプルバッファ２７２から取得したＭＰ４サンプルに音声オブジェクトとメタデータとの何れが含まれているか否かを解析する。また、解析部２７３１は、ＭＰ４サンプルをオブジェクトデータと、オブジェクトデータに付随するメタデータとに分離させる。すなわち、解析部２７３１は、オブジェクトデータである音声オブジェクトデータと、メタデータである音声オブジェクトの定位情報とに分離させる。そして、解析部２７３１は、ＭＰ４サンプル属性情報のＵｓａｇｅデータに基づいて、ＭＰ４サンプルに含まれているデータの出力先を特定する。

更に詳しくは、解析部２７３１は、Ｕｓａｇｅデータに「０」が設定されている場合、ＭＰ４サンプルに含まれている音声オブジェクトをオブジェクトデコーダ２７３２に出力し、ＭＰ４サンプルに含まれているメタデータをメタデータデコーダ２７３３に出力する。また、解析部２７３１は、Ｕｓａｇｅデータに「１」が設定されている場合、ＭＰ４サンプルに含まれている音声オブジェクトをオブジェクトデコーダ２７３２に出力する。なお、解析部２７３１は、ＭＰ４サンプルにメタデータが含まれていても、メタデータデコーダ２７３３には出力せずに捨てる。また、解析部２７３１は、Ｕｓａｇｅデータに「２」が設定されている場合、ＭＰ４サンプルに含まれているメタデータをメタデータデコーダ２７３３に出力する。なお、解析部２７３１は、ＭＰ４サンプルに音声オブジェクトが含まれていても、オブジェクトデコーダ２７３２には出力せずに捨てる。

オブジェクトデコーダ２７３２は、音声オブジェクトを復号する。オブジェクトデコーダ２７３２は、復号して得られた音声信号を出力中間バッファ２７３４に記憶させる。

メタデータデコーダ２７３３は、メタデータを復号する。メタデータデコーダ２７３３は、復号して得られたメタデータ信号を出力中間バッファ２７３４に記憶させる。

レンダリング部２７３５は、コンテンツにおける出力時刻が同一の音声信号と、メタデータ信号とが出力中間バッファ２７３４に記憶された場合に、出力時刻が同一の音声信号と、メタデータ信号とから出力信号を生成する。レンダリング部２７３５は、生成した出力信号に対してヘッダ領域を設定する。また、レンダリング部２７３５は、ヘッダ領域に出力信号属性情報を付加する。そして、レンダリング部２７３５は、出力信号属性情報が付加された出力信号を、コンテンツの出力時刻順に並べて出力バッファ２７４に記憶させる。さらに、レンダリング部２７３５は、出力バッファ２７４に出力時刻順に並べられた出力信号を所定の時刻に出力装置３０へ出力する。

ここで、図１３は、第１の実施形態に係る出力バッファ２７４に記憶された出力信号のデータ構成例を示す図である。出力信号属性情報には、グループ情報、及び出力時刻が含まれている。グループ情報は、出力信号の生成元になったＭＰ４サンプルのＭＰ４サンプル属性情報から取得したグループ情報が設定される。出力時刻は、出力信号の生成元になったＭＰ４サンプルのＭＰ４サンプル属性情報から取得した出力時刻が設定される。すなわち、出力時刻は、対象の出力信号をコンテンツにおけるどの時間から再生を開始するかが示された再生開始時間である。

［第１の実施形態に係るストリーミング再生処理手順］
次に、第１の実施形態に係るクライアント装置２０が実行するストリーミング再生処理について説明する。図１４は、第１の実施形態に係るクライアント装置２０が実行するストリーミング再生処理の一例を示すフローチャートである。

ＨＴＴＰアクセス制御部２５は、ユーザの操作により特定されたコンテンツのＭＰＤファイル１２２をサーバ装置１０から取得する（ステップＳ１１）。

アプリケーション制御部２６は、ＭＰＤファイル１２２に記述された設定に基づいて、セグメントファイル１２１をグループ化する（ステップＳ１２）。

アプリケーション制御部２６は、入力部２２が受け付けた操作に応じたグループを選択する（ステップＳ１３）。

アプリケーション制御部２６は、コンテンツのグループを切り替える操作を受け付けたか否かを判定する（ステップＳ１４）。切り替える操作を受け付けていない場合に（ステップＳ１４；Ｎｏ）、クライアント装置２０は、ステップＳ１６に移行する。

切り替える操作を受け付けた場合に（ステップＳ１４；Ｙｅｓ）、アプリケーション制御部２６は、操作に応じたグループを選択する（ステップＳ１５）。

ＨＴＴＰアクセス制御部２５は、ＨＴＴＰプロトコルに準拠した通信により、選択したグループのセグメントファイル１２１のダウンロード処理を実行する（ステップＳ１６）。

メディアエンジン２７は、セグメントファイル１２１のダウンロードにより取得したビットストリームのデマルチプレックス処理、デコード処理、及び再生を実行するメディアエンジン処理を実行する（ステップＳ１７）。

アプリケーション制御部２６は、ストリーミング再生の終了条件が満たされたか否かを判定する（ステップＳ１８）。例えば、アプリケーション制御部２６は、選択されたグループ内の全てのセグメントファイル１２１の最終セグメントまで再生した場合や、ストリーミング再生を終了させる操作を受け付けた場合等に、ストリーミング再生の終了条件が満たされたと判定する。

ストリーミング再生を継続する場合に（ステップＳ１８；Ｎｏ）、クライアント装置２０は、ステップＳ１４に移行する。

ストリーミング再生の終了条件が満たされた場合に（ステップＳ１８；Ｙｅｓ）、クライアント装置２０は、ストリーミング再生処理を終了する。

以上により、クライアント装置２０は、ストリーミング再生処理を終了する。

［第１の実施形態に係るダウンロード処理手順］
次に、第１の実施形態に係るＨＴＴＰアクセス制御部２５が実行するダウンロード処理について説明する。図１５は、第１の実施形態に係るＨＴＴＰアクセス制御部２５が実行するダウンロード処理の一例を示すフローチャートである。

ダウンロード部２５１は、セグメントファイル１２１のビットストリームに含まれているセグメントを受信する（ステップＳ２１）。

ダウンロード部２５１は、受信したセグメントに対応したセグメント属性情報を生成する（ステップＳ２２）。

ダウンロード部２５１は、受信したセグメントに生成したセグメント属性情報を付加する（ステップＳ２３）。

ダウンロード部２５１は、セグメント属性情報が付加されたセグメントをセグメントバッファ２５２に記憶させる（ステップＳ２４）。

ダウンロード部２５１は、選択されたグループに属する全セグメントファイル１２１のビットストリームに対して処理を実行したか否かを判定する（ステップＳ２５）。全セグメントファイル１２１のビットストリームに対して処理を実行していない場合に（ステップＳ２５；Ｎｏ）、ＨＴＴＰアクセス制御部２５は、ステップＳ２１に移行する。

全セグメントファイル１２１のビットストリームに対して処理を実行した場合に（ステップＳ２５；Ｙｅｓ）、ＨＴＴＰアクセス制御部２５は、ダウンロード処理を終了する。

以上により、ＨＴＴＰアクセス制御部２５は、ダウンロード処理を終了する。

［第１の実施形態に係るメディアエンジン処理手順］
次に、第１の実施形態に係るメディアエンジン２７が実行するメディアエンジン処理について説明する。図１６は、第１の実施形態に係るメディアエンジン２７が実行するメディアエンジン処理の一例を示すフローチャートである。

抽出部２７１は、デマルチプレックス処理を実行する（ステップＳ３１）。

３Ｄオーディオデコーダ２７３は、デコード処理を実行する（ステップＳ３２）。

レンダリング部２７３５は、出力処理を実行する（ステップＳ３３）。すなわち、レンダリング部２７３５は、出力バッファ２７４に記憶された出力信号を出力装置３０に出力する。そして、出力装置３０は、出力信号が示す音声を出力する。

以上により、メディアエンジン２７は、メディアエンジン処理を終了する。

［第１の実施形態に係るデマルチプレックス処理手順］
次に、第１の実施形態に係る抽出部２７１が実行するデマルチプレックス処理について説明する。図１７は、第１の実施形態に係る抽出部２７１が実行するデマルチプレックス処理の一例を示すフローチャートである。

抽出部２７１は、セグメントバッファ２５２から取得したセグメントからＭＰ４サンプルを抽出する（ステップＳ４１）。

抽出部２７１は、抽出したＭＰ４サンプルに対応したＭＰ４サンプル属性情報を生成する（ステップＳ４２）。

抽出部２７１は、抽出したＭＰ４サンプルに生成したＭＰ４サンプル属性情報を付加する（ステップＳ４３）。

抽出部２７１は、ＭＰ４サンプル属性情報が付加されたＭＰ４サンプルをＭＰ４サンプルバッファ２７２に記憶させる（ステップＳ４４）。

抽出部２７１は、選択されたグループに属する全セグメントファイル１２１のビットストリームの各セグメントに対して処理を実行したか否かを判定する（ステップＳ４５）。全セグメントファイル１２１のビットストリームの各セグメントに対して処理を実行していない場合に（ステップＳ４５；Ｎｏ）、抽出部２７１は、ステップＳ４１に移行する。

全セグメントファイル１２１のビットストリームの各セグメントに対して処理を実行してした場合に（ステップＳ４５；Ｙｅｓ）、抽出部２７１は、デマルチプレックス処理を終了する。

以上により、抽出部２７１は、デマルチプレックス処理を終了する。

［第１の実施形態に係るデコード処理手順］
次に、第１の実施形態に係る抽出部２７１が実行するデマルチプレックス処理について説明する。図１８は、第１の実施形態に係る抽出部２７１が実行するデコード処理の一例を示すフローチャートである。

３Ｄオーディオデコーダ２７３は、ＭＰ４サンプルバッファ２７２に同一出力時刻のＭＰ４サンプルが２つ記憶されているか否かを判定する（ステップＳ５１）。すなわち、３Ｄオーディオデコーダ２７３は、ＭＰ４サンプルバッファ２７２に、音声オブジェクト及びメタデータのＭＰ４サンプルが記憶されているか否かを判定する。ＭＰ４サンプルバッファ２７２に同一出力時刻のＭＰ４サンプルが２つ記憶されていない場合（ステップＳ５１；Ｎｏ）、３Ｄオーディオデコーダ２７３は、待機する。

ＭＰ４サンプルバッファ２７２に同一出力時刻のＭＰ４サンプルが２つ記憶されている場合（ステップＳ５１；Ｙｅｓ）、３Ｄオーディオデコーダ２７３は、同一出力時刻の２つのＭＰ４サンプルのうち、一方のＭＰ４サンプルを取得する（ステップＳ５２）。

３Ｄオーディオデコーダ２７３は、取得したＭＰ４サンプルに対して一次デコード処理を実行する（ステップＳ５３）。

３Ｄオーディオデコーダ２７３は、同一出力時刻の２つのＭＰ４サンプルのうち、ステップＳ５２で取得しなかった他方のＭＰ４サンプルを取得する（ステップＳ５４）。

３Ｄオーディオデコーダ２７３は、取得したＭＰ４サンプルに対して一次デコード処理を実行する（ステップＳ５５）。

３Ｄオーディオデコーダ２７３は、二次デコード処理を実行する（ステップＳ５６）。

以上により、３Ｄオーディオデコーダ２７３は、デコード処理を終了する。

［第１の実施形態に係る１次デコード処理手順］
次に、第１の実施形態に係る３Ｄオーディオデコーダ２７３が実行する１次デコード処理について説明する。図１９は、第１の実施形態に係る３Ｄオーディオデコーダ２７３が実行する１次デコード処理の一例を示すフローチャートである。

解析部２７３１は、取得したＭＰ４サンプルのＭＰ４サンプル属性情報のＵｓａｇｅが「０」であるか否かを判定する（ステップＳ６１）。ＭＰ４サンプル属性情報のＵｓａｇｅが「０」である場合に（ステップＳ６１；Ｙｅｓ）、解析部２７３１は、ＭＰ４サンプルから音声オブジェクト及びメタデータを抽出する（ステップＳ６２）。

オブジェクトデコーダ２７３２、及びメタデータデコーダ２７３３は、ＭＰ４サンプルから抽出した音声オブジェクト及びメタデータに対して、１次デコードを実行する（ステップＳ６３）。すなわち、オブジェクトデコーダ２７３２は、ＭＰ４サンプルから抽出した音声オブジェクトに対して、１次デコードを実行する。そして、オブジェクトデコーダ２７３２は、１次デコードにより生成した音声信号を出力中間バッファ２７３４に記憶させる。また、メタデータデコーダ２７３３は、ＭＰ４サンプルから抽出したメタデータに対して、１次デコードを実行する。そして、メタデータデコーダ２７３３は、１次デコードにより生成したメタデータ信号を出力中間バッファ２７３４に記憶させる。

ＭＰ４サンプル属性情報のＵｓａｇｅが「０」ではない場合に（ステップＳ６１；Ｎｏ）、解析部２７３１は、ＭＰ４サンプル属性情報のＵｓａｇｅが「１」であるか否かを判定する（ステップＳ６４）。ＭＰ４サンプル属性情報のＵｓａｇｅが「１」である場合に（ステップＳ６４；Ｙｅｓ）、解析部２７３１は、ＭＰ４サンプルから音声オブジェクトを抽出する（ステップＳ６５）。この時、解析部２７３１は、ＭＰ４サンプルにメタデータが含まれている場合、メタデータを捨てる。

オブジェクトデコーダ２７３２は、ＭＰ４サンプルから抽出した音声オブジェクトに対して、１次デコードを実行する（ステップＳ６６）。そして、オブジェクトデコーダ２７３２は、１次デコードにより生成した音声信号を出力中間バッファ２７３４に記憶させる。

ＭＰ４サンプル属性情報のＵｓａｇｅが「１」ではない場合に（ステップＳ６４；Ｎｏ）、解析部２７３１は、ＭＰ４サンプル属性情報のＵｓａｇｅが「２」であると判定して、ＭＰ４サンプルからメタデータを抽出する（ステップＳ６７）。

メタデータデコーダ２７３３は、ＭＰ４サンプルから抽出したメタデータに対して、１次デコードを実行する（ステップＳ６８）。そして、メタデータデコーダ２７３３は、１次デコードにより生成したメタデータ信号を出力中間バッファ２７３４に記憶させる。

以上により、３Ｄオーディオデコーダ２７３は、１次デコード処理を終了する。

［第１の実施形態に係る２次デコード処理手順］
次に、第１の実施形態に係る３Ｄオーディオデコーダ２７３が実行する２次デコード処理について説明する。図２０は、第１の実施形態に係る３Ｄオーディオデコーダ２７３が実行する２次デコード処理の一例を示すフローチャートである。

レンダリング部２７３５は、出力中間バッファ２７３４から同一出力時刻の音声信号及びメタデータ信号を取得する（ステップＳ７１）。

レンダリング部２７３５は、同一出力時刻の音声信号及びメタデータ信号を用いて、２次デコードを実行する（ステップＳ７２）。

レンダリング部２７３５は、２次デコードにより生成した出力信号を出力バッファ２７４に記憶させる（ステップＳ７３）。

以上により、３Ｄオーディオデコーダ２７３は、２次デコード処理を終了する。

［第１の実施形態に係るコンテンツのグループ切り替え処理手順］
次に、第１の実施形態に係るクライアント装置２０が実行するコンテンツのグループを切り替える切り替え処理について説明する。図２１は、第１の実施形態に係るクライアント装置２０が実行するコンテンツのグループ切り替え処理の一例を示すフローチャートである。

アプリケーション制御部２６は、コンテンツのグループを切り替える操作を受け付ける（ステップＳ８１）。例えば、コンテンツのグループを切り替える操作とは、視聴位置を切り替える操作や、音声の言語を切り替え操作等である。

アプリケーション制御部２６は、コンテンツのグループを切り替える位置を決定する（ステップＳ８２）。なお、コンテンツのグループを切り替える位置の決定方法ついては後述する。

アプリケーション制御部２６は、ＨＴＴＰアクセス制御部２５へコンテンツの切り替え位置を通知する（ステップＳ８３）。

アプリケーション制御部２６は、メディアエンジン２７へコンテンツの切り替え位置を通知する（ステップＳ８４）。

ＨＴＴＰアクセス制御部２５は、コンテンツのグループを切り替える処理を実行する（ステップＳ８５）。すなわち、ＨＴＴＰアクセス制御部２５は、切り替え後のグループのセグメントファイル１２１をダウンロードする。

メディアエンジン２７は、コンテンツのグループを切り替える処理を実行する（ステップＳ８６）。すなわち、メディアエンジン２７は、切り替え後のグループに対して、デマルチプレックス処理、デコード処理、及び出力処理を実行する。

以上により、クライアント装置２０は、グループ切り替え処理を終了する。

［第１の実施形態に係るグループを切り替える位置の決定］
コンテンツのグループを切り替える位置の決定について説明する。ユーザがコンテンツのグループを切り替えた場合、クライアント装置２０は、可能な限り早期に、切り替え後のコンテンツのグループを再生させることが好ましい。一方で、クライアント装置２０は、画音ギャップが発生しないようにする必要がある。ここで、画音ギャップとは、コンテンツの再生に対して、コンテンツのダウンロードや、コンテンツのデコード等の処理が遅いために、コンテンツの再生が滞ってしまうことである。

そこで、アプリケーション制御部２６は、セグメント属性情報、ＭＰ４サンプル属性情報、及び出力信号属性情報に基づいて、切り替え後のグループに属するセグメントファイル１２１を出力させる切り替え位置をＭＰ４サンプル単位で決定する。更に詳しくは、アプリケーション制御部２６は、アプリケーション制御部２６が受け付けた切り替え後のグループのセグメントファイル１２１のビットストリームの再生を開始するまでにかかる処理時間を算出する。アプリケーション制御部２６は、アプリケーション制御部２６が算出した処理時間に基づいて、切り替え位置を決定する。具体的には、アプリケーション制御部２６は、切り替え後のグループのセグメントのダウンロードにかかる時間や、切り替え後のグループのセグメントのデマルチプレックス処理にかかる時間や、ＭＰ４サンプルのデコードにかかる時間を算出する。

例えば、アプリケーション制御部２６は、切り替え後グループのそれぞれのビットストリームごとに１個のセグメントをダウンロードし、各セグメントの１個のＭＰ４サンプルをデマルチプレックス処理、デコード処理して１個の出力信号を出力するまでの処理時間の合計を示すＴｐｒｏｃ（秒）を求める。

ここで、図２２は、第１の実施形態に係るクライアント装置２０が実行する処理時間算出処理の一例を示すフローチャートである。

ＨＴＴＰアクセス制御部２５は、切り替え後グループに属するセグメントファイル１２１のビットストリームに含まれるセグメントを１個受信する（ステップＳ９１）。

アプリケーション制御部２６は、受信したセグメントのデータサイズを取得する（ステップＳ９２）。

アプリケーション制御部２６は、受信したセグメントがセグメントバッファ２５２に既に記憶済みであるか否かを判定する（ステップＳ９３）。すなわち、アプリケーション制御部２６は、切り替え前のグループと、切り替え後のグループとにおいて、共通のビットストリームのセグメントであるか否かを判定する。

受信したセグメントがセグメントバッファ２５２に記憶済みである場合（ステップＳ９３；Ｙｅｓ）、アプリケーション制御部２６は、処理時間の算出に用いる受信したセグメントのデータサイズを０にする（ステップＳ９４）。アプリケーション制御部２６は、受信したセグメントがセグメントバッファ２５２に記憶済みである場合、切り替え前の状態で各種処理が実行済みである。そのため、アプリケーション制御部２６は、新たに処理を実行する必要がないので、データサイズを０にする。そして、アプリケーション制御部２６は、ステップＳ９５に移行する。

受信したセグメントがセグメントバッファ２５２に記憶されていない場合（ステップＳ９３；Ｎｏ）、アプリケーション制御部２６は、処理時間を算出する（ステップＳ９５）。更に詳しくは、アプリケーション制御部２６は、下記数式（１）にて処理時間を算出する。なお、Ｔｐｒｏｃの初期値は０に設定する。

Ｔｐｒｏｃ＝Ｔｐｒｏｃ
＋（８×ｓｉｚｅ／ｂａｎｄｗｉｄｔｈ）
＋（８×ｓｉｚｅ／（Ｎｍ×ｄｅｍｕｘ－ｒａｔｅ））
＋（８×ｓｉｚｅ／（Ｎｍ×ｄｅｃｏｄｅ－ｒａｔｅ）） …数式（１）

Ｔｐｒｏｃ；処理時間の合計（秒）
ｓｉｚｅ；受信したセグメントのデータサイズ（ｂｙｔｅ）
ｂａｎｄｗｉｄｔｈ；ネットワーク帯域（ビット／秒）
Ｎｍ；切り替え後グループのビットストリームにおいて１つのセグメントに含まれているＭＰ４サンプルの総数
ｄｅｍｕｘ－ｒａｔｅ；切り替え後グループのビットストリームに対する抽出部２７１のデマルチプレックス処理等の処理レート（ビット／秒）
ｄｅｃｏｄｅ－ｒａｔｅ；切り替え後グループのビットストリームに対する３Ｄオーディオデコーダ２７３のデコード処理等の処理レート（ビット／秒）

アプリケーション制御部２６は、切り替え後グループに属する全てのセグメントファイル１２１のビットストリームに含まれるセグメントを１個ずつ受信したか否かを判定する（ステップＳ９６）。全てのビットストリームのセグメントを１個ずつ受信していない場合に（ステップＳ９６；Ｎｏ）、クライアント装置２０は、ステップＳ９１に移行する。

全てのビットストリームのセグメントを１個ずつ受信した場合に（ステップＳ９６；Ｙｅｓ）、クライアント装置２０が実行する処理時間算出処理を終了する。

以上により、３Ｄオーディオデコーダ２７３は、処理時間算出処理を終了する。

そして、アプリケーション制御部２６は、各バッファに記憶されているデータの再生時間と、出力装置３０の再生までにかかる処理時間とを比較して、切り替え位置を決定する。

ここで、図２３は、第１の実施形態に係る出力バッファ２７４での切り替えの一例を示す説明図である。図２３に示すセグメントバッファ２５２は、メタデータＡのビットストリームにおいて、Ｍ＋２番目と、Ｍ＋１番目とのセグメントとが記憶されている状態を示している。また、セグメントバッファ２５２は、メディアＣのビットストリームにおいて、Ｍ＋２番目と、Ｍ＋１番目とのセグメントとが記憶されている状態を示している。

図２３に示すＭＰ４サンプルバッファ２７２は、メタデータＡのビットストリームにおいて、Ｍ＋１番目のセグメントと、Ｍ番目のセグメントとに属するＮ番目から１番目までのＭＰ４サンプルが記憶されている状態を示している。また、ＭＰ４サンプルバッファ２７２には、メディアＣのビットストリームにおいて、Ｍ＋１番目のセグメントと、Ｍ番目のセグメントとに属するＮ番目から１番目までのＭＰ４サンプルが記憶されている状態を示している。

図２３に示す出力バッファ２７４には、メタデータＡ及びメディアＣのビットストリームにおいて、Ｍ番目のセグメントに属するＮ番目から１番目までのＭＰ４サンプルから生成された、Ｎ番目から１番目までの出力信号が記憶されている状態を示している。そして、図２３に示す説明図は、メタデータＡ及びメディアＣのビットストリームにおいて、Ｍ番目のセグメントに属するＫ－１番目のＭＰ４サンプルから生成された出力信号Ａ＋Ｃ（Ｍ、Ｋ－１）が切り替え位置であると判定した場合を示している。

図２４は、図２３に示す図において切り替え後のグループに属するメタデータＢのビットストリームを受信した場合の一例を示す説明図である。セグメントバッファ２５２は、切り替え後のグループのメタデータＢのビットストリームにおいて、Ｍ番目のセグメントが記憶された状態を示している。また、ＭＰ４サンプルバッファ２７２は、切り替え後のグループのメタデータＢのビットストリームにおいて、Ｍ番目のセグメントに属するＫ番目のＭＰ４サンプルが記憶された状態を示している。また、出力バッファ２７４は、切り替え後のグループのメタデータＢ及びメディアＣのビットストリームにおいて、Ｍ番目のセグメントに属するＫ番目のＭＰ４サンプルから生成された出力信号Ｂ＋Ｃ（Ｍ、Ｋ）が記憶された状態を示している。この場合、クライアント装置２０は、出力信号Ａ＋Ｃ（Ｍ、１）、・・・出力信号Ａ＋Ｃ（Ｍ、Ｋ－１）、出力信号Ｂ＋Ｃ（Ｍ、Ｋ）、出力信号Ｂ＋Ｃ（Ｍ、Ｋ＋１）、・・・の順番で出力信号を出力する。

さらに詳しくは、アプリケーション制御部２６は、下記数式（２）において、出力バッファ２７４に切り替え位置を設定可能であるか否かを判定する。数式（２）の条件を満たす場合に出力バッファ２７４に切り替え位置を設定可能であると判定する。アプリケーション制御部２６は、Ｎａをインクリメントしながら数式（２）を満たすか否かを判定する。すなわち、アプリケーション制御部２６は、数式（２）を満たす最小のＮａを算出する。なお、Ｎａの上限は、出力バッファ２７４に記憶されている出力信号の総数である。

Ｔｄｉｓｐ×Ｎａ＞Ｔｐｒｏｃ …数式（２）

Ｔｐｒｏｃ；切り替え後グループのそれぞれのビットストリームごとに１個のセグメントをダウンロードし、セグメントごとに１個のＭＰ４サンプルをデマルチプレックス処理し、デコード処理して１個の出力信号を出力するまでの処理時間の合計
Ｔｄｉｓｐ；出力バッファ２７４に記録されている出力信号１個の表示時間
Ｎａ；出力信号の個数

アプリケーション制御部２６は、出力バッファ２７４に切り替え位置を設定することができないと判定した場合に、ＭＰ４サンプルバッファ２７２に切り替え位置が設定可能か否かを判定する。

ここで、図２５は、第１の実施形態に係るＭＰ４サンプルバッファ２７２での切り替えの一例を示す説明図である。図２５に示すセグメントバッファ２５２、ＭＰ４サンプルバッファ２７２、及び出力バッファ２７４には、図２３の各バッファと同様のデータが記憶されている。そして、図２５に示す説明図は、メタデータＡ及びメディアＣのビットストリームにおいて、Ｍ＋１番目のセグメントに属するＫ－１番目のＭＰ４サンプルが切り替え位置であると判定した場合を示している。

図２６は、図２５に示す図において切り替え後のグループに属するメタデータＢのビットストリームを受信した場合の一例を示す説明図である。セグメントバッファ２５２は、切り替え後のグループのメタデータＢのビットストリームにおいて、Ｍ＋１番目のセグメントが記憶された状態を示している。また、ＭＰ４サンプルバッファ２７２は、切り替え後のグループのメタデータＢのビットストリームにおいて、Ｍ＋１番目のセグメントに属するＫ番目のＭＰ４サンプルが記憶された状態を示している。また、出力バッファ２７４は、切り替え後のグループのメタデータＢ及びメディアＣのビットストリームにおいて、Ｍ番目のセグメントに属するＫ＋１番目のＭＰ４サンプルから生成された出力信号Ｂ＋Ｃ（Ｍ＋１、Ｋ）が記憶された状態を示している。この場合、クライアント装置２０は、出力信号Ａ＋Ｃ（Ｍ＋１、１）、・・・出力信号Ａ＋Ｃ（Ｍ＋１、Ｋ－１）、出力信号Ｂ＋Ｃ（Ｍ＋１、Ｋ）、出力信号Ｂ＋Ｃ（Ｍ＋１、Ｋ＋１）、・・・の順番で出力信号を出力する。

さらに詳しくは、アプリケーション制御部２６は、下記数式（３）において、ＭＰ４サンプルバッファ２７２に切り替え位置を設定可能であるか否かを判定する。数式（３）の条件を満たす場合にＭＰ４サンプルバッファ２７２に切り替え位置を設定可能であると判定する。アプリケーション制御部２６は、Ｎｂをインクリメントしながら数式（３）を満たすか否かを判定する。すなわち、アプリケーション制御部２６は、数式（３）を満たす最小のＮｂを算出する。なお、Ｎｂの上限は、ＭＰ４サンプルバッファ２７２に記録されているＭＰ４サンプルの総数である。

Ｔｄｉｓｐ×(Ｎａ＋Ｎｂ／Ｎｇ)＞Ｔｐｒｏｃ …数式（３）

Ｔｐｒｏｃ；切り替え後グループのそれぞれのビットストリームごとに１個のセグメントをダウンロードし、セグメントごとに１個のＭＰ４サンプルをデマルチプレックス処理し、デコード処理して１個の出力信号を出力するまでの処理時間の合計
Ｔｄｉｓｐ；出力バッファ２７４に記録されている出力信号１個の表示時間
Ｎｇ；切り替え前グループ中のビットストリーム総数
Ｎａ；出力信号の総数
Ｎｂ；ＭＰ４サンプルの個数

アプリケーション制御部２６は、ＭＰ４サンプルバッファ２７２に切り替え位置を設定することができないと判定した場合に、セグメントバッファ２５２の１個目のセグメントに切り替え位置が設定可能か否かを判定する。すなわち、アプリケーション制御部２６は、セグメントバッファ２５２に記憶されたセグメントのうち、ＭＰ４サンプルバッファ２７２にＭＰ４サンプルが記憶されておらず、且つ次回デマルチプレックス処理の対象になるセグメントに切り替え位置が設定可能か否かを判定する。

ここで、図２７は、第１の実施形態に係るセグメントバッファ２５２での切り替えの一例を示す説明図である。図２７に示すセグメントバッファ２５２、ＭＰ４サンプルバッファ２７２、及び出力バッファ２７４には、図２３の各バッファと同様のデータが記憶されている。そして、図２７に示す説明図は、メタデータＡ及びメディアＣのビットストリームにおいて、Ｍ＋２番目のセグメントの途中が切り替え位置であると判定した場合を示している。更に詳しくは、Ｍ＋２番目のセグメントに属するＫ－１番目のＭＰ４サンプルが切り替え位置であると判定した場合を示している。

図２８は、図２７に示す図において切り替え後のグループに属するメタデータＢのビットストリームを受信した場合の一例を示す説明図である。セグメントバッファ２５２は、切り替え後のグループのメタデータＢのビットストリームにおいて、Ｍ＋２番目のセグメントが記憶された状態を示している。また、ＭＰ４サンプルバッファ２７２は、切り替え後のグループのメタデータＢのビットストリームにおいて、Ｍ＋２番目のセグメントに属するＫ番目のＭＰ４サンプルが記憶された状態を示している。また、出力バッファ２７４は、切り替え後のグループのメタデータＢ及びメディアＣのビットストリームにおいて、Ｍ＋２番目のセグメントに属するＫ＋１番目のＭＰ４サンプルから生成された出力信号Ｂ＋Ｃ（Ｍ＋２、Ｋ）が記憶された状態を示している。この場合、クライアント装置２０は、出力信号Ａ＋Ｃ（Ｍ＋２、１）、・・・出力信号Ａ＋Ｃ（Ｍ＋２、Ｋ－１）、出力信号Ｂ＋Ｃ（Ｍ＋２、Ｋ）、出力信号Ｂ＋Ｃ（Ｍ＋２、Ｋ＋１）、・・・の順番で出力信号を出力する。

さらに詳しくは、アプリケーション制御部２６は、下記数式（４）において、セグメントバッファ２５２の１個目のセグメントに切り替え位置を設定可能であるか否かを判定する。数式（４）の条件を満たす場合にセグメントバッファ２５２の１個目のセグメントに切り替え位置を設定可能であると判定する。アプリケーション制御部２６は、Ｎｃをインクリメントしながら数式（４）を満たすか否かを判定する。すなわち、アプリケーション制御部２６は、数式（４）を満たす最小のＮｃを算出する。なお、Ｎｃの上限は、セグメントバッファ２５２に記録されているセグメントの総数である。

ここで、セグメントバッファ２５２の１個目のセグメントのＭＰ４サンプルは、デマルチプレックス処理される前のセグメントの状態である。そのため、ＭＰ４サンプルのＣｏｍｐｏｓｉｔｉｏｎＴｉｍｅが分明ではない。そこで、メディアエンジン２７からビットストリームごとにＭＰ４サンプルの出力時刻の差分をフィードバックし、セグメントの出力時刻に加算することでＭＰ４サンプルの出力時刻とする。

Ｔｄｉｓｐ×（Ｎａ＋Ｎｂ／Ｎｇ＋Ｎｃ）＞Ｔｐｒｏｃ …数式（４）

Ｔｐｒｏｃ；切り替え後グループのそれぞれのビットストリームごとに１個のセグメントをダウンロードし、セグメントごとに１個のＭＰ４サンプルをデマルチプレックス処理し、デコード処理して１個の出力信号を出力するまでの処理時間の合計
Ｔｄｉｓｐ；出力バッファ２７４に記録されている出力信号１個の表示時間
Ｎｇ；切り替え前グループ中のビットストリーム総数
Ｎａ；出力信号の総数
Ｎｂ；ＭＰ４サンプルの総数
Ｎｃ；セグメントのＭＰ４サンプルの個数

ここで、フローチャートを用いて、上述した切り替え位置の設定について説明する。図２９は、第１の実施形態に係るクライアント装置２０が実行するグループの切り替え位置の決定処理の一例を示すフローチャートである。

アプリケーション制御部２６は、出力バッファ２７４に切り替え位置を設定可能であるか否かを判定する（ステップＳ１０１）。すなわち、アプリケーション制御部２６は、数式（２）を満たすか否かを判定する。

出力バッファ２７４に切り替え位置を設定可能である場合に（ステップＳ１０１；Ｙｅｓ）、アプリケーション制御部２６は、数式（２）を満たす出力信号の出力時刻を取得する（ステップＳ１０２）。更に詳しくは、アプリケーション制御部２６は、出力装置３０に出力される早い順に出力信号を並べた場合に、数式（２）を満たすＮａ番目の出力信号の出力時刻をビットストリームごとに取得する。

出力バッファ２７４に切り替え位置を設定することができない場合に（ステップＳ１０１；Ｎｏ）、アプリケーション制御部２６は、ＭＰ４サンプルバッファ２７２に切り替え位置を設定可能であるか否かを判定する（ステップＳ１０３）。すなわち、アプリケーション制御部２６は、数式（３）を満たすか否かを判定する。

ＭＰ４サンプルバッファ２７２に切り替え位置を設定可能である場合に（ステップＳ１０３；Ｙｅｓ）、アプリケーション制御部２６は、数式（３）を満たすＭＰ４サンプルの出力時刻を取得する（ステップＳ１０４）。更に詳しくは、アプリケーション制御部２６は、出力バッファ２７４に出力される早い順にＭＰ４サンプルを並べた場合に、数式（３）を満たすＮｂ番目のＭＰ４サンプルの出力時刻をビットストリームごとに取得する。

ＭＰ４サンプルバッファ２７２に切り替え位置を設定することができない場合に（ステップＳ１０３；Ｎｏ）、アプリケーション制御部２６は、セグメントバッファ２５２の１個目のセグメントに切り替え位置を設定可能であるか否かを判定する（ステップＳ１０５）。すなわち、アプリケーション制御部２６は、数式（４）を満たすか否かを判定する。

ＭＰ４サンプルバッファ２７２に切り替え位置を設定することができない場合に（ステップＳ１０５；Ｎｏ）、アプリケーション制御部２６は、ステップＳ１０７に移行する。

セグメントバッファ２５２の１個目のセグメントに切り替え位置を設定可能である場合に（ステップＳ１０５；Ｙｅｓ）、アプリケーション制御部２６は、数式（４）を満たすＭＰ４サンプルの出力時刻を取得する（ステップＳ１０６）。更に詳しくは、アプリケーション制御部２６は、ＭＰ４サンプルバッファ２７２に出力される早い順にＭＰ４サンプルを並べた場合に、数式（４）を満たすＮｂ番目のＭＰ４サンプルの出力時刻をビットストリームごとに取得する。

アプリケーション制御部２６は、取得した出力時刻を切り替え位置に決定する（ステップＳ１０７）。

以上により、アプリケーション制御部２６は、グループの切り替え位置の決定処理を終了する。

［第１の実施形態に係る切り替え後グループのダウンロード手順］
次に、第１の実施形態に係るコンテンツのグループが切り替えられた場合に切り替え後のグループに属するセグメントファイル１２１のダウンロード処理の手順について説明する。

コンテンツのグループの切り替え前後において、共通して使用するセグメントファイル１２１のビットストリームを改めてダウンロードする必要はない。そのため、ダウンロード部２５１は、受信したセグメントファイル１２１のビットストリームに含まれるセグメントを記憶するセグメントバッファ２５２等の第１記憶部に、切り替え後のグループに属しているセグメントファイル１２１が記憶されている場合に、セグメントファイル１２１を受信しない。

ここで、図３０は、切り替え後のセグメントファイル１２１のダウンロードの一例を示す説明図である。図３０は、セグメントバッファ２５２の状態を示している。更に詳しくは、グループ１に属するメタデータＡ及びメディアＣをダウンロードして、デマルチプレックス処理等の処理が実行されていたが、切り替え位置でグループ２に切り替えられたことを示している。そのため、グループ２に属するメタデータＢは、未だダウンロードされておらず、セグメントバッファ２５２に記憶されていない状態を示している。

また、メタデータＡ（Ｍ）、メタデータＡ（Ｍ＋１）、メディアＣ（Ｍ）、及びメディアＣ（Ｍ＋１）が抽出部２７１に順次入力されるのを待機している。また、メタデータＡ（Ｍ－１）、及びメディアＣ（Ｍ－１）は、抽出部２７１に入力されたため、セグメントバッファ２５２から削除されている。

ここで、メディアＣは、グループ１及びグループ２の両方で共通して使用される。また、メディアＣは、ダウンロード済みである。そのため、クライアント装置２０は、メディアＣを新たにダウンロードする必要がない。アプリケーション制御部２６は、ダウンロード予定のセグメントファイル１２１のビットストリーム番号と、セグメントバッファ２５２に記憶されたセグメントのセグメント属性情報のビットストリーム番号と、を比較してダウンロードの要否を判定する。アプリケーション制御部２６は、ダウンロード予定のセグメントファイル１２１のビットストリーム番号が記憶されている場合に、ダウンロードは不要と判定する。アプリケーション制御部２６は、ダウンロード予定のセグメントファイル１２１のビットストリーム番号が記憶されていない場合に、ダウンロードは必要と判定する。

また、ダウンロードに際して、ダウンロード部２５１は、セグメントバッファ２５２の空き容量が閾値未満であることを条件に、セグメントバッファ２５２に記憶されたセグメントを削除する。すなわち、ダウンロード部２５１は、セグメントバッファ２５２の空き容量が閾値以上であることを条件に、セグメントバッファ２５２に記憶されたセグメントを削除せずに保持する。そして、削除せずに保持したセグメントは、コンテンツ切り替えが完了しなかった場合の画音ギャップの回避のために利用することができる。

ここで、フローチャートを用いて、上述した切り替え位置の決定について説明する。図３１は、第１の実施形態に係るクライアント装置２０が実行する切り替え後のグループのダウンロード処理の一例を示すフローチャートである。

アプリケーション制御部２６は、切り替え後のセグメントファイル１２１のビットストリームに含まれているセグメントがセグメントバッファ２５２に記憶されているか否かを判定する（ステップＳ１１１）。すなわち、アプリケーション制御部２６は、ダウンロード予定のセグメントファイル１２１のビットストリーム番号と同一のビットストリーム番号であって、切り替え位置以降のセグメント番号を有するセグメントを検出したか否かを判定する。

切り替え後のセグメントファイル１２１のセグメントがセグメントバッファ２５２に記憶されている場合に（ステップＳ１１１；Ｎｏ）、クライアント装置２０は、ダウンロード済みであるため終了する。

切り替え後のセグメントファイル１２１のセグメントがセグメントバッファ２５２に記憶されていない場合に（ステップＳ１１１；Ｙｅｓ）、アプリケーション制御部２６は、セグメントバッファ２５２に十分な空き容量があるか否かを判定する（ステップＳ１１２）。ここで、十分な空き容量とは、例えば空き容量が閾値以上あることである。閾値は、予め設定された値であってもよいし、処理時間に基づいて算出された値であってもよいし、ダウンロースするセグメントファイル１２１等のデータサイズに基づいて算出された値であってもよい。

セグメントバッファ２５２に十分な空き容量がない場合に（ステップＳ１１２；Ｎｏ）、アプリケーション制御部２６は、セグメントバッファ２５２に記憶されたセグメントを削除する（ステップＳ１１３）。

セグメントバッファ２５２に十分な空き容量がある場合に（ステップＳ１１２；Ｙｅｓ）、アプリケーション制御部２６は、セグメントバッファ２５２に記憶されたセグメントを削除しない。

ＨＴＴＰアクセス制御部２５のダウンロード部２５１は、セグメントファイル１２１のビットストリームに含まれているセグメントを受信する（ステップＳ１１４）。

ＨＴＴＰアクセス制御部２５のダウンロード部２５１は、受信したセグメントに対応したセグメント属性情報を生成する（ステップＳ１１５）。

ＨＴＴＰアクセス制御部２５のダウンロード部２５１は、受信したセグメントに生成したセグメント属性情報を付加する（ステップＳ１１６）。

ＨＴＴＰアクセス制御部２５は、セグメント属性情報が付加されたセグメントをセグメントバッファ２５２に記憶させる（ステップＳ１１７）。

以上により、クライアント装置２０は、ダウンロード処理を終了する。

［第１の実施形態に係る切り替え後グループのデマルチプレックス手順］
次に、第１の実施形態に係るコンテンツのグループが切り替えられた場合に切り替え後のグループに属するセグメントのデマルチプレックス処理の手順について説明する。

コンテンツのグループの切り替え前後において、共通して使用するセグメントファイル１２１のビットストリームから抽出したＭＰ４サンプルがＭＰ４サンプルバッファ２７２に記憶されている場合、改めてデマルチプレックス処理を実行する必要はない。そのため、抽出部２７１は、ＭＰ４サンプルが属していたグループを示すグループ情報を含むＭＰ４サンプル属性情報をＭＰ４サンプルに付加してＭＰ４サンプルバッファ２７２等の第２記憶部に記憶した場合に、切り替え後のグループに属しているＭＰ４サンプルがＭＰ４サンプルバッファ２７２に記憶されていることを条件に、切り替え後のグループに属しているＭＰ４サンプルを抽出しない。そして、メディアエンジン２７は、処理対象のセグメントのセグメント属性情報のビットストリーム番号と、ＭＰ４サンプルバッファ２７２のＭＰ４サンプル属性情報のビットストリーム番号とを比較して、デマルチプレックス処理の要否を判定する。

また、デマルチプレックス処理に際して、抽出部２７１は、ＭＰ４サンプルバッファ２７２の空き容量が閾値未満であることを条件に、ＭＰ４サンプルバッファ２７２に記憶されたＭＰ４サンプルを削除する。すなわち、抽出部２７１は、ＭＰ４サンプルバッファ２７２の空き容量が閾値以上であることを条件に、ＭＰ４サンプルバッファ２７２に記憶されたＭＰ４サンプルを削除せずに保持する。そして、削除せずに保持したＭＰ４サンプルは、コンテンツ切り替えが完了しなかった場合の画音ギャップの回避のために利用することができる。

ここで、図３２は、第１の実施形態に係るクライアント装置２０が実行する切り替え後のグループに属するセグメントのデマルチプレックス処理の一例を示すフローチャートである。

アプリケーション制御部２６は、切り替え後のセグメントファイル１２１のビットストリームに含まれるＭＰ４サンプルがＭＰ４サンプルバッファ２７２に記憶されていないか否かを判定する（ステップＳ１２１）。すなわち、アプリケーション制御部２６は、デマルチプレックス処理予定のセグメントのビットストリーム番号と同一のビットストリーム番号であって、切り替え位置以降のセグメント番号であって、切り替え位置以降のＭＰ４サンプル番号を有するＭＰ４サンプルを検出したか否かを判定する。

切り替え後のＭＰ４サンプルがＭＰ４サンプルバッファ２７２に記憶されている場合に（ステップＳ１２１；Ｎｏ）、クライアント装置２０は、デマルチプレックス処理済みであるため終了する。

切り替え後のＭＰ４サンプルがＭＰ４サンプルバッファ２７２に記憶されていない場合に（ステップＳ１２１；Ｙｅｓ）、アプリケーション制御部２６は、ＭＰ４サンプルバッファ２７２に十分な空き容量があるか否かを判定する（ステップＳ１２２）。ここで、十分な空き容量とは、例えば空き容量が閾値以上あることである。閾値は、予め設定された値であってもよいし、処理時間に基づいて算出された値であってもよいし、ダウンロースするセグメントファイル１２１等のデータサイズ基づいて算出された値であってもよい。

ＭＰ４サンプルバッファ２７２に十分な空き容量がない場合に（ステップＳ１２２；Ｎｏ）、抽出部２７１は、ＭＰ４サンプルバッファ２７２に記憶されたＭＰ４サンプルを削除する（ステップＳ１２３）。

ＭＰ４サンプルバッファ２７２に十分な空き容量がある場合に（ステップＳ１２２；Ｙｅｓ）、抽出部２７１は、ＭＰ４サンプルバッファ２７２に記憶されたＭＰ４サンプルを削除しない。

抽出部２７１は、セグメントバッファ２５２から取得したセグメントからＭＰ４サンプルを抽出する（ステップＳ１２４）。

抽出部２７１は、抽出したＭＰ４サンプルに対応したＭＰ４サンプル属性情報を生成する（ステップＳ１２５）。

抽出部２７１は、抽出したＭＰ４サンプルに生成したＭＰ４サンプル属性情報を付加する（ステップＳ１２６）。

抽出部２７１は、ＭＰ４サンプル属性情報が付加されたＭＰ４サンプルをＭＰ４サンプルバッファ２７２に記憶させる（ステップＳ１２７）。

以上により、クライアント装置２０は、デマルチプレックス処理を終了する。

［第１の実施形態に係る切り替え後グループのデコード手順］
次に、第１の実施形態に係るコンテンツのグループが切り替えられた場合に切り替え後のグループに属するＭＰ４サンプルのデコード処理の手順について説明する。

コンテンツのグループの切り替え前後において、共通して使用するセグメントファイル１２１のビットストリームから抽出したＭＰ４サンプルから生成した出力信号が出力バッファ２７４に記憶されている場合、改めてデコード処理を実行する必要はない。そのため、３Ｄオーディオデコーダ２７３は、切り替え後のグループに属しているＭＰ４サンプルのデコードにより生成された出力信号が出力バッファ２７４等の第３記憶部に記憶されていることを条件に、ＭＰ４サンプルをデコードしない。そこで、メディアエンジン２７は、出力バッファ２７４に記憶された出力信号の出力信号属性情報が示すグループ情報が切り替え後のグループ情報であって、出力時刻が切り替え位置以降であるか否かによりデコードの要否を判定する。

ここで、図３３は、第１の実施形態に係るクライアント装置２０が実行する切り替え後のグループに属するＭＰ４サンプルのデコード処理の一例を示すフローチャートである。

３Ｄオーディオデコーダ２７３は、ＭＰ４サンプルバッファ２７２に同一出力時刻のＭＰ４サンプルが２つ記憶されているか否かを判定する（ステップＳ１３１）。すなわち、３Ｄオーディオデコーダ２７３は、ＭＰ４サンプルバッファ２７２に、音声オブジェクト及びメタデータのＭＰ４サンプルが記憶されているか否かを判定する。ＭＰ４サンプルバッファ２７２に同一出力時刻のＭＰ４サンプルが２つ記憶されていない場合（ステップＳ１３１；Ｎｏ）、３Ｄオーディオデコーダ２７３は、待機する。

ＭＰ４サンプルバッファ２７２に同一出力時刻のＭＰ４サンプルが２つ記憶されている場合（ステップＳ１３１；Ｙｅｓ）、３Ｄオーディオデコーダ２７３は、同一出力時刻のＭＰ４サンプルが切り替え後に再生するＭＰ４サンプルであるか否かを判定する（ステップＳ１３２）。具体的には、３Ｄオーディオデコーダ２７３は、同一出力時刻のＭＰ４サンプルのＭＰ４サンプル属性情報に基づいて、同一出力時刻のＭＰ４サンプルが切り替え位置以降の出力時刻であって、切り替え後のグループ情報であるかを判定する。

切り替え後に再生するＭＰ４サンプルではない場合に（ステップＳ１３２；Ｎｏ）、３Ｄオーディオデコーダ２７３は、処理を終了する。

切り替え後に再生するＭＰ４サンプルである場合に（ステップＳ１３２；Ｙｅｓ）、３Ｄオーディオデコーダ２７３は、同一出力時刻の２つのＭＰ４サンプルのうち、一方のＭＰ４サンプルを取得する（ステップＳ１３３）。

３Ｄオーディオデコーダ２７３は、取得したＭＰ４サンプルに対して一次デコード処理を実行する（ステップＳ１３４）。

３Ｄオーディオデコーダ２７３は、同一出力時刻の２つのＭＰ４サンプルのうち、ステップＳ１３３で取得しなかった他方のＭＰ４サンプルを取得する（ステップＳ１３５）。

３Ｄオーディオデコーダ２７３は、取得したＭＰ４サンプルに対して一次デコード処理を実行する（ステップＳ１３６）。

３Ｄオーディオデコーダ２７３は、二次デコード処理を実行する（ステップＳ１３７）。

以上により、３Ｄオーディオデコーダ２７３は、切り替え後のデコード処理を終了する。

［第１の実施形態に係る切り替え後グループの出力手順］
次に、第１の実施形態に係るコンテンツのグループが切り替えられた場合に切り替え後のグループに属する出力信号の出力処理の手順について説明する。レンダリング部２７３５は、切り替え位置から切り替え後のグループに属するセグメントファイル１２１のビットストリームから生成した出力信号を出力装置３０に出力する。その際、レンダリング部２７３５は、切り替え後のグループに属しているＭＰ４サンプルから生成された出力信号を出力装置３０に出力した後に、切り替え前のグループに属しているＭＰ４サンプルから生成された出力信号を削除する。このように、出力信号を出力装置３０に出力した後に、切り替え前のグループに属しているＭＰ４サンプルから生成された出力信号を削除することで、レンダリング部２７３５は、コンテンツ切り替えが完了しなかった場合の画音ギャップの回避のために利用することができる。

ここで、図３４は、第１の実施形態に係るクライアント装置２０が実行する切り替え後のグループに属する出力信号の出力処理の一例を示すフローチャートである。

レンダリング部２７３５は、出力バッファ２７４に出力時刻が同一の出力信号であって、切り替え前後のグループの其々の出力信号が記憶されているか否かを判定する（ステップＳ１４１）。

出力バッファ２７４に出力時刻が同一の出力信号であって、切り替え前後のグループの其々の出力信号が記憶されていない場合に（ステップＳ１４１；Ｎｏ）、レンダリング部２７３５は、処理を終了する。

出力バッファ２７４に出力時刻が同一の出力信号であって、切り替え前後のグループの其々の出力信号が記憶されている場合に（ステップＳ１４１；Ｙｅｓ）、レンダリング部２７３５は、切り替え後のグループの出力信号を出力装置３０に出力する（ステップＳ１４２）。

レンダリング部２７３５は、切り替え前のグループの出力信号を出力バッファ２７４から削除する（ステップＳ１４３）。

以上により、３Ｄオーディオデコーダ２７３は、切り替え後の出力処理を終了する。

このように、第１の実施形態にかかるクライアント装置２０は、セグメント属性情報、ＭＰ４サンプル属性情報、及び出力信号属性情報を各情報に付加する。そして、クライアント装置２０は、これら情報に基づいて切り替え位置を算出することで、セグメントよりも短時間のＭＰ４サンプル単位でのコンテンツのグループの切り替えを実現している。よって、クライアント装置２０は、コンテンツの切り替えにかかる時間を短縮することができる。

［第１の実施形態の変形例（１）］
上記第１の実施形態では、データが再生させる順番で整列されたセグメントファイル１２１の場合について説明した。変形例（１）では、ＧＯＰ（Group Of Pictures）構造を持つセグメントファイル１２１の場合について説明する。

ＧＯＰ構造を持つセグメントファイル１２１の場合、アプリケーション制御部２６は、ＧＯＰ単位で切り替え位置を算出する点が異なっている。更に詳しくは、ＧＯＰ構造を持つセグメントファイル１２１の場合、ランダムアクセス可能なポイントではない位置を切り替え位置に決定した場合、フレーム間予測を行うことができなくなってしまう。そこで、アプリケーション制御部２６は、算出した処理時間に基づいて導出したＭＰ４サンプルが、セグメントファイル１２１のｍｏｏｖｂｏｘに含まれるＳｙｎｃＳａｍｐｌｅＢｏｘ（ｓｔｓｓ）で示されたランダムアクセス可能なポイントである場合に、切り替え位置に決定する。ランダムアクセス可能なポイントとは、例えばＧＯＰ構造におけるＩ（Intra）ピクチャ等の基準画像である。

ここで、図３５は、変形例（１）に係るＭＰ４サンプルバッファ２７２に記憶されたＭＰ４サンプルのデータ構成例を示す図である。変形例（１）に係るＭＰ４サンプル属性情報には、可能点情報が含まれている。可能点情報は、ランダムアクセス可能か否かを示すフラグである。すなわち、可能点情報は、デコード前に切り替え位置になれるＭＰ４サンプルか否かを示すフラグである。

抽出部２７１は、ＭＰ４サンプルが切り替え位置になれるか否かを示す可能点情報を含むＭＰ４サンプル属性情報を付加する。すなわち、抽出部２７１は、ＭＰ４サンプルがフレーム間予測における基準画像である場合に、切り替え位置になり得ることを示す可能点情報を含むＭＰ４サンプル属性情報を付加する。具体的には、抽出部２７１は、切り替え位置になれるＭＰ４サンプルである場合、可能点情報に「１」を設定し、切り替え位置として不適切なＭＰ４サンプルである場合、可能点情報に「０」を設定する。そして、アプリケーション制御部２６は、ＭＰ４サンプル属性情報に含まれる可能点情報が切り替え位置になれることを示している場合に、切り替え位置に決定する。

［変形例（１）に係るダウンロード処理手順］
次に、変形例（１）に係る抽出部２７１が実行するデマルチプレックス処理について説明する。図３６は、変形例（１）に係る抽出部２７１が実行するデマルチプレックス処理の一例を示すフローチャートである。

ステップＳ１５１からステップＳ１５３までの処理は、図１７に示すステップＳ４１からステップＳ４３までの処理と同じである。

抽出部２７１は、ＳｙｎｃＳａｍｐｌｅＢｏｘ（ｓｔｓｓ）に基づいて、対象のＭＰ４サンプルの可能点情報を設定する（ステップＳ１５４）。

ステップＳ１５５からステップＳ１５６までの処理は、図１７に示すステップＳ４４からステップＳ４５までの処理と同じである。

［変形例（１）に係るグループを切り替える位置の決定］
処理時間の合計（Ｔｐｒｏｃ）の算出において、ＧＯＰ単位で切り替え位置が決定される。すなわち、ＭＰ４サンプル属性情報の可能点情報の値が「１」のＭＰ４サンプルでなければデコードを実行することができない。

更に詳しくは、アプリケーション制御部２６は、下記数式（５）にて処理時間の合計（Ｔｐｒｏｃ）を算出する。なお、Ｔｐｒｏｃの初期値は０とする。

Ｔｐｒｏｃ＝Ｔｐｒｏｃ
＋（８×ｓｉｚｅ／ｂａｎｄｗｉｄｔｈ）
＋（８×ｓｉｚｅ／（Ｎｇｏｐ×ｄｅｍｕｘ－ｒａｔｅ））
＋（８×ｓｉｚｅ／（Ｎｇｏｐ×ｄｅｃｏｄｅ－ｒａｔｅ）） …数式（５）

Ｔｐｒｏｃ；処理時間の合計（秒）
ｓｉｚｅ；受信したセグメントのデータサイズ（ｂｙｔｅ）
ｂａｎｄｗｉｄｔｈ；ネットワーク帯域（ビット／秒）
Ｎｇｏｐ；切り替え後グループのビットストリームにおいて１つのセグメントに含まれているＧＯＰの総数
ｄｅｍｕｘ－ｒａｔｅ；切り替え後グループのビットストリームに対する抽出部２７１のデマルチプレックス処理等の処理レート（ビット／秒）
ｄｅｃｏｄｅ－ｒａｔｅ；切り替え後グループのビットストリームに対する３Ｄオーディオデコーダ２７３のデコード処理等の処理レート（ビット／秒）

次に、変形例（１）にかかるＧＯＰ構造を持つセグメントファイル１２１の切り替え位置に決定処理について説明する。図３７は、変形例（１）に係るクライアント装置２０が実行するグループの切り替え位置の決定処理の一例を示すフローチャートである。

ステップＳ１６１からステップＳ１６２までの処理は、図３０に示すステップＳ１０１からステップＳ１０２までの処理と同じである。

アプリケーション制御部２６は、ＭＰ４サンプルバッファ２７２に切り替え位置が設定可能であるか否かを判定する（ステップＳ１６３）。更に詳しくは、アプリケーション制御部２６は、数式（５）により算出されたＴｐｒｏｃにおいて、数式（２）を満たし、且つＭＰ４サンプル属性情報の可能点情報が「１」であるＭＰ４サンプルがＭＰ４サンプルバッファ２７２に有るか否かを判定する。

ＭＰ４サンプルバッファ２７２に切り替え位置が設定可能である場合に（ステップＳ１６３；Ｙｅｓ）、アプリケーション制御部２６は、該当するＭＰ４サンプルの出力時刻を取得する（ステップＳ１６４）。

ＭＰ４サンプルバッファ２７２に切り替え位置が設定不可である場合に（ステップＳ１６３；Ｎｏ）、アプリケーション制御部２６は、セグメントバッファ２５２に切り替え位置が設定可能であるか否かを判定する（ステップＳ１６５）。

更に詳しくは、アプリケーション制御部２６は、数式（５）により算出されたＴｐｒｏｃにおいて、数式（３）を満たしているか否かを判定する。また、切り替え位置として設定されるＭＰ４サンプルは、セグメントバッファ２５２に記憶されている状態においても、ＭＰ４サンプル属性情報の可能点情報が「１」であることが求められる。ところが、抽出部２７１がＭＰ４サンプルの可能点情報を設定する前であるため、該当するＭＰ４サンプルの可能点情報の値は不明である。

そこで、アプリケーション制御部２６は、可能点情報、つまりランダムアクセス可能なポイントはＧＯＰ構造の先頭等の境界にあると推定する。そして、アプリケーション制御部２６は、ＧＯＰ構造の境界のＭＰ４サンプルが数式（３）を満たすか否かにより、セグメントバッファ２５２に切り替え位置が設定可能であるか否かを判定する。

セグメントバッファ２５２に切り替え位置が設定可能である場合に（ステップＳ１６５；Ｙｅｓ）、アプリケーション制御部２６は、該当するＭＰ４サンプルの出力時刻を取得する（ステップＳ１６６）。

アプリケーション制御部２６は、取得した出力時刻を切り替え位置に決定する（ステップＳ１６７）。

このように、第１の実施形態の変形例（１）にかかるクライアント装置２０は、可能点情報をＭＰ４サンプル属性情報に付加している。そして、クライアント装置２０は、可能点情報に基づいて、切り替え位置できるか否かを判定している。よって、クライアント装置２０は、セグメントファイル１２１がＧＯＰ構造を有している場合であっても、コンテンツの切り替えにかかる時間を短縮することができる。

（効果）
クライアント装置２０は、ダウンロード部２５１と、抽出部２７１と、アプリケーション制御部２６と、レンダリング部２７３５とを備える。ダウンロード部２５１は、ＨＴＴＰプロトコルに準拠した通信により、複数のセグメントを有するセグメントファイル１２１と、セグメントファイル１２１が属するグループが設定されたＭＰＤファイル１２２とを受信する。抽出部２７１は、デマルチプレックス処理により、ダウンロード部２５１が受信したセグメントファイル１２１のビットストリームのセグメントに１以上含まれるＭＰ４サンプルを抽出して、ＭＰ４サンプルの再生開始時間を含むＭＰ４サンプル属性情報をＭＰ４サンプルに付加する。アプリケーション制御部２６は、ストリーミング再生開始、及びストリーミング再生停止、コンテンツのグループの切り替え等の操作を受け付ける。また、アプリケーション制御部２６は、受け付けたコンテンツのグループを切り替える操作と、セグメント属性情報、ＭＰ４サンプル属性情報、及び出力信号属性情報に基づいて、切り替え後のグループに属するセグメントファイル１２１を出力させる切り替え位置をＭＰ４サンプル単位で決定する。レンダリング部２７３５は、切り替え位置から切り替え後のグループに属するセグメントファイル１２１のビットストリームから生成した出力信号を出力装置３０に出力する。これにより、クライアント装置２０は、コンテンツの切り替えにかかる時間を短縮することができる。

アプリケーション制御部２６は、受け付けた切り替え後のグループのセグメントファイル１２１のビットストリームの再生を開始するまでにかかる処理時間を算出する。アプリケーション制御部２６は、アプリケーション制御部２６が算出した処理時間に基づいて、切り替え位置を決定する。このように、クライアント装置２０は、処理時間に基づいて、切り替え位置を決定することでコンテンツの切り替えにかかる時間を短縮することができる。

ダウンロード部２５１は、受信したセグメントファイル１２１のビットストリームに含まれるセグメントを記憶するセグメントバッファ２５２等の第１記憶部に、切り替え後のグループに属しているセグメントファイル１２１が記憶されている場合に、セグメントファイル１２１を受信しない。これにより、クライアント装置２０は、冗長なダウンロードを防止することができる。

抽出部２７１は、ＭＰ４サンプルが属していたグループを示すグループ情報を含むＭＰ４サンプル属性情報をＭＰ４サンプルに付加してＭＰ４サンプルバッファ２７２に記憶した場合に、切り替え後のグループに属しているＭＰ４サンプルがＭＰ４サンプルバッファ２７２に記憶されていることを条件に、切り替え後のグループに属しているＭＰ４サンプルを抽出しない。これにより、クライアント装置２０は、冗長なデマルチマルチプレックスを防止することができる。

３Ｄオーディオデコーダ２７３は、切り替え後のグループに属しているＭＰ４サンプルのデコードにより生成された出力信号が出力バッファ２７４に記憶されていることを条件に、ＭＰ４サンプルをデコードしない。これにより、クライアント装置２０は、冗長なデコードを防止することができる。

解析部２７３１は、ＭＰ４サンプルをオブジェクトデータと、オブジェクトデータに付随するメタデータとに分離させる。これにより、クライアント装置２０は、オブジェクトデータの復号、及びメタデータの復号の両方を実行した後で所望のデータだけを取捨するという冗長性を排除できる。

ダウンロード部２５１は、セグメントバッファ２５２の空き容量が閾値未満であることを条件に、セグメントバッファ２５２に記憶されたセグメントを削除する。すなわち、ダウンロード部２５１は、セグメントバッファ２５２の空き容量が閾値以上であることを条件に、セグメントバッファ２５２に記憶されたセグメントを削除せずに保持する。これにより、クライアント装置２０は、削除せずに保持したセグメントは、コンテンツ切り替えが完了しなかった場合の画音ギャップの回避のために利用することができる。

抽出部２７１は、ＭＰ４サンプルバッファ２７２の空き容量が閾値未満であることを条件に、ＭＰ４サンプルバッファ２７２に記憶されたＭＰ４サンプルを削除する。すなわち、抽出部２７１は、ＭＰ４サンプルバッファ２７２の空き容量が閾値以上であることを条件に、ＭＰ４サンプルバッファ２７２に記憶されたＭＰ４サンプルを削除せずに保持する。これにより、クライアント装置２０は、削除せずに保持したＭＰ４サンプルは、コンテンツ切り替えが完了しなかった場合の画音ギャップの回避のために利用することができる。

レンダリング部２７３５は、切り替え後のグループに属しているＭＰ４サンプルから生成された出力信号を出力装置３０に出力した後に、切り替え前のグループに属しているＭＰ４サンプルから生成された出力信号を削除する。このように、出力信号を出力装置３０に出力した後に、切り替え前のグループに属しているＭＰ４サンプルから生成された出力信号を削除することで、レンダリング部２７３５は、コンテンツ切り替えが完了しなかった場合の画音ギャップの回避のために利用することができる。

抽出部２７１は、ＭＰ４サンプルが切り替え位置になれるか否かを示す可能点情報を含むＭＰ４サンプル属性情報を付加する。アプリケーション制御部２６は、ＭＰ４サンプル属性情報に含まれる可能点情報が切り替え位置になれることを示している場合に、切り替え位置に決定する。これにより、クライアント装置２０は、ＭＰ４サンプルが出力順に整列されていない場合においても、コンテンツの切り替えにかかる時間を短縮することができる。

抽出部２７１は、ＭＰ４サンプルがフレーム間予測における基準画像である場合に、切り替え位置になり得ることを示す可能点情報を含むＭＰ４サンプル属性情報を付加する。これにより、クライアント装置２０は、ＧＯＰ構造を持つセグメントファイル１２１の場合においても、コンテンツの切り替えにかかる時間を短縮することができる。

なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。

なお、本技術は以下のような構成も取ることができる。
（１）
複数のセグメントを有するセグメントファイルと、前記セグメントファイルが属するグループが設定された設定ファイルとを受信する受信部と、
前記受信部が受信した前記セグメントファイルの前記セグメントに１以上含まれるＭＰ４サンプルを抽出して、当該ＭＰ４サンプルの再生開始時間を含む属性情報を当該ＭＰ４サンプルに付加する抽出部と、
受け付けた前記グループを切り替える操作と、前記属性情報に基づいて、切り替え後の前記グループに属する前記セグメントファイルを出力させる切り替え位置を前記ＭＰ４サンプル単位で決定する決定部と、
前記切り替え位置から切り替え後の前記グループに属する前記セグメントファイルから生成した出力信号を出力装置に出力する出力部と、
を備える情報処理装置。
（２）
受け付けた切り替え後の前記グループの前記セグメントファイルの再生を開始するまでにかかる処理時間を算出する算出部を更に備え、
前記決定部は、前記算出部が算出した処理時間に基づいて、前記切り替え位置を決定する、
（１）に記載の情報処理装置。
（３）
前記受信部は、受信した前記セグメントファイルに含まれる前記セグメントを記憶する第１記憶部に、切り替え後の前記グループに属している前記セグメントファイルが記憶されている場合に、当該セグメントファイルを受信しない、
（１）又は（２）に記載の情報処理装置。
（４）
前記抽出部は、前記ＭＰ４サンプルが属していた前記グループを示すグループ情報を含む前記属性情報を当該ＭＰ４サンプルに付加して第２記憶部に記憶した場合に、切り替え後の前記グループに属している前記ＭＰ４サンプルが前記第２記憶部に記憶されていることを条件に、切り替え後の前記グループに属している前記ＭＰ４サンプルを抽出しない、
（１）乃至（３）の何れか一項に記載の情報処理装置。
（５）
切り替え後の前記グループに属している前記ＭＰ４サンプルのデコードにより生成された前記出力信号が第３記憶部に記憶されていることを条件に、当該ＭＰ４サンプルをデコードしない復号部を更に備える、
（１）乃至（４）の何れか一項に記載の情報処理装置。
（６）
前記ＭＰ４サンプルをオブジェクトデータと、オブジェクトデータに付随するメタデータとに分離させる分離部を更に備える、
（１）乃至（５）の何れか一項に記載の情報処理装置。
（７）
前記分離部は、前記オブジェクトデータである音声オブジェクトと、前記メタデータである前記音声オブジェクトの定位情報とに分離させる、
（６）に記載の情報処理装置。
（８）
前記受信部は、前記第１記憶部の空き容量が閾値未満であることを条件に、前記第１記憶部に記憶された前記セグメントを削除する、
（３）に記載の情報処理装置。
（９）
前記抽出部は、前記第２記憶部の空き容量が閾値未満であることを条件に、前記第２記憶部に記憶された前記ＭＰ４サンプルを削除する、
（４）に記載の情報処理装置。
（１０）
前記出力部は、切り替え後の前記グループに属している前記ＭＰ４サンプルから生成された前記出力信号を前記出力装置に出力した後に、切り替え前の前記グループに属している前記ＭＰ４サンプルから生成された前記出力信号を削除する、
（５）に記載の情報処理装置。
（１１）
前記抽出部は、前記ＭＰ４サンプルが切り替え位置になれるか否かを示す可能点情報を含む前記属性情報を付加し、
前記決定部は、前記ＭＰ４サンプルの前記属性情報に含まれる前記可能点情報が切り替え位置になれることを示している場合に、切り替え位置に決定する、
（１）乃至（１０）の何れか一項に記載の情報処理装置。
（１２）
前記抽出部は、前記ＭＰ４サンプルがフレーム間予測における基準画像である場合に、切り替え位置になり得ることを示す前記可能点情報を含む前記属性情報を付加する、
（１１）に記載の情報処理装置。
（１３）
複数のセグメントを有するセグメントファイルと、前記セグメントファイルが属するグループが設定された設定ファイルとを受信し、
受信した前記セグメントファイルの前記セグメントに１以上含まれるＭＰ４サンプルを抽出して、当該ＭＰ４サンプルの再生開始時間を含む属性情報を当該ＭＰ４サンプルに付加し、
受け付けた前記グループを切り替える操作と、前記属性情報に基づいて、切り替え後の前記グループに属する前記セグメントファイルを出力させる切り替え位置を前記ＭＰ４サンプル単位で決定し、
前記切り替え位置から切り替え後の前記グループに属する前記セグメントファイルから生成した出力信号を出力装置に出力する、
情報処理方法。
（１４）
情報処理装置が有するコンピュータを、
複数のセグメントを有するセグメントファイルと、前記セグメントファイルが属するグループが設定された設定ファイルとを受信する受信部と、
前記受信部が受信した前記セグメントファイルの前記セグメントに１以上含まれるＭＰ４サンプルを抽出して、当該ＭＰ４サンプルの再生開始時間を含む属性情報を当該ＭＰ４サンプルに付加する抽出部と、
受け付けた前記グループを切り替える操作と、前記属性情報に基づいて、切り替え後の前記グループに属する前記セグメントファイルを出力させる切り替え位置を前記ＭＰ４サンプル単位で決定する決定部と、
前記切り替え位置から切り替え後の前記グループに属する前記セグメントファイルから生成した出力信号を出力装置に出力する出力部と、
として機能させるための情報処理プログラム。

１ストリーミングシステム
１０サーバ装置
２０クライアント装置
３０出力装置
２５ＨＴＴＰアクセス制御部
２６アプリケーション制御部
２７メディアエンジン
１２１セグメントファイル
１２２ＭＰＤファイル
２５１ダウンロード部
２５２セグメントバッファ
２７１抽出部
２７２ＭＰ４サンプルバッファ
２７３３Ｄオーディオデコーダ
２７４出力バッファ
２７３１解析部
２７３２オブジェクトデコーダ
２７３３メタデータデコーダ
２７３４出力中間バッファ
２７３５レンダリング部

Claims

複数のセグメントを有するセグメントファイルと、前記セグメントファイルが属するグループが設定された設定ファイルとを受信する受信部と、
前記受信部が受信した前記セグメントファイルの前記セグメントに１以上含まれるＭＰ４サンプルを抽出して、当該ＭＰ４サンプルの再生開始時間を含む属性情報を当該ＭＰ４サンプルに付加する抽出部と、
受け付けた前記グループを切り替える操作と、前記属性情報に基づいて、切り替え後の前記グループに属する前記セグメントファイルを出力させる切り替え位置を前記ＭＰ４サンプル単位で決定する決定部と、
前記切り替え位置から切り替え後の前記グループに属する前記セグメントファイルから生成した出力信号を出力装置に出力する出力部と、
を備え、
前記決定部は、前記出力信号が記憶される第３記憶部、および、前記属性情報が付加された前記ＭＰ４サンプルが記憶される第２記憶部にそれぞれ規定された異なる条件に基づいて、前記第３記憶部、前記第２記憶部、もしくは、受信した前記セグメントファイルに含まれる前記セグメントを記憶する第１記憶部のいずれかにおいて前記切り替え位置を決定する、
情報処理装置。
受け付けた切り替え後の前記グループの前記セグメントファイルの再生を開始するまでにかかる処理時間を算出する算出部を更に備え、
前記決定部は、前記算出部が算出した処理時間に基づいて、前記切り替え位置を決定する、
請求項１に記載の情報処理装置。
前記受信部は、受信した前記セグメントファイルに含まれる前記セグメントを記憶する前記第１記憶部に、切り替え後の前記グループに属している前記セグメントファイルが記憶されている場合に、当該セグメントファイルを受信しない、
請求項１に記載の情報処理装置。
前記抽出部は、前記ＭＰ４サンプルが属していた前記グループを示すグループ情報を含む前記属性情報を当該ＭＰ４サンプルに付加して前記第２記憶部に記憶した場合に、切り替え後の前記グループに属している前記ＭＰ４サンプルが前記第２記憶部に記憶されていることを条件に、切り替え後の前記グループに属している前記ＭＰ４サンプルを抽出しない、
請求項１に記載の情報処理装置。
切り替え後の前記グループに属している前記ＭＰ４サンプルのデコードにより生成された前記出力信号が前記第３記憶部に記憶されていることを条件に、当該ＭＰ４サンプルをデコードしない復号部を更に備える、
請求項１に記載の情報処理装置。
前記ＭＰ４サンプルをオブジェクトデータと、オブジェクトデータに付随するメタデータとに分離させる分離部を更に備える、
請求項１に記載の情報処理装置。
前記分離部は、前記オブジェクトデータである音声オブジェクトと、前記メタデータである前記音声オブジェクトの定位情報とに分離させる、
請求項６に記載の情報処理装置。
前記受信部は、前記第１記憶部の空き容量が閾値未満であることを条件に、前記第１記憶部に記憶された前記セグメントを削除する、
請求項３に記載の情報処理装置。
前記抽出部は、前記第２記憶部の空き容量が閾値未満であることを条件に、前記第２記憶部に記憶された前記ＭＰ４サンプルを削除する、
請求項４に記載の情報処理装置。
前記出力部は、切り替え後の前記グループに属している前記ＭＰ４サンプルから生成された前記出力信号を前記出力装置に出力した後に、切り替え前の前記グループに属している前記ＭＰ４サンプルから生成された前記出力信号を削除する、
請求項５に記載の情報処理装置。
前記抽出部は、前記ＭＰ４サンプルが切り替え位置になれるか否かを示す可能点情報を含む前記属性情報を付加し、
前記決定部は、前記ＭＰ４サンプルの前記属性情報に含まれる前記可能点情報が切り替え位置になれることを示している場合に、切り替え位置に決定する、
請求項１に記載の情報処理装置。
前記抽出部は、前記ＭＰ４サンプルがフレーム間予測における基準画像である場合に、切り替え位置になり得ることを示す前記可能点情報を含む前記属性情報を付加する、
請求項１１に記載の情報処理装置。
複数のセグメントを有するセグメントファイルと、前記セグメントファイルが属するグループが設定された設定ファイルとを受信し、
受信した前記セグメントファイルの前記セグメントに１以上含まれるＭＰ４サンプルを抽出して、当該ＭＰ４サンプルの再生開始時間を含む属性情報を当該ＭＰ４サンプルに付加し、
受け付けた前記グループを切り替える操作と、前記属性情報に基づいて、切り替え後の前記グループに属する前記セグメントファイルを出力させる切り替え位置を前記ＭＰ４サンプル単位で決定し、
前記切り替え位置から切り替え後の前記グループに属する前記セグメントファイルから生成した出力信号を出力装置に出力する、
情報処理方法であって、さらに、
前記出力信号が記憶される第３記憶部、および、前記属性情報が付加された前記ＭＰ４サンプルが記憶される第２記憶部にそれぞれ規定された異なる条件に基づいて、前記第３記憶部、前記第２記憶部、もしくは、受信した前記セグメントファイルに含まれる前記セグメントを記憶する第１記憶部のいずれかにおいて前記切り替え位置を決定する、
情報処理方法。
情報処理装置が有するコンピュータを、
複数のセグメントを有するセグメントファイルと、前記セグメントファイルが属するグループが設定された設定ファイルとを受信する受信部と、
前記受信部が受信した前記セグメントファイルの前記セグメントに１以上含まれるＭＰ４サンプルを抽出して、当該ＭＰ４サンプルの再生開始時間を含む属性情報を当該ＭＰ４サンプルに付加する抽出部と、
受け付けた前記グループを切り替える操作と、前記属性情報に基づいて、切り替え後の前記グループに属する前記セグメントファイルを出力させる切り替え位置を前記ＭＰ４サンプル単位で決定する決定部と、
前記切り替え位置から切り替え後の前記グループに属する前記セグメントファイルから生成した出力信号を出力装置に出力する出力部と、
として機能させるための情報処理プログラムであって、
前記決定部は、前記出力信号が記憶される第３記憶部、および、前記属性情報が付加された前記ＭＰ４サンプルが記憶される第２記憶部にそれぞれ規定された異なる条件に基づいて、前記第３記憶部、前記第２記憶部、もしくは、受信した前記セグメントファイルに含まれる前記セグメントを記憶する第１記憶部のいずれかにおいて前記切り替え位置を決定する、
情報処理プログラム。