JP2018148570A - 情報処理装置、情報処理方法、及び、プログラム - Google Patents

情報処理装置、情報処理方法、及び、プログラム Download PDF

Info

Publication number
JP2018148570A
JP2018148570A JP2018089017A JP2018089017A JP2018148570A JP 2018148570 A JP2018148570 A JP 2018148570A JP 2018089017 A JP2018089017 A JP 2018089017A JP 2018089017 A JP2018089017 A JP 2018089017A JP 2018148570 A JP2018148570 A JP 2018148570A
Authority
JP
Japan
Prior art keywords
component
adaptationset
layer
level
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018089017A
Other languages
English (en)
Other versions
JP6471922B2 (ja
Inventor
山岸 靖明
Yasuaki Yamagishi
靖明 山岸
北里 直久
Naohisa Kitazato
直久 北里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2018089017A priority Critical patent/JP6471922B2/ja
Publication of JP2018148570A publication Critical patent/JP2018148570A/ja
Application granted granted Critical
Publication of JP6471922B2 publication Critical patent/JP6471922B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】MPEG-DASH方式を利用してサービスを提供することができるようにする。【解決手段】デジタル放送の放送波を受信する受信部と、放送波又は通信網で伝送される、MPEG-DASHの規格に準拠したMPDに基づいて、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する制御部とを備える受信装置が提供される。本技術は、例えば、テレビジョン受像機に適用することができる。【選択図】図27

Description

本技術は、情報処理装置、情報処理方法、及び、プログラムに関し、特に、MPEG-DASH方式を利用してサービスを提供することができるようにした情報処理装置、情報処理方法、及び、プログラムに関する。
IPTV(Internet Protocol Television)等のインターネットストリーミングにおける標準化の流れとして、HTTP(Hypertext Transfer Protocol)ストリーミングによるVoD(Video On Demand)ストリーミングや、ライブストリーミングに適用される方式の標準化が行われている。特に、ISO/IEC/MPEGで標準化が行われているMPEG-DASH(Moving Picture Expert Group - Dynamic Adaptive Streaming over HTTP)が注目されている(例えば、非特許文献1参照)。
MPEG-DASHは、MPD(Media Presentation Description)と呼ばれるメタファイルと、そこに記述されるチャンク化されたオーディオ、ビデオ、又は字幕等のメディアデータのアドレス(URL:Uniform Resource Locator)に従い、ストリーミングデータを取得して再生するものである。
MPDに記述されるメディアデータのストリーム(Representation)は、属性の異なる複数候補が列挙される。MPDを処理するアプリケーション(例えば、ストリームプレイヤ等)は、それらの複数候補のストリームの中から、現在のネットワーク環境条件に応じた最適なストリームを選択し、当該ストリームを取得して再生する。
そして、ネットワーク環境が変化すれば、それに応じて取得対象のストリームを変更することになる。また、当該選択の基準は、エンドユーザ(視聴者)による選択か、あるいはデバイスの能力属性(例えば、実装されている機能、方式属性(例えばコーデック等)、能力属性(例えばメモリ容量や処理能力等))等が想定されている。
ISO/IEC 23009-1:2012 Information technology Dynamic adaptive streaming over HTTP (DASH)
ところで、MPEG-DASH方式を利用して放送サービスを提供することが想定されているが、そのような放送サービスを提供するための技術方式は確立されていない。
本技術はこのような状況に鑑みてなされたものであり、MPEG-DASH方式を利用してサービスを提供することができるようにするものである。
本技術の一側面の情報処理装置は、複数のAdaptationSet要素が関連付けられることを示す第1の情報と、前記第1の情報により関連付けられた前記複数のAdaptationSet要素が選択対象である同一のグループに属していることを示す第2の情報とを含むMPD(Media Presentation Description)を受信する受信部を備える情報処理装置である。
本技術の一側面の情報処理方法又はプログラム、本技術の一側面の情報処理装置に対応する情報処理方法又はプログラムである。
本技術の一側面の情報処理装置、情報処理方法、及び、プログラムにおいては、複数のAdaptationSet要素が関連付けられることを示す第1の情報と、前記第1の情報により関連付けられた前記複数のAdaptationSet要素が選択対象である同一のグループに属していることを示す第2の情報とを含むMPD(Media Presentation Description)が受信される。
本技術の一側面によれば、MPEG-DASH方式を利用してサービスを提供することができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
MPDの構造を示す図である。 MPDの記述例を示す図である。 多重化されたストリームを表現する場合における、AdaptationSet要素とRepresentation要素の関係を示す図である。 多重化されたストリームを表現する場合における、AdaptationSet要素と、Representation要素と、SubRepresentation要素の関係を示す図である。 AdaptationSet要素に含めることが可能な属性や要素の例を示す図である。 Representation要素に含めることが可能な属性や要素の例を示す図である。 コンポーネントレイヤ構造を示す図である。 Period要素とSubset要素との関係を示す図である。 Subset要素とcontains属性の記述例を示す図である。 レベル2のレイヤにおけるSubset要素のcontains属性による複数のAdaptationSet要素の関連付けの例を示す図である。 AdaptationSet要素のgroup属性の記述例を示す図である。 レベル1のレイヤにおけるAdaptationSet要素のgroup属性による複数のAdaptationSet要素のグルーピングの例を示す図である。 Subset要素にgroup属性を追加した記述例を示す図である。 運用例1を説明するための図である。 運用例2を説明するための図である。 運用例3を説明するための図である。 EssentialProperty要素とその属性の関係を示す図である。 EssentialProperty要素とその属性の記述例を示す図である。 レベル2のレイヤにおけるEssentialProperty要素とその属性による複数のAdaptationSet要素の関連付けの例を示す図である。 AdaptationSet要素のgroup属性の記述例を示す図である。 レベル1のレイヤにおけるAdaptationSet要素のgroup属性による複数のAdaptationSet要素のグルーピングの例を示す図である。 運用例4を説明するための図である。 運用例5を説明するための図である。 運用例6を説明するための図である。 放送通信システムの構成例を示す図である。 送信側の装置の構成例を示す図である。 受信側の装置の構成例を示す図である。 マルチキャスト配信時の各装置における具体的な処理の流れを説明するフローチャートである。 ユニキャスト配信時の各装置における具体的な処理の流れを説明するフローチャートである。 コンピュータの構成例を示す図である。
以下、図面を参照しながら本技術の実施の形態について説明する。なお、説明は以下の順序で行うものとする。
1.MPDの構造
2.コンポーネントレイヤ構造
3.第1の実施の形態
(1)各レベルのレイヤの機能の実現方法
(1−1)レベル3のレイヤの機能
(1−2)レベル2のレイヤの機能
(1−3)レベル1のレイヤの機能
(2)具体的な運用例
(2−1)運用例1:オーディオのミキシング再生
(2−2)運用例2:オーディオのグループ選択
(2−3)運用例3:ビデオとオーディオの再生
4.第2の実施の形態
(1)各レベルのレイヤの機能の実現方法
(1−1)レベル3のレイヤの機能
(1−2)レベル2のレイヤの機能
(1−3)レベル1のレイヤの機能
(2)具体的な運用例
(2−1)運用例4:オーディオのミキシング再生
(2−2)運用例5:オーディオのグループ選択
5.第3の実施の形態
(1)Subset要素の他の使用例
(2)運用例6:コンポーネントの同時提示のためのグルーピング
6.システム構成
7.各装置における具体的な処理の流れ
8.コンピュータの構成
<1.MPDの構造>
(MPDの構造)
図1は、MPD(Media Presentation Description)の構造を示す図である。なお、MPDファイルは、図2の記述例で示すように、例えばXML(Extensible Markup Language)等のマークアップ言語による階層構造で記述される。
ここで、図1に示すように、MPDは、Period要素、AdaptationSet要素、Representation要素、及び、SubRepresentation要素が階層構造で記述されている。Period要素は、番組等のコンテンツの構成を記述する単位となる。また、AdaptationSet要素、Representation要素、又は、SubRepresentation要素は、ビデオやオーディオ、字幕等のそれぞれのストリームごとに利用され、ぞれぞれのストリームの属性を記述できるようになっている。
具体的には、AdaptationSet要素は、各種のソースからエンコードされたストリームを表している。そして、当該ストリームを、例えばビットレート等のパラメトリックに応じて、受信機側で選択させるために、AdaptationSet要素内に、Representation要素を配置して、例えばビットレート等のパラメータが異なる複数の選択肢となるストリームを列挙している。通常、AdaptationSet要素やRepresentation要素は、ビデオやオーディオ、字幕のストリームなど、単一のストリームに対応させている。
また、AdaptationSet要素が、ビデオストリームやオーディオストリーム、字幕ストリームなどの複数のストリームが多重化されたストリームを表現する場合、AdaptationSet要素内に、Representation要素を配置して、例えばビットレート等のパラメータが異なる複数の選択肢となる多重化されたストリームを列挙する。すなわち、図3に示すように、時間間隔を表すPeriod要素ごとに、多重化されたストリームを表す複数のAdaptationSet要素が配置され、それらのAdaptationSet要素内に配置された複数のRepresentation要素により、例えばビットレートが異なる多重化されたストリームを複数列挙することができる。
また、この場合においては、Representation要素の配下にさらにSubRepresentation要素を配置することで、多重化されたストリームを構成する各コンポーネントのストリームの属性を記述することもできる。すなわち、図4に示すように、時間間隔を表すPeriod要素ごとに、多重化されたストリームを表す複数のAdaptationSet要素が配置され、それらのAdaptationSet要素内に、例えばビットレートが異なる多重化されたストリームを表す複数のRepresentation要素が配置され、さらに、それらのRepresentation要素内に配置されたSubRepresentation要素により、例えば、ビデオストリームやオーディオストリーム、字幕ストリームの属性を記述することができる。
なお、AdaptationSet要素は、ビデオストリームやオーディオストリーム等の単一のストリームの他、複数のストリームが多重化されたストリームに対応している。MPEG-DASHの規格においては、このようなAdaptationSet要素に含めることが可能な属性や要素として、図5の属性や要素が既に規定されている。また、Representation要素は、その上位要素(親要素)となるAdaptationSet要素の範囲内で、例えばビットレート等のパラメータが異なる複数の選択肢となるストリームを列挙している。MPEG-DASHの規格においては、このようなRepresentation要素に含めることが可能な属性や要素として、図6の属性や要素が既に規定されている。
<2.コンポーネントレイヤ構造>
ところで、放送サービスにおける要件として、コンポーネントの選択と構造化の要件がある。ここで、コンポーネントの選択とは、受信機の対応しているコーデックの能力やネットワーク環境などの各種の条件に応じて、最適なコンポーネントを選択することをいう。また、ストリームコンポーネントの構造化とは、複数のストリームコンポーネントを組み合わせて同時に表示することなどをいう。このようなコンポーネントの選択と構造化の要件を満たすために、図7に示すように、コンポーネントを複数のレイヤ構造で表現するようにする。
図7においては、コンポーネントのレイヤは、レベル1のレイヤ、レベル2のレイヤ、及び、レベル3の3つのレイヤからなる。また、図7において、エレメンタリコンポーネント(Elementary Component)は、ビデオやオーディオ、字幕等のコンポーネントそのものを表している。
レベル3のレイヤは、図中の「Level3」に対応し、n個(nは0以上の整数)のエレメンタリコンポーネントの中から1つのコンポーネントを選択するレイヤである。したがって、レベル3のレイヤは、ピックワンコンポーネント(PickOneComponent)のレイヤであると言える。
図7において、エレメンタリコンポーネントとピックワンコンポーネントの関係は、「1」で表されている。なお、レベル3のレイヤは、アダプティブレイヤ(Adaptive Layer)と称される場合がある。
レベル2のレイヤは、図中の「Level2」に対応し、レベル3のレイヤで選択されたn個(nは0以上の整数)のコンポーネント、又は、n個(nは0以上の整数)のエレメンタリコンポーネントを、複数組み合わせて同時に表示させるためにグルーピング(構造化)するレイヤである。グルーピングされた複数のコンポーネントは、まとめて1つのコンポーネントとみなされる。したがって、レベル2のレイヤは、コンポジットコンポーネント(Composite Component)のレイヤであると言える。
図7において、エレメンタリコンポーネントとコンポジットコンポーネントの関係は、「2」で表されている。また、レベル3のピックワンコンポーネントとコンポジットコンポーネントの関係は、「3」で表されている。なお、レベル2のレイヤは、コンポジットレイヤ(Composite Layer)と称される場合がある。
レベル1のレイヤは、図中の「Level1」に対応し、レベル2のレイヤでグルーピングされたn個(nは0以上の整数)のコンポーネント、レベル3のレイヤで選択されたn個(nは0以上の整数)のコンポーネント、又は、n個(nは0以上の整数)のエレメンタリコンポーネントの中から1つのコンポーネントを選択するレイヤである。したがって、レベル1のレイヤは、ピックワンコンポーネント(PickOneComponent)のレイヤであると言える。
図7において、レベル3のピックワンコンポーネントとレベル1のピックワンコンポーネントの関係は、「4」で表されている。また、エレメンタリコンポーネントとレベル1のピックワンコンポーネントの関係は、「5」で表されている。さらに、コンポジットコンポーネントとレベル1のピックワンコンポーネントの関係は、「5」で表されている。なお、レベル1のレイヤは、セレクティブレイヤ(Selective Layer)と称される場合がある。
以上のようにして、コンポーネントを複数のレイヤ構造で表現することで、例えば、レベル1のレイヤとレベル3のレイヤによってコンポーネントの選択の要件を満たされるとともに、レベル2のレイヤによってコンポーネントの構造化の要件が満たされることになる。以下、MPEG-DASH方式を利用して放送サービスを提供する場合において、図7のコンポーネントレイヤ構造を実現するための具体的な方法について、3つの実施の形態で説明する。
<3.第1の実施の形態>
(1)各レベルのレイヤの機能の実現方法
第1の実施の形態においては、MPEG-DASH方式を利用して放送サービスを提供する場合において、図7のコンポーネントレイヤ構造のサービス要件を満たすために、既にMPDの標準仕様で定義されている要素を利用することができる。以下、第1の実施の形態における各レベルのレイヤの機能の実現方法について説明する。
(1−1)レベル3のレイヤの機能
図7のレベル3のレイヤの機能は、ピックワンコンポーネント(PickOneComponent)を、MPDのAdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素又はSubRepresentation要素を、エレメンタリコンポーネント(Elementary Component)にマッピングすることで実現することができる。
(1−2)レベル2のレイヤの機能
図7のレベル2のレイヤの機能は、MPDのSubset要素にマッピングすることで実現することができる。ここで、図8に示すように、MPDにおいて、Subset要素は、Period要素に複数含めることができる。Subset要素は、アクティブなAdaptationSet要素の組を指定するものである。ここで、アクティブなAdaptationSet要素とは、その配下に含まれるRepresentation要素に列挙されたコンポーネントのうち、最低1つのコンポーネントが再生されている状態のAdaptationSet要素と定義される。また、AdaptationSet要素の組とは、同時に再生されるコンポーネントの組や集合を意味する。
Subset要素で、AdaptationSet要素の集合を指定するには、Subset要素のcontains属性に、AdaptationSet要素のid属性の値をリストとして格納することになる。図9には、Subset要素とcontains属性の記述例が示されている。図9のMPDにおいては、Period要素の下位要素として、5つのAdaptationSet要素(id='1','12','65','74','385')と、2つのSubset要素が記述されている。
図9において、一方のSubset要素のcontains属性には'1 65'が指定されており、id='1'のAdaptationSet要素と、id='65'のAdaptationSet要素は、同時に再生されるAdaptationSet要素の集合であることを示している。また、図9において、他方のSubset要素のcontains属性には'12 74 385'が指定されており、id='12'のAdaptationSet要素と、id='74'のAdaptationSet要素と、id='385'のAdaptationSet要素は、同時に再生されるAdaptationSet要素の集合であることを示している。
このように、Subset要素のcontains属性によって、複数のAdaptationSet要素の関連付けが行われることで、レベル2のレイヤの機能を実現することができる。図10には、レベル2のレイヤにおける、Subset要素のcontains属性による複数のAdaptationSet要素の関連付けの例を示している。
図10において、レベル2のコンポジットコンポーネント(Composite Component)のレイヤでは、レベル3のピックワンコンポーネント(PickOneComponent)のレイヤで、複数のエレメンタリコンポーネント(Elementary Component)の中から選択されたコンポーネントと、エレメンタリコンポーネント(Elementary Component)とがグルーピングされることを想定している。
このレベル2のレイヤのグルーピングを実現するために、コンポジットコンポーネントのレイヤが、MPDのSubset要素とマッピングされるようにする。ここでは、Subset要素のcontains属性によって、同時に再生されるコンポーネントの集合としてAdaptationSet要素の組が指定されるようにする。
図10の例では、一方のAdaptationSet要素の配下には、複数のRepresentation要素が配置され、複数のRepresentation要素に対応して、複数のコンポーネントが列挙されている。そして、当該AdaptationSet要素がレベル3のピックワンコンポーネントとマッピングされ、さらに、当該Representation要素がエレメンタリコンポーネントにマッピングされているため、図中の「1」で表しているエレメンタリコンポーネントとレベル3のピックワンコンポーネントの関係は、エレメンタリコンポーネントに対応するRepresentation要素と、レベル3のピックワンコンポーネントに対応するAdaptationSet要素によって表すことができる。
また、図中の「3」で表しているレベル3のピックワンコンポーネントとコンポジットコンポーネントの関係は、コンポジットコンポーネントに対応するSubset要素のcontains属性と、レベル3のピックワンコンポーネントに対応するAdaptationSet要素の関係により表すことができる。
他方のAdaptationSet要素の配下には、1つのRepresentation要素のみが配置され、それに対応して、1つのコンポーネントが配置されている。この場合において、図中の「2」で表しているエレメンタリコンポーネントとコンポジットコンポーネントの関係は、コンポジットコンポーネントに対応するSubset要素のcontains属性と、エレメンタリコンポーネントに対応するAdaptationSet要素の関係により表すことができる。
すなわち、MPDのSubset要素のcontains属性には、一方のAdaptationSet要素のid属性の値と、他方のAdaptationSet要素のid属性の値が指定されているので、それらのAdaptationSet要素の配下のRepresentation要素に列挙されたコンポーネントが同時に再生されることになる。これにより、コンポジットコンポーネントのレイヤにおいて、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネントと、エレメンタリコンポーネントとがグルーピングされるので、レベル2のレイヤの機能が実現されることになる。
(1−3)レベル1のレイヤの機能
図7のレベル1のレイヤの機能の一部は、MPDのAdaptationSet要素のgroup属性にマッピングすることで実現することができる。AdaptationSet要素のgroup属性は、AdaptationSet要素をグルーピングするためのもので、同一の属性値を持つAdaptationSet要素は、同一のグループに属することになる。そして、同一のグループ内の複数のAdaptationSet要素の中から、1つのAdaptationSet要素が選択されることになる。
図11には、AdaptationSet要素のgroup属性の記述例が示されている。図11のMPDにおいては、Period要素の下位要素として、5つのAdaptationSet要素(id='1','12','65','74','385')が記述されている。
図11において、5つのAdaptationSet要素のgroup属性としては、group='1'とgroup='2'のいずれかの属性値が指定されている。すなわち、group='1'が指定されている、id='1'のAdaptationSet要素と、id='65'のAdaptationSet要素は、同一の属性値を持っているので、いずれか一方のAdaptationSet要素の配下のRepresentation要素に列挙されたコンポーネントが再生されることになる。
また、group='2'が指定されている、id='12'のAdaptationSet要素と、id='74'のAdaptationSet要素と、id='385'のAdaptationSet要素は、同一の属性値を持っているので、それらのAdaptationSet要素の配下のRepresentation要素に列挙されたコンポーネントのうち1つだけが再生されることになる。
このように、AdaptationSet要素のgroup属性によって、複数のAdaptationSet要素をグルーピングすることで、レベル1のレイヤの機能を実現することができる。図12には、レベル1のレイヤにおける、AdaptationSet要素のgroup属性による複数のAdaptationSet要素のグルーピングの例を示している。
図12において、レベル1のピックワンコンポーネント(PickOneComponent)のレイヤでは、レベル2のコンポジットコンポーネント(Composite Component)のレイヤでグルーピングされたコンポーネント、レベル3のピックワンコンポーネント(PickOneComponent)のレイヤで、複数のエレメンタリコンポーネント(Elementary Component)の中から選択されたコンポーネント、又は、エレメンタリコンポーネントの中から1つのコンポーネントが選択されることを想定している。
このレベル1のレイヤのグルーピングを実現するために、レベル1のピックワンコンポーネントのレイヤがMPDのAdaptationSet要素のgroup属性とマッピングされるようにする。ここでは、AdaptationSet要素のgroup属性によって、同一のグループに属するAdaptationSet要素には、同一のgroup属性の属性値が指定されるようにして、グループが共有されるようにする。
図12においては、図10と同様に、Subset要素のcontains属性によって、複数のAdaptationSet要素の関連付けが行われており、それによりレベル2のレイヤの機能が実現されている。すなわち、MPDのSubset要素のcontains属性には、一方のAdaptationSet要素のid属性の値と、他方のAdaptationSet要素のid属性の値が指定されているので、それらのAdaptationSet要素の配下のRepresentation要素に列挙されたコンポーネントが同時に再生されることになる。これにより、コンポジットコンポーネントのレイヤにおいて、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネントと、エレメンタリコンポーネントとがグルーピングされるので、レベル2のレイヤの機能が実現されることになる。
また、図12の例では、Subset要素のcontains属性によって関連付けられたAdaptationSet要素以外に、2つのAdaptationSet要素が配置されている。この2つのAdaptationSet要素のうち、一方のAdaptationSet要素の配下には、複数のRepresentation要素が配置され、複数のRepresentation要素に対応して、複数のコンポーネントが列挙されている。そして、当該AdaptationSet要素がレベル3のピックワンコンポーネントとマッピングされ、配下のRepresentation要素がエレメンタリコンポーネントにマッピングされている。また、図中の「4」で表しているレベル3のピックワンコンポーネントとレベル1のピックワンコンポーネントとの関係は、AdaptationSet要素のgroup属性により実現される。
さらに、図12の例では、Subset要素のcontains属性によって関連付けられたAdaptationSet要素以外の2つのAdaptationSet要素のうち、他方のAdaptationSet要素の配下には、1つのRepresentation要素のみが配置され、それに対応して、1つのコンポーネントが配置されている。そして、当該AdaptationSet要素とその配下のRepresentation要素がエレメンタリコンポーネントにマッピングされている。また、図中の実線の「5」で表しているエレメンタリコンポーネントとレベル1のピックワンコンポーネントとの関係は、AdaptationSet要素のgroup属性により実現される。
すなわち、MPDのAdaptationSet要素のgroup属性によって、Subset要素のcontains属性によって関連付けられたAdaptationSet要素以外の2つのAdaptationSet要素をグルーピングすることはできるので、それらのAdaptationSet要素の配下のRepresentation要素に列挙されたコンポーネントの中から1つのコンポーネントが選択されるようになる。これにより、レベル1のピックワンコンポーネントのレイヤにおいて、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネントと、エレメンタリコンポーネントとがグルーピングされることになる。
しかしながら、MPDのAdaptationSet要素のgroup属性によっては、Subset要素のcontains属性によって関連付けられたAdaptationSet要素をグルーピングすることはできない。すなわち、図中の点線の「5」で表しているレベル2のコンポジットコンポーネントと、レベル1のピックワンコンポーネントとの関係は、レベル1のピックワンコンポーネントのレイヤに対応するAdaptationSet要素のgroup属性を利用しても関連付けを行うことができない。
(MPDの拡張)
このように、現在のMPDの標準仕様では、レベル1のピックワンコンポーネントに対応するAdaptationSet要素のgroup属性により指定されるグループに属するレベル2のコンポジットコンポーネントに対応するSubset要素との関連付けを行うことができない。そこで、このようなgroup属性の値と、Subset要素との関連付けを行うことが可能となるように、MPDの拡張を行い、レベル1のレイヤの機能が完全に実現されるようにする。
具体的には、MPDの拡張を行って、Subset要素にgroup属性が新たに追加されるようにする。図13には、Subset要素にgroup属性を追加した記述例が示されている。図13の拡張されたMPDにおいては、Period要素の下位要素として、6つのAdaptationSet要素(id='1','10','12','65','74','385')と、3つのSubset要素が記述されている。
図13において、1つ目のSubset要素のcontains属性には'1 10'が指定されており、id='1'のAdaptationSet要素と、id='10'のAdaptationSet要素は、同時に再生されるAdaptationSet要素の集合であることを示している。また、1つ目のSubset要素のgroup属性には'1'が指定されており、id='1'のAdaptationSet要素と、id='10'のAdaptationSet要素の組がグループ1に属していることを示している。
また、2つ目のSubset要素のcontains属性には'12 74'が指定されており、id='12'のAdaptationSet要素と、id='74'のAdaptationSet要素は、同時に再生されるAdaptationSet要素の集合であることを示している。また、2つ目のSubset要素のgroup属性には'2'が指定されており、id='12'のAdaptationSet要素と、id='74'のAdaptationSet要素の組がグループ2に属していることを示している。
また、3つ目のSubset要素のcontains属性には'65 385'が指定されており、id='65'のAdaptationSet要素と、id='385'のAdaptationSet要素は、同時に再生されるAdaptationSet要素の集合であることを示している。また、3つ目のSubset要素のgroup属性には'2'が指定されており、id='65'のAdaptationSet要素と、id='385'のAdaptationSet要素の組がグループ2に属していることを示している。
すなわち、図13の例においては、2つ目のSubset要素と3つ目のSubset要素は、同一のgroup属性値である'2'を持っているので、2つ目のSubset要素のcontains属性により指定されるid='12'のAdaptationSet要素とid='74'のAdaptationSet要素の組か、あるいは、3つ目のSubset要素のcontains属性により指定されるid='65'のAdaptationSet要素とid='385'のAdaptationSet要素の組のいずれかが選択されることになる。
このように、Subset要素にgroup属性を追加するMPDの拡張を行うことで、図12の点線の「5」で表しているレベル2のコンポジットコンポーネントと、レベル1のピックワンコンポーネントとの関係についても実現することができるようになる。その結果、図12において、点線の「5」で表しているレベル2のコンポジットコンポーネントと、レベル1のピックワンコンポーネントとの関係、「4」で表しているレベル3のピックワンコンポーネントとレベル1のピックワンコンポーネントとの関係、及び、図中の実線の「5」で表しているエレメンタリコンポーネントとレベル1のピックワンコンポーネントとの関係のすべてが満たされるので、レベル1のレイヤの機能が実現されることになる。
(2)具体的な運用例
次に、図14乃至図16を参照して、第1の実施の形態についての具体的な運用例について説明する。
(2−1)運用例1
図14は、オーディオストリームのミキシング再生を行う運用例1を説明するための図である。図14においては、当該運用例1を実現するためのMPDの記述内容が示されており、「AS」はAdaptationSet要素、「R」はRepresentation要素、「SS」はSubset要素をそれぞれ表している。また、図中の「@」は属性を意味し、「@id」は、AdaptationSet要素のid属性、「@contains」は、Subset要素のcontains属性を表している。さらに、Representation要素の「A」はオーディオコンポーネントを表している。なお、これらの略語の関係は後述する他の図でも同様とされる。
図14のMPDにおいては、単一のオーディオストリームに対応した3つのAdaptationSet要素(id='11','12','13')が記述され、それらのAdaptationSet要素の配下に1又は複数のRepresentation要素が記述されている。
id='11'のAdaptationSet要素の配下には、2つのRepresentation要素が記述されている。このRepresentation要素によって、上位要素となるid='11'のAdaptationSet要素の範囲内で、ビットレートの異なるオーディオコンポーネントとして、ダイアログ(Dlg:Dialog)が列挙されている。この例では、高ビットレートのダイアログと、低ビットレートのダイアログが列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
id='12'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述されている。このRepresentation要素によって、オーディオコンポーネントとして、エフェクト(Efct:Effect)が列挙されている。したがって、1つのオーディオコンポーネントが常に選択されることになる。なお、このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
id='13'のAdaptationSet要素の配下には、2つのRepresentation要素が記述されている。このRepresentation要素によって、上位要素となるid='13'のAdaptationSet要素の範囲内で、ビットレートの異なるオーディオコンポーネントとして、ミュージック(Music)が列挙されている。この例では、高ビットレートのミュージックと、低ビットレートのミュージックが列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件に応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
このように、図14のMPDにおいては、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、オーディオコンポーネントの選択が行われる。
また、図14のMPDにおいて、Subset要素のcontains属性には、'11 12 13'が指定されており、id='11'のAdaptationSet要素と、id='12'のAdaptationSet要素と、id='13'のAdaptationSet要素は、ミキシングされるAdaptationSet要素の集合であることを示している。このように、Subset要素のcontains属性によって、複数のAdaptationSet要素の関連付けが行われることで、図7のコンポーネントレイヤ構造におけるレベル2のレイヤの機能が実現され、当該レベル2(コンポジットコンポーネント)のレイヤにおいて、オーディオコンポーネントのミキシングが行われることになる。
以上、図14の運用例1においては、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで実現される。また、レベル2のレイヤの機能が、Subset要素のcontains属性によって、複数のAdaptationSet要素の関連付けが行われることで実現される。このようにして、レベル2のレイヤとレベル3のレイヤの機能が実現されることで、オーディオストリームのミキシング再生が行われる。
(2−2)運用例2
図15は、オーディオストリームのグループ選択を行う運用例2を説明するための図である。図15においては、当該運用例2を実現するためのMPDの記述内容が示されており、図14と同様に、「AS」、「R」、「SS」は、AdaptationSet要素、Representation要素、Subset要素をそれぞれ表している。また、AdaptationSet要素には、id属性のほか、「@gid」で示したgroup属性が記述され、Subset要素には、contains属性のほか、「@gid」で示したgroup属性が記述されている。なお、これらの略語の関係は後述する他の図でも同様とされる。
図15のMPDにおいては、単一のオーディオストリームに対応した4つのAdaptationSet要素(id='11','21','22','23')が記述され、それらのAdaptationSet要素の配下に1又は複数のRepresentation要素が記述されている。
id='11'のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのステレオ(Stereo)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
このように、ピックワンコンポーネントを、AdaptationSet要素にマッピングすることで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、オーディオコンポーネントの選択が行われる。なお、ここでは、オーディオコンポーネントのミキシングなどのグルーピングは行われないため、レベル2の機能を実現するための記述はなされていない。
id='21'のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのミュージック(Music)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
id='22'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、オーディオコンポーネントとして、ダイアログ(Dlg:Dialog)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
id='23'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、オーディオコンポーネントとして、エフェクト(Efct:Effect)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
このように、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、オーディオコンポーネントの選択が行われる。
また、図15のMPDにおいて、Subset要素のcontains属性には、'21 22 23'が指定されており、id='21'のAdaptationSet要素と、id='22'のAdaptationSet要素と、id='23'のAdaptationSet要素は、ミキシングされるAdaptationSet要素の集合であることを示している。このように、Subset要素のcontains属性によって、複数のAdaptationSet要素の関連付けが行われることで、図7のコンポーネントレイヤ構造におけるレベル2のレイヤの機能が実現され、当該レベル2(コンポジットコンポーネント)のレイヤにおいて、オーディオコンポーネントのミキシングが行われることになる。
ここで、図15のMPDにおいては、id='11'のAdaptationSet要素には、group属性として、group='1'が指定されている。また、Subset要素には、group属性として、group='1'が指定されている。したがって、id='11'のAdaptationSet要素と、Subset要素により指定されるid='21'のAdaptationSet要素、id='22'のAdaptationSet要素、及び、id='23'のAdaptationSet要素は、同一のグループ1に属していることになる。
このように、group属性によって、グルーピングを行うことで、図7のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のオーディオコンポーネントの中から1つのオーディオコンポーネントが選択されることになる。ここでは、グループ1に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたオーディオコンポーネント(ステレオ)と、レベル2(コンポジットコンポーネント)のレイヤでミキシングされたオーディオコンポーネント(ミュージック、ダイアログ、エフェクト)のうち、いずれか一方のオーディオコンポーネントが選択される。
以上、図15の運用例2においては、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで実現される。また、レベル2のレイヤの機能が、Subset要素のcontains属性によって、複数のAdaptationSet要素の関連付けが行われることで実現される。さらにまた、レベル1のレイヤの機能が、AdaptationSet要素とSubset要素のgroup属性によって、複数のAdaptationSet要素をグルーピングすることで実現される。このようにして、レベル1、レベル2、及び、レベル3のレイヤの機能が実現されることで、オーディオコンポーネントのグループ選択が行われ、オーディオコンポーネントが再生される。
(2−3)運用例3
図16は、ビデオコンポーネントとオーディオコンポーネントの再生を行う運用例3を説明するための図である。図16においては、当該運用例3を実現するためのMPDの記述内容が示されており、図14と図15と同様に、「AS」と「R」は、AdaptationSet要素とRepresentation要素をそれぞれ表している。また、図15と同様に、AdaptationSet要素には、「@id」で示したid属性と、「@gid」で示したgroup属性が記述されている。さらに、Representation要素の「V」はビデオコンポーネントを表している。
図16のMPDにおいては、ビデオのグループ1に属する4つのAdaptationSet要素(id='11','12','13','14')と、オーディオのグループ2に属する4つのAdaptationSet要素(id='21','22','23','24')が記述され、それらのAdaptationSet要素の配下にそれぞれ、1又は複数のRepresentation要素が記述されている。
ビデオのグループ1において、各Representation要素には、ビデオコンポーネントとして、「base」、「ext」、「SV1」、及び、「SV2」が列挙されている。ここで、「base」は、単独で再生可能な基本の映像信号に相当するビデオコンポーネントを表し、「ext」は、拡張用の映像信号に相当するビデオコンポーネントを表している。また、「SV1」と「SV2」において、「SV」はSub Viewの略であって、主の表示領域であるメインビューに対する補助的な領域となるサブビューを表している。
id='11'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、単独で再生可能な基本の映像信号に相当する1つのビデオコンポーネントが常に選択されることになる。このようにして選択されるビデオコンポーネントは、エレメンタリコンポーネントに相当している。なお、当該ビデオコンポーネントは、メインビュー用とされている。
id='12'のAdaptationSet要素の配下には、4つのRepresentation要素が記述され、基本の映像信号に相当するビデオコンポーネントが1つ列挙されているほか、拡張用の映像信号に相当するビデオコンポーネントが3つ列挙され、さらに、Representation要素によって、基本の映像信号に相当するビデオコンポーネントが、拡張用の映像信号に相当するビデオコンポーネントを参照する関係が示されている。したがって、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、基本の映像信号と拡張用の映像信号に相当するビデオコンポーネントが選択されることになる。なお、当該ビデオコンポーネントは、メインビュー用とされている。
id='13'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、サブビュー1用の1つのビデオコンポーネントが常に選択されることになる。このようにして選択されるビデオコンポーネントは、エレメンタリコンポーネントに相当している。
id='14'のAdaptationSet要素の配下には、3つのRepresentation要素が記述され、サブビュー2用のビデオコンポーネントが3つ列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えば、ネットワーク環境条件などに応じて、適応的に1つのビデオコンポーネントが選択されることになる。
このように、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、ビデオコンポーネントの選択が行われる。
ここで、図16のMPDにおいては、id='11'のAdaptationSet要素、id='12'のAdaptationSet要素、id='13'のAdaptationSet要素、及び、id='14'のAdaptationSet要素には、group属性として、group='1'が指定されており、それらのAdaptationSet要素は、同一のグループ1に属していることになる。
このように、group属性によって、グルーピングを行うことで、図7のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のビデオコンポーネントの中から1つのビデオコンポーネントが選択されることになる。ここでは、グループ1に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたビデオコンポーネントとエレメンタリコンポーネントの中から、1つのビデオコンポーネントが選択される。
一方、オーディオのグループ2において、各Representation要素には、オーディオコンポーネントとして、「NrRbst」、「HiRbst」、「MCD」、「SV1」、及び、「SV2」が列挙されている。「NrRbst」と「HiRbst」は、ロバスト性を有するオーディオコンポーネントを表している。つまり、「NrRbst」は、Normal Robustnessの略であって、通常のロバスト性を有するオーディオコンポーネントを意味する。また、「HiRbst」は、High Robustnessの略であって、高いロバスト性を有するオーディオコンポーネントを意味する。
また、「MCD」は、Multi-channel Devの略であって、マルチチャンネルのオーディオコンポーネントを表している。さらに、「SV1」と「SV2」において、「SV」はSub Viewの略であって、サブビュー用のオーディオコンポーネントを表している。
id='21'のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、通常のロバスト性を有するオーディオコンポーネントと、高いロバスト性を有するオーディオコンポーネントが列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。なお、当該オーディオコンポーネントは、メインビュー用とされている。
id='22'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、マルチチャンネルの1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。なお、当該オーディオコンポーネントは、メインビュー用とされている。
id='23'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、サブビュー1用の1つのオーディオコンポーネントが常に選択されることになる。同様にid='24'のAdaptationSet要素の配下には、サブビュー2用の1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるサブビュー用のオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
ここで、図16のMPDにおいては、id='21'のAdaptationSet要素、id='22'のAdaptationSet要素、id='23'のAdaptationSet要素、及び、id='24'のAdaptationSet要素には、group属性として、group='2'が指定されており、それらのAdaptationSet要素は、同一のグループ2に属していることになる。
このように、group属性によって、グルーピングを行うことで、図7のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のオーディオコンポーネントの中から1つのオーディオコンポーネントが選択されることになる。ここでは、グループ2に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたオーディオコンポーネントとエレメンタリコンポーネントの中から、1つのオーディオコンポーネントが選択される。
以上、図16の運用例3においては、ビデオとオーディオのそれぞれについて、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで実現される。また、ビデオとオーディオのそれぞれについて、レベル1のレイヤの機能が、AdaptationSet要素のgroup属性によって、複数のAdaptationSet要素をグルーピングすることで実現される。このようにして、レベル1及びレベル3のレイヤの機能が実現されることで、ビデオコンポーネントとオーディオコンポーネントと選択が行われ、ビデオコンポーネントとオーディオコンポーネントがそれぞれ再生される。
<4.第2の実施の形態>
(1)各レベルのレイヤの機能の実現方法
第2の実施の形態においても、MPEG-DASH方式を利用して放送サービスを提供する場合において、図7のコンポーネントレイヤ構造のサービス要件を満たすために、既にMPDの標準仕様で定義されている要素を利用することができる。以下、第2の実施の形態における各レベルのレイヤの機能の実現方法について説明する。
(1−1)レベル3のレイヤの機能
図7のレベル3のレイヤの機能は、ピックワンコンポーネント(PickOneComponent)を、MPDのAdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素又はSubRepresentation要素を、エレメンタリコンポーネント(Elementary Component)にマッピングすることで実現することができる。
(1−2)レベル2のレイヤの機能
図7のレベル2のレイヤの機能は、MPDのAdaptationSet要素の間の関係、Representation要素の間の関係、又は、SubRepresentation要素の間の関係を定義する依存関係記述属性にマッピングすることで実現することができる。
この依存関係記述属性としては、MPDで規定されているAdaptationSet要素の下位要素となるEssentialProperty要素(図5)やSupplementalProperty要素(図5)を利用して、新たな要素を定義して、AdaptationSet属性群をグルーピングできるようにする。例えば、オーディオストリームのミキシング再生などのように、同時に再生する必要があるオーディオコンポーネントのAdaptationSet属性群や、Base-Enhance関係になるビデオコンポーネントのAdaptationSet属性群などをグルーピングできるようにする。
ここでは、依存関係記述属性として、EssentialProperty要素を利用した場合を一例に説明する。図17に示すように、EssentialProperty要素は、schemeIdUri属性とそのschemeIdUri属性の値(URI:Uniform Resource Identifier)により特定されるフォーマットに則して値が決定されるvalue属性からなる。なお、value属性はオプショナルな属性とされる。
例えば、名前空間オーソリティとして、「urn:ATSC」を定義して、そのオーソリティが規定する「urn:ATSC:mixingGroup」というUri属性値を定義する。これにより、このUri属性値をschemeIdUri属性の値として持っているEssentialProperty要素を有するオーディオコンポーネントのAdaptationSet属性群は、ミキシングされて出力されることを意味するように定義することができる。
このとき、value属性に、例えば、当該オーディオコンポーネントがミキシングされるべきオーディオコンポーネント群のグループを識別するための値や、当該オーディオコンポーネントのミキシングされた後の全体音量に対する相対音量などを定義することができる。例えば、全体音量に対する相対音量としては、全体音量を1としたときの0〜1の範囲内の小数値が指定される。
図18には、EssentialProperty要素と、schemeIdUri属性及びvalue属性の記述例が示されている。図18のMPDにおいては、Period要素の下位要素として、2つのAdaptationSet要素(id='1','2')が記述されている。
図18において、id='1'のAdaptationSet要素の配下のEssentialProperty要素には、schemeIdUri属性の値として「urn:ATSC:mixingGroup」が指定され、value属性の値として"23, 0.37"が指定されている。すなわち、id='1'のAdaptationSet要素は、"23"であるグループIDが指定されたミキシングのグループに属し、さらに、"0.37"である相対音量が指定されている。
また、図18において、id='2'のAdaptationSet要素の配下のEssentialProperty要素には、schemeIdUri属性の値として「urn:ATSC:mixingGroup」が指定され、value属性の値として"23, 0.25"が指定されている。すなわち、id='2'のAdaptationSet要素は、"23"であるグループIDが指定されたミキシングのグループに属し、さらに"0.25"である相対音量が指定されている。
これにより、"23"であるミキシングのグループに属するid='1'のAdaptationSet要素に対応するオーディオコンポーネントと、id='2'のAdaptationSet要素に対応するオーディオコンポーネントとがミキシングされて再生されることになる。また、ミキシング再生に際し、id='1'のAdaptationSet要素に対応するオーディオコンポーネントの相対音量は、"0.37"となり、id='2'のAdaptationSet要素に対応するオーディオコンポーネントの相対音量は、"0.25"となる。
このように、EssentialProperty要素と、schemeIdUri属性及びvalue属性によって、複数のAdaptationSet要素をグルーピングすることで、レベル2のレイヤの機能を実現することができる。図19には、レベル2のレイヤにおける、EssentialProperty要素と、schemeIdUri属性及びvalue属性による複数のAdaptationSet要素のグルーピングの例を示している。
図19において、レベル2のコンポジットコンポーネント(Composite Component)のレイヤでは、レベル3のピックワンコンポーネント(PickOneComponent)のレイヤで、複数のエレメンタリコンポーネント(Elementary Component)の中から選択されたコンポーネントと、エレメンタリコンポーネント(Elementary Component)とがグルーピングされることを想定している。
このレベル2のレイヤのグルーピングを実現するために、コンポジットコンポーネントのレイヤが、MPDのAdaptationSet要素に配置されるEssentialProperty要素とマッピングされるようにする。ここでは、EssentialProperty要素のschemeIdUri属性及びvalue属性によって、同時に再生されるコンポーネントの集合としてAdaptationSet要素の組が指定されるようにする。
図19の例では、一方のAdaptationSet要素の配下には、複数のRepresentation要素が配置され、複数のRepresentation要素に対応して、複数のコンポーネントが列挙されている。そして、当該AdaptationSet要素がレベル3のピックワンコンポーネントとマッピングされ、さらに、当該Representation要素がエレメンタリコンポーネントにマッピングされているため、図中の「1」で表しているエレメンタリコンポーネントとレベル3のピックワンコンポーネントの関係は、エレメンタリコンポーネントに対応するRepresentation要素と、ピックワンコンポーネントに対応するAdaptationSet要素によって行うことが可能である。
また、図中の「3」で表しているレベル3のピックワンコンポーネントとコンポジットコンポーネントの関係は、コンポジットコンポーネントに対応するEssentialProperty要素のschemeIdUri属性及びvalue属性と、レベル3のピックワンコンポーネントに対応するAdaptationSet要素の関係により実現される。
他方のAdaptationSet要素の配下には、1つのRepresentation要素のみが配置され、それに対応して、1つのコンポーネントが配置されている。この場合において、図中の「2」で表しているエレメンタリコンポーネントとコンポジットコンポーネントの関係は、コンポジットコンポーネントに対応するEssentialProperty要素のschemeIdUri属性及びvalue属性と、エレメンタリコンポーネントに対応するAdaptationSet要素の関係により実現される。
すなわち、MPDのAdaptationSet要素に配置されるEssentialProperty要素のschemeIdUri属性に対して、例えば「urn:ATSC:mixingGroup」であるUri属性値が定義されている場合において、各AdaptationSet要素に、schemeIdUri属性の値として「urn:ATSC:mixingGroup」が指定され、value属性の値として同一のグループIDが指定されているときには、それらのAdaptationSet要素の配下のオーディオコンポーネントはミキシング再生されることになる。これにより、コンポジットコンポーネントのレイヤにおいて、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネントと、エレメンタリコンポーネントとがグルーピングされるので、レベル2のレイヤの機能が実現されることになる。
(1−3)レベル1のレイヤの機能
図7のレベル1のレイヤの機能は、MPDのAdaptationSet要素のgroup属性にマッピングすることで実現することができる。AdaptationSet要素のgroup属性は、AdaptationSet要素をグルーピングするためのもので、同一の属性値を持つAdaptationSet要素は、同一のグループに属することになる。そして、同一のグループ内の複数のAdaptationSet要素の中から、1つのAdaptationSet要素が選択されることになる。
図20には、AdaptationSet要素のgroup属性の記述例が示されている。図20のMPDにおいては、Period要素の下位要素として、5つのAdaptationSet要素(id='1','12','65','74','385')が記述されている。
図20において、5つのAdaptationSet要素のgroup属性としては、group='1'とgroup='2'のいずれかの属性値が指定されている。すなわち、group='1'が指定されている、id='1'のAdaptationSet要素と、id='65'のAdaptationSet要素は、同一の属性値を持っているので、いずれか一方のAdaptationSet要素の配下のRepresentation要素に列挙されたコンポーネントが再生されることになる。
また、group='2'が指定されている、id='12'のAdaptationSet要素と、id='74'のAdaptationSet要素と、id='385'のAdaptationSet要素は、同一の属性値を持っているので、それらのAdaptationSet要素の配下のRepresentation要素に列挙されたコンポーネントのうち1つだけが再生されることになる。
このように、AdaptationSet要素のgroup属性によって、複数のAdaptationSet要素をグルーピングすることで、レベル1のレイヤの機能を実現することができる。図21には、レベル1のレイヤにおける、AdaptationSet要素のgroup属性による複数のAdaptationSet要素のグルーピングの例を示している。
図21において、レベル1のピックワンコンポーネント(PickOneComponent)のレイヤでは、レベル2のコンポジットコンポーネント(Composite Component)のレイヤでグルーピングされたコンポーネント、レベル3のピックワンコンポーネント(PickOneComponent)のレイヤで、複数のエレメンタリコンポーネント(Elementary Component)の中から選択されたコンポーネント、又は、エレメンタリコンポーネントの中から1つのコンポーネントが選択されることを想定している。
このレベル1のレイヤのグルーピングを実現するために、レベル1のピックワンコンポーネントのレイヤがMPDのAdaptationSet要素のgroup属性とマッピングされるようにする。ここでは、AdaptationSet要素のgroup属性によって、同一のグループに属するAdaptationSet要素には、同一のgroup属性の属性値が指定されるようにして、グループが共有されるようにする。
図21においては、図19と同様に、EssentialProperty要素と、schemeIdUri属性及びvalue属性によって、複数のAdaptationSet要素の関連付けが行われており、それによりレベル2のレイヤの機能が実現されている。
すなわち、MPDのAdaptationSet要素に配置されるEssentialProperty要素のschemeIdUri属性に対して、例えば「urn:ATSC:mixingGroup」であるUri属性値が定義されている場合において、各AdaptationSet要素に、schemeIdUri属性の値として「urn:ATSC:mixingGroup」が指定され、value属性の値として同一のグループIDが指定されているときには、それらのAdaptationSet要素の配下のオーディオコンポーネントはミキシング再生されることになる。
これにより、図中の点線の「5」で表しているコンポジットコンポーネントのレイヤにおいて、レベル3のピックワンコンポーネントのレイヤで選択されたコンポーネントと、エレメンタリコンポーネントとがグルーピングされるので、レベル2のレイヤの機能が実現されることになる。また、図中の点線の「5」で表しているコンポジットコンポーネントとレベル1のピックワンコンポーネントとの関係は、AdaptationSet要素のgroup属性により実現される。
また、図21の例では、EssentialProperty要素のschemeIdUri属性及びvalue属性によって関連付けられたAdaptationSet要素以外に、2つのAdaptationSet要素が配置されている。この2つのAdaptationSet要素のうち、一方のAdaptationSet要素の配下には、複数のRepresentation要素が配置され、複数のRepresentation要素に対応して、複数のコンポーネントが列挙されている。そして、当該AdaptationSet要素がレベル3のピックワンコンポーネントとマッピングされ、配下のRepresentation要素がエレメンタリコンポーネントにマッピングされている。また、図中の「4」で表しているレベル3のピックワンコンポーネントとレベル1のピックワンコンポーネントとの関係は、AdaptationSet要素のgroup属性により実現される。
さらに、図21の例では、EssentialProperty要素のschemeIdUri属性及びvalue属性によって関連付けられたAdaptationSet要素以外の2つのAdaptationSet要素のうち、他方のAdaptationSet要素の配下には、1つのRepresentation要素のみが配置され、それに対応して、1つのコンポーネントが配置されている。そして、当該AdaptationSet要素とその配下のRepresentation要素がエレメンタリコンポーネントにマッピングされている。また、図中の実線の「5」で表しているエレメンタリコンポーネントとレベル1のピックワンコンポーネントとの関係は、AdaptationSet要素のgroup属性により実現される。
すなわち、第2の実施の形態では、第1の実施の形態と異なり、Subset要素のcontains属性を用いずに、AdaptationSet要素に配置されるEssentialProperty要素を用いて、レベル2のレイヤの機能を実現しているため、EssentialProperty要素のschemeIdUri属性及びvalue属性によって関連付けられたAdaptationSet要素についても、AdaptationSet要素のgroup属性によって、グルーピングすることができる。
つまり、第2の実施の形態においては、MPDの拡張を行うことなく、AdaptationSet要素のgroup属性によって、図21の点線の「5」で表しているレベル2のコンポジットコンポーネントと、レベル1のピックワンコンポーネントとの関係についても実現することができる。したがって、図21において、点線の「5」で表しているレベル2のコンポジットコンポーネントと、レベル1のピックワンコンポーネントとの関係、「4」で表しているレベル3のピックワンコンポーネントとレベル1のピックワンコンポーネントとの関係、及び、図中の実線の「5」で表しているエレメンタリコンポーネントとレベル1のピックワンコンポーネントとの関係のすべてが満たされるので、レベル1のレイヤの機能が実現されることになる。
なお、上述した説明では、依存関係記述属性として、EssentialProperty要素を利用した場合を説明したが、それに限らず、例えば、SupplementalProperty要素を利用するなど、他の依存関係記述属性を利用するようにしてもよい。
(2)具体的な運用例
図22乃至図23を参照して、第2の実施の形態についての具体的な運用例について説明する。
(2−1)運用例4
図22は、オーディオストリームのミキシング再生を行う運用例4を説明するための図である。図22においては、当該運用例4を実現するためのMPDの記述内容が示されており、上述した図14等と同様に、「AS」、「R」は、AdaptationSet要素と、Representation要素をそれぞれ表している。また、図中の「EP」はEssentialProperty要素、「@」は属性を意味しているため、「@schemeIdUri」、「@value」は、EssentialProperty要素のschemeIdUri属性と、value属性を表している。
ここで、図22の運用例4においては、EssentialProperty要素のschemeIdUri属性の属性値として、「urn:..:mixing」が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントのAdaptationSet属性群は、ミキシングされて出力されることを意味するように定義されている。また、EssentialProperty要素のvalue属性には、その値が、オーディオコンポーネントがミキシングされるべきオーディオコンポーネント群のグループを識別するための値を意味することが定義されている。
図22においては、単一のオーディオストリームに対応した3つのAdaptationSet要素が記述され、それらのAdaptationSet要素の配下に1又は複数のRepresentation要素が記述されている。
1つ目のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのダイアログ(Dlg:Dialog)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
また、1つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として'urn:..:mixing'が指定され、value属性として'1'が指定されている。つまり、レベル3のレイヤで選択されたコンポーネントは、"1"であるグループID(mxgrpid)が指定されたミキシンググループ1に属していることになる。
2つ目のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、オーディオコンポーネントとして、エフェクト(Efct:Effect)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
また、2つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として'urn:..:mixing'が指定され、value属性として'1'が指定されている。つまり、エレメンタリコンポーネントに相当するコンポーネントは、"1"であるグループID(mxgrpid)が指定されたミキシンググループ1に属していることになる。
3つ目のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのミュージック(Music)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
また、3つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として'urn:..:mixing'が指定され、value属性として'1'が指定されている。つまり、レベル3のレイヤで選択されたコンポーネントは、"1"であるグループID(mxgrpid)が指定されたミキシンググループ1に属していることになる。
このように、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、オーディオコンポーネントの選択が行われる。
そして、3つのAdaptationSet要素にはともに、EssentialProperty要素のschemeIdUri属性として'urn:..:mixing'が指定され、value属性として'1'が指定されているので、同一のミキシンググループ1に属している。このように、EssentialProperty要素のschemeIdUri属性とvalue属性によって、複数のAdaptationSet要素のグルーピングが行われることで、図7のコンポーネントレイヤ構造におけるレベル2のレイヤの機能が実現され、当該レベル2(コンポジットコンポーネント)のレイヤにおいて、オーディオコンポーネントのミキシングが行われることになる。
以上、図22の運用例4においては、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで実現される。また、レベル2のレイヤの機能が、EssentialProperty要素のschemeIdUri属性とvalue属性によって、複数のAdaptationSet要素の関連付けが行われることで実現される。このようにして、レベル2のレイヤとレベル3のレイヤの機能が実現されることで、オーディオストリームのミキシング再生が行われる。
(2−2)運用例5
図23は、オーディオストリームのグループ選択を行う運用例5を説明するための図である。
図23においては、当該運用例5を実現するためのMPDの記述内容が示されており、図22と同様に、「AS」、「R」は、AdaptationSet要素と、Representation要素をそれぞれ表している。また、AdaptationSet要素には、「@gid」で示したgroup属性が記述されている。さらにまた、図22と同様に、「@schemeIdUri」、「@value」は、EssentialProperty要素のschemeIdUri属性と、value属性を表している。
また、図23の運用例5においては、図22の運用例4と同様に、EssentialProperty要素のschemeIdUri属性の属性値として、「urn:..:mixing」が定義されており、この属性値を持っているEssentialProperty要素を有するオーディオコンポーネントのAdaptationSet属性群は、ミキシングされて出力されることを意味するように定義されている。また、EssentialProperty要素のvalue属性には、その値が、オーディオコンポーネントがミキシングされるべきオーディオコンポーネント群のグループを識別するための値を意味することが定義されている。
図23においては、単一のオーディオストリームに対応した4つのAdaptationSet要素が記述され、それらのAdaptationSet要素の配下に1又は複数のRepresentation要素が記述されている。
1つ目のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのステレオ(STR:Stereo)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
また、1つ目のAdaptationSet要素には、group属性として、group='1'が指定されている。つまり、レベル3のレイヤで選択されたコンポーネントは、グループ1に属していることになる。
2つ目のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、ビットレートの異なるオーディオコンポーネントとして、高ビットレートと低ビットレートのミュージック(Music)が列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。
また、2つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として'urn:..:mixing'が指定され、value属性として'1'が指定されている。つまり、レベル3のレイヤで選択されたコンポーネントは、"1"であるグループID(mxgrpid)が指定されたミキシンググループ1に属していることになる。さらに、2つ目のAdaptationSet要素には、group属性として、group='1'が指定されているので、レベル3のレイヤで選択されたコンポーネントは、レベル1のグループ1にも属していることになる。
3つ目のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、オーディオコンポーネントとして、ダイアログ(Dlg:Dialog)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
また、3つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として'urn:..:mixing'が指定され、value属性として'1'が指定されている。つまり、レベル3のレイヤで選択されたコンポーネントは、"1"であるグループID(mxgrpid)が指定されたミキシンググループ1に属していることになる。さらに、3つ目のAdaptationSet要素には、group属性として、group='1'が指定されているので、当該エレメンタリコンポーネントに相当するコンポーネントは、レベル1のグループ1にも属していることになる。
4つ目のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、オーディオコンポーネントとして、エフェクト(Efct:Effect)が列挙されており、1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
また、4つ目のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性として'urn:..:mixing'が指定され、value属性として'1'が指定されている。つまり、エレメンタリコンポーネントに相当するコンポーネントは、"1"であるグループID(mxgrpid)が指定されたミキシンググループ1に属していることになる。さらに、4つ目のAdaptationSet要素には、group属性として、group='1'が指定されているので、当該エレメンタリコンポーネントに相当するコンポーネントは、レベル1のグループ1にも属していることになる。
このように、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、オーディオコンポーネントの選択が行われる。
また、4つのAdaptationSet要素のうち、2つ目乃至4つ目のAdaptationSet要素にはともに、EssentialProperty要素のschemeIdUri属性として'urn:..:mixing'が指定され、value属性として'1'が指定されているので、同一のミキシンググループ1に属している。このように、EssentialProperty要素のschemeIdUri属性とvalue属性によって、複数のAdaptationSet要素のグルーピングが行われることで、図7のコンポーネントレイヤ構造におけるレベル2のレイヤの機能が実現され、当該レベル2(コンポジットコンポーネント)のレイヤにおいて、オーディオコンポーネントのミキシングが行われることになる。
さらに、4つのAdaptationSet要素のすべてに、group属性として、group='1'が指定されているので、同一のレベル1のグループに属している。このように、AdaptationSet要素のgroup属性によって、グルーピングが行われることで、図7のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のオーディオコンポーネントの中から1つのオーディオコンポーネントが選択されることになる。ここでは、グループ1に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたオーディオコンポーネント(ステレオ)と、レベル2(コンポジットコンポーネント)のレイヤでミキシングされたオーディオコンポーネント(ミュージック、ダイアログ、エフェクト)のうち、いずれか一方のオーディオコンポーネントが選択される。
以上、図23の運用例5においては、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで実現される。また、レベル2のレイヤの機能が、EssentialProperty要素のschemeIdUri属性とvalue属性によって、複数のAdaptationSet要素の関連付けが行われることで実現される。さらにまた、レベル1のレイヤの機能が、AdaptationSet要素のgroup属性によって、複数のAdaptationSet要素をグルーピングすることで実現される。このようにして、レベル1、レベル2、及び、レベル3のレイヤの機能が実現されることで、オーディオコンポーネントのグループ選択が行われ、オーディオコンポーネントが再生される。
<5.第3の実施の形態>
(1)Subset要素の他の使用例
ところで、第1の実施の形態では、MPDにおいて、Subset要素が、図7のコンポーネントレイヤ構造のレベル2のレイヤの機能を満たすために使用される例を説明したが、Subset要素を、コンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いるようにしてもよい。以下、具体的な運用例を参照しながら、Subset要素の他の使用例について説明する。
(2)運用例6
図24は、コンポーネントの同時提示のためのグルーピングを行う運用例6を説明するための図である。図24においては、当該運用例6を実現するためのMPDの記述内容が示されており、「AS」と「R」は、AdaptationSet要素とRepresentation要素をそれぞれ表している。また、AdaptationSet要素には、「@id」で示したid属性と、「@gid」で示したgroup属性が記述されている。さらにまた、「@schemeIdUri」は、EssentialProperty要素のschemeIdUri属性を表している。
図24のMPDにおいては、ビデオのグループ1に属する4つのAdaptationSet要素(id='11','12','13','14')と、オーディオのグループ2に属する4つのAdaptationSet要素(id='21','22','23','24')が記述され、それらのAdaptationSet要素の配下にそれぞれ、1又は複数のRepresentation要素が記述されている。
ビデオのグループ1において、各Representation要素には、ビデオコンポーネントとして、「base」、「ext」、「SV1」、及び、「SV2」が列挙されている。ここで、「base」は、単独で再生可能な基本の映像信号に相当するビデオコンポーネントを表し、「ext」は、拡張用の映像信号に相当するビデオコンポーネントを表している。また、「SV1」と「SV2」において、「SV」は、主の表示領域であるメインビューに対する補助的な領域となるサブビューを表している。
id='11'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、単独で再生可能な基本の映像信号に相当する1つのビデオコンポーネントが常に選択されることになる。このようにして選択されるビデオコンポーネントは、エレメンタリコンポーネントに相当している。なお、当該ビデオコンポーネントは、メインビュー用とされている。
id='12'のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性の属性値として、「urn:..:SVC」が指定されている。ここで、図24の運用例6においては、EssentialProperty要素のschemeIdUri属性の属性値として、「urn:..:SVC」が定義されており、この属性値を持っているEssentialProperty要素を有するAdaptationSet属性は、その配下のRepresentation要素群が互いに、Base-Enhance関係の依存関係を有することを意味するように定義されている。
したがって、id='12'のAdaptationSet要素の配下の4つのRepresentation要素は、Base-Enhance関係の依存関係を有していることになる。すなわち、id='12'のAdaptationSet要素の配下には、4つのRepresentation要素が記述され、基本の映像信号に相当するビデオコンポーネントが1つ列挙されているほか、拡張用の映像信号に相当するビデオコンポーネントが3つ列挙されており、Base-Enhance関係の依存関係を有している。これにより、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、基本の映像信号と拡張用の映像信号に相当するビデオコンポーネントが選択されることになる。なお、当該ビデオコンポーネントは、メインビュー用とされている。
このように、第2の実施の形態では、MPDにおいて、EssentialProperty要素が、図7のコンポーネントレイヤ構造のレベル2のレイヤの機能を満たすために使用される例を説明したが、ここでは、EssentialProperty要素を、AdaptationSet属性の配下のRepresentation要素に列挙されるコンポーネント群の特徴を表現するために用いている。
id='13'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、サブビュー1用の1つのビデオコンポーネントが常に選択されることになる。このようにして選択されるビデオコンポーネントは、エレメンタリコンポーネントに相当している。
id='14'のAdaptationSet要素の配下には、3つのRepresentation要素が記述され、サブビュー2用のビデオコンポーネントが3つ列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えば、ネットワーク環境条件などに応じて、適応的に1つのビデオコンポーネントが選択されることになる。
このように、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで、図7のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、ビデオコンポーネントの選択が行われる。
ここで、図24のMPDにおいては、id='11'のAdaptationSet要素、id='12'のAdaptationSet要素、id='13'のAdaptationSet要素、及び、id='14'のAdaptationSet要素には、group属性として、group='1'が指定されており、それらのAdaptationSet要素は、同一のグループ1に属していることになる。
このように、group属性によって、グルーピングを行うことで、図7のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のビデオコンポーネントの中から1つのビデオコンポーネントが選択されることになる。ここでは、グループ1に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたビデオコンポーネントとエレメンタリコンポーネントの中から、1つのビデオコンポーネントが選択される。
一方、オーディオのグループ2において、各Representation要素には、オーディオコンポーネントとして、「NrRbst」、「HiRbst」、「MCD」、「SV1」、及び、「SV2」が列挙されている。「NrRbst」は、通常のロバスト性を有するオーディオコンポーネントを意味する。また、「HiRbst」は、高いロバスト性を有するオーディオコンポーネントを意味する。「MCD」は、マルチチャンネルのオーディオコンポーネントを表している。さらに、「SV1」と「SV2」において、「SV」は、サブビュー用のオーディオコンポーネントを表している。
id='21'のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、通常のロバスト性を有するオーディオコンポーネントと、高いロバスト性を有するオーディオコンポーネントが列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。なお、当該オーディオコンポーネントは、メインビュー用とされている。
id='22'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、マルチチャンネルの1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。なお、当該オーディオコンポーネントは、メインビュー用とされている。
id='23'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、サブビュー1用の1つのオーディオコンポーネントが常に選択されることになる。同様にid='24'のAdaptationSet要素の配下には、サブビュー2用の1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるサブビュー用のオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
ここで、図24のMPDにおいては、id='21'のAdaptationSet要素、id='22'のAdaptationSet要素、id='23'のAdaptationSet要素、及び、id='24'のAdaptationSet要素には、group属性として、group='2'が指定されており、それらのAdaptationSet要素は、同一のグループ2に属していることになる。
このように、group属性によって、グルーピングを行うことで、図7のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のオーディオコンポーネントの中から1つのオーディオコンポーネントが選択されることになる。ここでは、グループ2に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたオーディオコンポーネントとエレメンタリコンポーネントの中から、1つのオーディオコンポーネントが選択される。
また、図24のMPDにおいては、Subset要素が、コンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いられている。
具体的には、1つ目のSubset要素のcontains属性には'11 21'が指定されており、id='11'のAdaptationSet要素と、id='21'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」)と、オーディオコンポーネント(「A-NrRbst」又は「A-HiRbst」)は、同時に再生されるメインビュー用のコンポーネントとなる。
2つ目のSubset要素のcontains属性には'11 22'が指定されており、id='11'のAdaptationSet要素と、id='22'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」)と、オーディオコンポーネント(「A-MCD」)は、同時に再生されるメインビュー用のコンポーネントとなる。
3つ目のSubset要素のcontains属性には'12 21'が指定されており、id='12'のAdaptationSet要素と、id='21'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」と「V-ext」)と、オーディオコンポーネント(「A-NrRbst」又は「A-HiRbst」)は、同時に再生されるメインビュー用のコンポーネントとなる。
4つ目のSubset要素のcontains属性には'12 22'が指定されており、id='12'のAdaptationSet要素と、id='22'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」と「V-ext」)と、オーディオコンポーネント(「A-MCD」)は、同時に再生されるメインビュー用のコンポーネントとなる。
5つ目のSubset要素のcontains属性には'13 23'が指定されており、id='13'のAdaptationSet要素と、id='23'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-SV1」)と、オーディオコンポーネント(「A-SV1」)は、同時に再生されるサブビュー1用のコンポーネントとなる。
6つ目のSubset要素のcontains属性には'14 24'が指定されており、id='14'のAdaptationSet要素と、id='24'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-SV2」)と、オーディオコンポーネント(「A-SV2」)は、同時に再生されるサブビュー2用のコンポーネントとなる。
以上、図24の運用例6においては、Subset要素を、図7のコンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いることで、例えば、ビデオとオーディオの間で、メインビュー用、サブビュー1用、又は、サブビュー2用などの関連付けを行うことができる。また、例えば、ビデオとオーディオのコンポーネントのうち、一方のコンポーネントが特定されれば、他方のコンポーネントも特定されることになる。
<6.システム構成>
(放送通信システムの構成例)
図25は、本技術を適用した放送通信システムの構成例を示す図である。
図25に示すように、放送通信システム1は、チャンネルストリーマ10、MPD提供装置20、DASHセグメンタ・ストリーマ30、及び、クライアント装置50から構成される。また、クライアント装置50は、インターネット等のネットワーク90を介して、MPD提供装置20及びDASHセグメンタ・ストリーマ30と相互に接続されている。
チャンネルストリーマ10は、ビデオやオーディオ、字幕などの各種のコンポーネントからなるコンテンツのメタデータを、MPD提供装置20に提供する。また、チャンネルストリーマ10は、ビデオやオーディオ、字幕などの各種のコンポーネントからなるコンテンツのストリームデータを、DASHセグメンタ・ストリーマ30に提供する。
ここでは、例えば、コンテンツを提供するサービスにおいて、アダプティブストリーミング配信を実現するために、当該コンテンツを構成するコンポーネントとして、1Mbps,5Mbps,10Mbps,20Mbps等の異なるビットレートのビデオやオーディオのコンポーネントが用意されている。チャンネルストリーマ10は、これらのコンポーネントを、ストリームデータとして、DASHセグメンタ・ストリーマ30に提供する。
MPD提供装置20は、チャンネルストリーマ10から提供されるコンテンツのメタデータと、DASHセグメンタ・ストリーマ30から提供されるセグメントメタデータに基づいて、MPDを生成する。生成されたMPDは、放送又は通信を利用して伝送される。
すなわち、MPD提供装置20において、デジタル放送信号でMPDを伝送する場合には、例えば、MPDファイルがFLUTE(File Delivery over Unidirectional Transport)セッションによって、周期的にマルチキャスト配信されることになる。また、MPD提供装置20において、通信網を介してMPDを伝送する場合には、例えば、クライアント装置50からのMPDの要求に応じて、MPDファイルがネットワーク90を介してクライアント装置50にユニキャスト配信されることになる。
DASHセグメンタ・ストリーマ30は、チャンネルストリーマ10から提供されるコンテンツのストリームデータに基づいて、セグメントデータを生成する。生成されたセグメントデータは、放送又は通信を利用して伝送される。
すなわち、DASHセグメンタ・ストリーマ30において、デジタル放送信号でセグメントデータを伝送する場合には、例えばセグメントデータがFLUTEセッションによって、周期的にマルチキャスト配信されることになる。また、DASHセグメンタ・ストリーマ30において、通信網を介してセグメントデータを伝送する場合には、例えば、クライアント装置50からのセグメントデータの要求に応じて、セグメントデータがネットワーク90を介してクライアント装置50にユニキャスト配信されることになる。
クライアント装置50は、MPD提供装置20によってマルチキャスト配信又はユニキャスト配信されるMPDファイルを受信する。また、クライアント装置50は、MPDファイルに基づいて、コンテンツを構成する複数のコンポーネントの候補の中から、最適なコンポーネントを選択する。クライアント装置50は、コンポーネントの選択の結果に基づいて、DASHセグメンタ・ストリーマ30によってマルチキャスト配信又はユニキャスト配信されるセグメントデータを受信する。そして、クライアント装置50は、受信したセグメントデータから、コンテンツのストリームデータを復元することで、コンテンツを再生する。
放送通信システム1は、以上のように構成される。次に、図25の放送通信システム1を構成する各装置の詳細な構成について説明する。
(送信側の装置の構成例)
図26は、送信側の装置の構成例を示す図である。
図26に示すように、送信側の装置は、チャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30から構成される。
チャンネルストリーマ10は、コンテンツ管理部101、コンテンツ蓄積部102、及び、通信部103から構成される。コンテンツ管理部101は、コンテンツ蓄積部102に蓄積されるコンテンツを管理する。
通信部103は、コンテンツ管理部101からの制御に従い、コンテンツ蓄積部102に蓄積されたコンテンツのメタデータを、MPD提供装置20に供給する。また、通信部103は、コンテンツ管理部101からの制御に従い、コンテンツ蓄積部102に蓄積されたコンテンツのストリームデータを、DASHセグメンタ・ストリーマ30に供給する。
MPD提供装置20は、MPD生成部201、通信部202、及び、送信部203から構成される。
通信部202は、チャンネルストリーマ10から提供されるコンテンツのメタデータと、DASHセグメンタ・ストリーマ30から提供されるセグメントメタデータを受信して、MPD生成部201に供給する。MPD生成部201は、通信部202から供給されるコンテンツのメタデータ及びセグメントメタデータに基づいて、MPDファイルを生成し、通信部202又は送信部203に供給する。
通信部202は、クライアント装置50からのMPDの要求に応じて、MPD生成部201から供給されるMPDファイルを、ネットワーク90を介してクライアント装置50に送信する。また、送信部203は、MPD生成部201から供給されるMPDファイルを変調し、アンテナ204を介してデジタル放送信号で送信する。なお、このとき、MPDファイルは、例えばFLUTEセッションで伝送される。
DASHセグメンタ・ストリーマ30は、セグメントデータ生成部301、セグメントメタデータ生成部302、通信部303、及び、送信部304から構成される。
通信部303は、チャンネルストリーマ10から提供されるコンテンツのストリームデータを受信して、セグメントデータ生成部301に供給する。セグメントデータ生成部301は、通信部303から供給されるコンテンツのストリームデータに基づいて、セグメントデータを生成し、通信部303又は送信部304に供給する。
通信部303は、クライアント装置50からのセグメントデータの要求に応じて、セグメントデータ生成部301から供給されるセグメントデータを、ネットワーク90を介してクライアント装置50に送信する。また、送信部304は、セグメントデータ生成部301から供給されるセグメントデータを変調し、アンテナ305を介してデジタル放送信号で送信する。なお、このとき、セグメントデータは、例えばFLUTEセッションで伝送される。
また、セグメントデータ生成部301は、生成されたセグメントデータを、セグメントメタデータ生成部302に供給する。セグメントメタデータ生成部302は、セグメントデータ生成部301から供給されるセグメントデータに基づいて、セグメントメタデータを生成し、通信部303に供給する。通信部303は、セグメントメタデータ生成部302から供給されるセグメントメタデータを、MPD提供装置20に供給する。
なお、図25及び図26においては、説明の都合上、送信側のチャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30は別個の装置であるとして説明しているが、送信側の装置は、図26に示した機能的構成を有していればよく、例えば、チャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30を、1つの装置として捉えることができる。その際、例えば、通信部や送信部などの重複した機能については1つにまとめることができる。
(受信側の装置の構成例)
図27は、受信側のクライアント装置の構成例を示す図である。
図27に示すように、クライアント装置50は、制御部501、受信部502、ディスプレイ503、スピーカ504、記録部505、及び、通信部506から構成される。
制御部501は、クライアント装置50の各部の動作を制御する。
受信部502は、制御部501からの制御に従い、アンテナ507を介して、送信側の装置から送信されるデジタル放送信号を受信する。受信部502は、デジタル放送信号を復調し、それにより得られるデータを制御部501に供給する。制御部501は、受信部502から供給されるデータに対する各種の処理を行う。
ディスプレイ503は、制御部501からの制御に従い、コンテンツのストリームデータに応じた映像を表示する。スピーカ504は、制御部501からの制御に従い、コンテンツのストリームデータに応じた音声を出力する。
記録部505は、例えばハードディスクなどから構成され、制御部501からの制御に従い、コンテンツのストリームデータなどを記録する。通信部506は、制御部501からの制御に従い、ネットワーク90を介して、送信側の装置と各種のデータをやりとりする。
制御部501は、MPD取得部551、コンポーネント選択部552、セグメントデータ取得部553、及び、セグメントデータ再生部554から構成される。
MPD取得部551は、受信部502又は通信部506を制御して、放送又は通信で伝送されるMPDファイルを取得し、コンポーネント選択部552に供給する。コンポーネント選択部552は、MPD取得部551から供給されるMPDファイルに基づいて、複数のコンポーネントの候補の中から、最適なコンポーネントを選択し、その選択の結果を、セグメントデータ取得部553に供給する。
セグメントデータ取得部553は、コンポーネント選択部552からの選択の結果に基づいて、受信部502又は通信部506を制御して、放送又は通信で伝送されるセグメントデータを取得し、セグメントデータ再生部554に供給する。セグメントデータ再生部554は、セグメントデータ取得部553からのセグメントデータから得られる、ビデオストリームデータをディスプレイ503に、オーディオストリームデータをスピーカ504にそれぞれ供給する。これにより、コンテンツの映像がディスプレイ503に表示され、その映像に同期した音声がスピーカ504から出力される。
なお、図27のクライアント装置50の構成では、ディスプレイ503やスピーカ504を含む構成としているが、ディスプレイ503やスピーカ504を含まない構成として、単体と構成されるようにしてもよいし、テレビジョン受像機やビデオレコーダ等に内蔵されるようにしてもよい。
<7.各装置における具体的な処理の流れ>
上述したように、送信側の装置は、MPDファイルやセグメントデータを、受信側のクライアント装置50からの要求に応じてユニキャスト配信する場合と、受信側のクライアント装置50からの要求に関係なく、周期的にマルチキャスト配信する場合がある。そこで、以下、MPDファイルやセグメントデータがマルチキャスト配信される場合と、ユニキャスト配信される場合についてそれぞれ説明する。
(マルチキャスト配信時の処理の流れ)
まず、図28のフローチャートを参照して、マルチキャスト配信時の各装置における具体的な処理の流れを説明する。なお、図28においては、送信側の装置として、チャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30における処理の流れが示され、受信側の装置として、クライアント装置50における処理の流れが示されている。
チャンネルストリーマ10は、ステップS101乃至S102の処理を実行する。具体的には、ステップS101において、コンテンツ管理部101は、コンテンツ蓄積部102からコンテンツのメタデータを取得し、通信部103を介してMPD提供装置20に提供する。また、ステップS102において、コンテンツ管理部101は、コンテンツ蓄積部102からコンテンツのストリームデータを取得し、通信部103を介してDASHセグメンタ・ストリーマ30に供給する。
MPD提供装置20は、ステップS201乃至S202の処理を実行する。具体的には、MPD提供装置20では、チャンネルストリーマ10から提供されるコンテンツのメタデータと、DASHセグメンタ・ストリーマ30から提供されるセグメントメタデータが取得される(ステップS101,S303)。ステップS201において、MPD生成部201は、コンテンツのメタデータ及びセグメントメタデータに基づいて、MPDを生成する。
ステップS202において、送信部203は、ステップS201の処理で生成されたMPDに対応するデジタル放送信号を、アンテナ204を介して送信する。ここでは、MPDファイルが、FLUTEセッションによって、周期的にマルチキャスト配信される。
DASHセグメンタ・ストリーマ30は、ステップS301乃至S304の処理を実行する。具体的には、DASHセグメンタ・ストリーマ30では、チャンネルストリーマ10から提供されるコンテンツのストリームデータが取得される(ステップS102)。ステップS301において、セグメントデータ生成部301は、コンテンツのストリームデータに基づいて、セグメントデータを生成する。また、ステップS302において、セグメントメタデータ生成部302は、ステップS301の処理で生成されたセグメントデータに基づいて、セグメントメタデータを生成する。
ステップS303において、通信部303は、ステップS302の処理で生成されたセグメントメタデータを、MPD提供装置20に提供する。また、ステップS304において、送信部304は、ステップS301の処理で生成されたセグメントデータに対応するデジタル放送信号を、アンテナ305を介して送信する。ここでは、セグメントデータが、FLUTEセッションによって、周期的にマルチキャスト配信される。
クライアント装置50は、ステップS501乃至S504の処理を実行する。具体的には、ステップS501において、受信部502は、アンテナ507を介して、MPD提供装置20からマルチキャスト配信されるMPDに対応するデジタル放送信号を受信する。ここでは、MPD取得部551が、デジタル放送信号を復調して得られる、FLUTEセッションで伝送されているMPDファイルを取得することになる。
ステップS502において、コンポーネント選択部552は、ステップS501の処理で取得したMPDファイルに基づいて、複数のコンポーネントの候補の中から、最適なコンポーネントを選択する。ここでは、コンポーネントは、図7のコンポーネントレイヤ構造を有しているが、上述した第1の実施の形態乃至第3の実施の形態で説明したように、MPDファイルの記述内容に応じて、レベル1乃至レベル3のレイヤの機能が実現され、最適なコンポーネントが選択されることになる。
ステップS503において、受信部502は、アンテナ507を介して、DASHセグメンタ・ストリーマ30からマルチキャスト配信されるセグメントデータに対応するデジタル放送信号を受信する。ここでは、セグメントデータ取得部553が、ステップS502の選択処理の結果に基づいて、DASHセグメンタ・ストリーマ30からマルチキャスト配信され、FLUTEセッションで伝送されているセグメントデータを取得することになる。
ステップS504において、セグメントデータ再生部554は、ステップS503の処理で取得されたセグメントデータから、コンテンツのストリームデータを復元し、ビデオストリームデータをディスプレイ503に、オーディオストリームデータをスピーカ504に供給する。これにより、コンテンツの映像がディスプレイ503に表示され、その映像に同期した音声がスピーカ504から出力される。
以上、マルチキャスト配信時の各装置における具体的な処理の流れについて説明した。
(ユニキャスト配信時の処理の流れ)
次に、図29のフローチャートを参照して、ユニキャスト配信時の各装置における具体的な処理の流れを説明する。なお、図29においては、図28と同様に、送信側の装置として、チャンネルストリーマ10、MPD提供装置20、及び、DASHセグメンタ・ストリーマ30における処理の流れが示され、受信側の装置として、クライアント装置50における処理の流れが示されている。
チャンネルストリーマ10により実行されるステップS151乃至S152の処理の内容は、図28のステップS101乃至S102の処理と同様である。すなわち、ステップS151乃至S152においては、コンテンツのメタデータがMPD提供装置20に提供され、コンテンツのストリームデータがDASHセグメンタ・ストリーマ30に供給される。
MPD提供装置20は、ステップS251乃至S252の処理を実行する。具体的には、MPD提供装置20では、チャンネルストリーマ10から提供されるコンテンツのメタデータと、DASHセグメンタ・ストリーマ30から提供されるセグメントメタデータが取得される(ステップS151,S353)。ステップS251において、MPD生成部201は、コンテンツのメタデータ及びセグメントメタデータに基づいて、MPDファイルを生成する。
ステップS252において、通信部202は、クライアント装置50からのMPDの要求を受信した場合には、そのMPDの要求に応じて、ステップS251の処理で生成されたMPDファイルを、ネットワーク90を介して、クライアント装置50に送信する。
DASHセグメンタ・ストリーマ30は、ステップS351乃至S354の処理を実行する。具体的には、DASHセグメンタ・ストリーマ30では、チャンネルストリーマ10から提供されるコンテンツのストリームデータが取得される(ステップS152)。ステップS351において、セグメントデータ生成部301は、コンテンツのストリームデータに基づいて、セグメントデータを生成する。また、ステップS352において、セグメントメタデータ生成部302は、ステップS351の処理で生成されたセグメントデータに基づいて、セグメントメタデータを生成する。
ステップS353において、通信部303は、ステップS352の処理で生成されたセグメントメタデータを、MPD提供装置20に提供する。また、ステップS354において、通信部303は、クライアント装置50からのセグメントデータの要求を受信した場合には、そのセグメントデータの要求に応じて、ステップS351の処理で生成されたセグメントデータを、ネットワーク90を介して、クライアント装置50に送信する。
クライアント装置50は、ステップS551乃至S556の処理を実行する。具体的には、ステップS551において、通信部506は、MPD取得部551からの制御に従い、ネットワーク90を介してMPD提供装置20にアクセスして、MPDを要求する。ステップS552において、通信部506は、MPD取得部551からの制御に従い、ネットワーク90を介してMPD提供装置20からユニキャスト配信されるMPDファイルを受信する。
ステップS553において、コンポーネント選択部552は、ステップS552の処理で取得したMPDファイルに基づいて、複数のコンポーネントの候補の中から、最適なコンポーネントを選択する。ここでは、コンポーネントは、図7のコンポーネントレイヤ構造を有しているが、上述した第1の実施の形態乃至第3の実施の形態で説明したように、MPDファイルの記述内容に応じて、レベル1乃至レベル3のレイヤの機能が実現され、最適なコンポーネントが選択されることになる。
ステップS554において、通信部506は、セグメントデータ取得部553からの制御に従い、ネットワーク90を介してDASHセグメンタ・ストリーマ30にアクセスして、セグメントデータを要求する。ステップS555において、通信部506は、セグメントデータ取得部553からの制御に従い、ネットワーク90を介してDASHセグメンタ・ストリーマ30からユニキャスト配信されるセグメントデータを受信する。
ステップS556において、セグメントデータ再生部554は、ステップS555の処理で取得されたセグメントデータから、コンテンツのストリームデータを復元し、ビデオストリームデータをディスプレイ503に、オーディオストリームデータをスピーカ504に供給する。これにより、コンテンツの映像がディスプレイ503に表示され、その映像に同期した音声がスピーカ504から出力される。
以上、ユニキャスト配信時の各装置における具体的な処理の流れについて説明した。
<8.コンピュータの構成>
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。図30は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示す図である。
コンピュータ900において、CPU(Central Processing Unit)901,ROM(Read Only Memory)902,RAM(Random Access Memory)903は、バス904により相互に接続されている。バス904には、さらに、入出力インターフェース905が接続されている。入出力インターフェース905には、入力部906、出力部907、記録部908、通信部909、及び、ドライブ910が接続されている。
入力部906は、キーボード、マウス、マイクロフォンなどよりなる。出力部907は、ディスプレイ、スピーカなどよりなる。記録部908は、ハードディスクや不揮発性のメモリなどよりなる。通信部909は、ネットワークインターフェースなどよりなる。ドライブ910は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア911を駆動する。
以上のように構成されるコンピュータ900では、CPU901が、ROM902や記録部908に記憶されているプログラムを、入出力インターフェース905及びバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ900(CPU901)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア911に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。
コンピュータ900では、プログラムは、リムーバブルメディア911をドライブ910に装着することにより、入出力インターフェース905を介して、記録部908にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部909で受信し、記録部908にインストールすることができる。その他、プログラムは、ROM902や記録部908に、あらかじめインストールしておくことができる。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
また、本技術は、以下のような構成をとることができる。
(1)
デジタル放送の放送波を受信する受信部と、
前記放送波又は通信網で伝送される、MPEG-DASH(Moving Picture Expert Group - Dynamic Adaptive Streaming over HTTP)の規格に準拠したMPD(Media Presentation Description)に基づいて、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する制御部と
を備える受信装置。
(2)
前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、
前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、
前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、
前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである
(1)に記載の受信装置。
(3)
前記第3のレイヤの機能は、前記第3のレイヤを前記MPDのAdaptationSet要素にマッピングし、さらに、当該AdaptationSet要素内に列挙されるRepresentation要素又はSubRepresentation要素を、前記第3のレイヤの対象となっていないコンポーネントにマッピングすることで実現され、
前記第2のレイヤの機能は、前記MPDで規定されているAdaptationSet要素と同一のレベルに配置される第1の要素により、AdaptationSet要素の組が指定されることで実現され、
前記第1のレイヤの機能は、AdaptationSet要素のgroup属性と、前記第1の要素に規定されるgroup属性によりグルーピングをすることで実現される
(2)に記載の受信装置。
(4)
前記第1の要素は、Subset要素であり、
前記Subset要素のcontains属性により、AdaptationSet要素の集合が指定される
(3)に記載の受信装置。
(5)
前記第1のレイヤでは、前記コンポーネントのカテゴリごとに、グルーピングが行われる
(3)又は(4)に記載の受信装置。
(6)
前記第3のレイヤの機能は、前記第3のレイヤを前記MPDのAdaptationSet要素にマッピングし、さらに、当該AdaptationSet要素内に列挙されるRepresentation要素又はSubRepresentation要素を、前記第3のレイヤの対象となっていないコンポーネントにマッピングすることで実現され、
前記第2のレイヤの機能は、前記MPDのAdaptationSet要素の間の関係、Representation要素の間の関係、又は、SubRepresentation要素の間の関係を定義する第2の要素によって、複数のAdaptationSet要素をグルーピングすることで実現され、
前記第1のレイヤの機能は、AdaptationSet要素のgroup属性によりグルーピングをすることで実現される
(2)に記載の受信装置。
(7)
前記第2の要素は、EssentialProperty要素であり、
前記EssentialProperty要素のschemeIdUri属性とvalue属性により、AdaptationSet要素の集合が指定される
(6)に記載の受信装置。
(8)
前記第1のレイヤでは、前記コンポーネントのカテゴリごとに、グルーピングが行われる
(6)又は(7)に記載の受信装置。
(9)
前記コンポーネントは、前記放送波又は前記通信網で伝送される
(1)乃至(8)のいずれか一項に記載の受信装置。
(10)
受信装置の受信方法において、
前記受信装置が、
デジタル放送の放送波を受信し、
前記放送波又は通信網で伝送される、MPEG-DASHの規格に準拠したMPDに基づいて、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する
ステップを含む受信方法。
(11)
MPEG-DASHの規格に準拠したMPDとして、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御することが可能な情報を少なくとも含む前記MPDを生成する生成部と、
生成された前記MPDを、デジタル放送の放送波又は通信網を介して送信する送信部と
を備える送信装置。
(12)
送信装置の送信方法において、
前記送信装置が、
MPEG-DASHの規格に準拠したMPDとして、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御することが可能な情報を少なくとも含む前記MPDを生成し、
生成された前記MPDを、デジタル放送の放送波又は通信網を介して送信する
ステップを含む送信方法。
(13)
デジタル放送の放送波を受信する受信部と、
前記放送波又は通信網で伝送される、MPEG-DASHの規格に準拠したMPDに基づいて、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する制御部と
を備え、
前記MPDには、前記複数のレイヤ構造に関する規定の枠外で、AdaptationSet要素の組を指定する第1の要素が含まれる
受信装置。
(14)
前記第1の要素は、Subset要素であり、
前記Subset要素のcontains属性により、AdaptationSet要素の組が指定される
(13)に記載の受信装置。
(15)
前記MPDには、前記MPDのAdaptationSet要素の間の関係、Representation要素の間の関係、又は、SubRepresentation要素の間の関係を定義する第2の要素が含まれ、
前記第2の要素によって、AdaptationSet要素の配下のRepresentation要素群の関係が指定される
(13)又は(14)に記載の受信装置。
(16)
前記第2の要素は、EssentialProperty要素であり、
前記EssentialProperty要素のschemeIdUri属性により、AdaptationSet要素の配下のRepresentation要素群の関係が指定される
(15)に記載の受信装置。
(17)
前記レイヤ構造は、第1のレイヤ、第2のレイヤ、及び、第3のレイヤの3層からなり、
前記第3のレイヤは、前記コンポーネントを適応的に選択するためのレイヤであり、
前記第2のレイヤは、前記第3のレイヤで選択されたコンポーネント、及び、前記第3のレイヤの対象となっていないコンポーネントを1つのコンポーネントに構造化するためのレイヤであり、
前記第1のレイヤは、前記第2のレイヤで構造化されたコンポーネント、前記第3のレイヤで選択されたコンポーネント、及び、前記第2のレイヤと前記第3のレイヤの対象となっていないコンポーネントの中から、1つのコンポーネントを選択するためのレイヤである
(13)乃至(16)のいずれか一項に記載の受信装置。
(18)
受信装置の受信方法において、
前記受信装置が、
デジタル放送の放送波を受信し、
前記放送波又は通信網で伝送される、MPEG-DASHの規格に準拠したMPDに基づいて、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する
ステップを含み、
前記MPDには、前記複数のレイヤ構造に関する規定の枠外で、AdaptationSet要素の組を指定する前記第1の要素が含まれる
受信方法。
(19)
MPEG-DASHの規格に準拠したMPDとして、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御することが可能な情報と、前記複数のレイヤ構造に関する規定の枠外で、AdaptationSet要素の組を指定する第1の要素を少なくとも含む前記MPDを生成する生成部と、
生成された前記MPDを、デジタル放送の放送波又は通信網を介して送信する送信部と
を備える送信装置。
(20)
送信装置の送信方法において、
前記送信装置が、
MPEG-DASHの規格に準拠したMPDとして、選択及び構造化を行うための複数のレイヤ構造を有するコンポーネントの選択及び構造化の少なくとも一方を行い、1又は複数のコンポーネントにより構成されるコンテンツの再生を制御することが可能な情報と、前記複数のレイヤ構造に関する規定の枠外で、AdaptationSet要素の組を指定する第1の要素を少なくとも含む前記MPDを生成し、
生成された前記MPDを、デジタル放送の放送波又は通信網を介して送信する
ステップを含む送信方法。
1 放送通信システム, 10 チャンネルストリーマ, 20 MPD提供装置, 30 DASHセグメンタ・ストリーマ, 50 クライアント装置, 90 ネットワーク, 101 コンテンツ管理部, 102 コンテンツ蓄積部, 103 通信部, 201 MPD生成部, 202 通信部, 203 送信部, 301 セグメントデータ生成部, 302 セグメントメタデータ生成部, 303 通信部, 304 送信部, 501 制御部, 502 受信部, 503 ディスプレイ, 504 スピーカ, 505 記録部, 506 通信部, 551 MPD取得部, 552 コンポーネント選択部, 553 セグメントデータ取得部, 554 セグメントデータ再生部, 900 コンピュータ, 901 CPU

Claims (8)

  1. 複数のAdaptationSet要素が関連付けられることを示す第1の情報と、前記第1の情報により関連付けられた前記複数のAdaptationSet要素が選択対象である同一のグループに属していることを示す第2の情報とを含むMPD(Media Presentation Description)を受信する受信部を備える
    情報処理装置。
  2. 前記複数のAdaptationSet要素ごとに、1又は複数のコンポーネントが列挙され、
    前記1又は複数のコンポーネントには、1又は複数のオーディオコンポーネントが含まれる
    請求項1に記載の情報処理装置。
  3. 前記1又は複数のコンポーネントは、前記AdaptationSet要素の配下の1又は複数のRepresentation要素に列挙される
    請求項2に記載の情報処理装置。
  4. 前記第1の情報及び前記第2の情報は、前記MPDのPeriod要素内に記述される要素の属性として指定される
    請求項1に記載の情報処理装置。
  5. 前記要素は、前記Period要素内で、前記複数のAdaptationSet要素と同一のレベルで記述される
    請求項4に記載の情報処理装置。
  6. 受信された前記MPDに基づいて、前記1又は複数のコンポーネントにより構成されるコンテンツの再生を制御する制御部をさらに備える
    請求項2に記載の情報処理装置。
  7. 情報処理装置の情報処理方法において、
    前記情報処理装置が、
    複数のAdaptationSet要素が関連付けられることを示す第1の情報と、前記第1の情報により関連付けられた前記複数のAdaptationSet要素が選択対象である同一のグループに属していることを示す第2の情報とを含むMPD(Media Presentation Description)を受信するステップを含む
    情報処理方法。
  8. コンピュータを、
    複数のAdaptationSet要素が関連付けられることを示す第1の情報と、前記第1の情報により関連付けられた前記複数のAdaptationSet要素が選択対象である同一のグループに属していることを示す第2の情報とを含むMPD(Media Presentation Description)を受信する受信部
    として機能させるためのプログラム。
JP2018089017A 2018-05-07 2018-05-07 情報処理装置、情報処理方法、及び、プログラム Expired - Fee Related JP6471922B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018089017A JP6471922B2 (ja) 2018-05-07 2018-05-07 情報処理装置、情報処理方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018089017A JP6471922B2 (ja) 2018-05-07 2018-05-07 情報処理装置、情報処理方法、及び、プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014078033A Division JP6340882B2 (ja) 2014-04-04 2014-04-04 情報処理装置、情報処理方法、及び、プログラム

Publications (2)

Publication Number Publication Date
JP2018148570A true JP2018148570A (ja) 2018-09-20
JP6471922B2 JP6471922B2 (ja) 2019-02-20

Family

ID=63591735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018089017A Expired - Fee Related JP6471922B2 (ja) 2018-05-07 2018-05-07 情報処理装置、情報処理方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP6471922B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020153744A1 (ko) * 2019-01-22 2020-07-30 엘지전자 주식회사 방송 신호 송신 방법, 방송 신호 송신 장치, 방송 신호 수신 방법 및 방송 신호 수신 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ISO/IEC FDIS 23009-1:2013(E), JPN6018051319, 27 November 2013 (2013-11-27), pages pp.25-32,44-45 *
TRUONG CONG THANG ET AL.: "Adaptive streaming of audiovisual content using MPEG DASH", IEEE TRANSACTIONS ON CONSUMER ELECTRONICS, vol. Volume: 58 , Issue: 1 , February 2012, JPN6018051318, 19 March 2012 (2012-03-19), pages 78 - 85 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020153744A1 (ko) * 2019-01-22 2020-07-30 엘지전자 주식회사 방송 신호 송신 방법, 방송 신호 송신 장치, 방송 신호 수신 방법 및 방송 신호 수신 장치

Also Published As

Publication number Publication date
JP6471922B2 (ja) 2019-02-20

Similar Documents

Publication Publication Date Title
RU2636123C2 (ru) Устройство предоставления содержания, способ предоставления содержания, программа и система предоставления содержания
JP6630860B2 (ja) 端末装置および受信方法
KR20160077066A (ko) 송신 장치, 송신 방법, 수신 장치, 및 수신 방법
EP3422702A1 (en) File generation device, file generation method, reproduction device, and reproduction method
EP3422731A1 (en) File generation device, file generation method, reproduction device, and reproduction method
US20060036757A1 (en) Multimedia content display system having scheduling function and method of reproducing content using the system
CN101765999A (zh) 控制通用即插即用设备以在其屏幕上的多个再现区域中再现内容的formtext方法和装置
KR20160077067A (ko) 송신 장치, 송신 방법, 수신 장치, 및 수신 방법
JP6471922B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
WO2014203745A1 (ja) コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム
JP6340882B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP6610538B2 (ja) 受信装置、受信方法、送信装置、及び、送信方法
JP2014239291A (ja) コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム
CA2925455A1 (en) Content supplying apparatus, content supplying method, program, terminal device, and content supplying system
WO2017212931A1 (ja) 受信装置および受信方法、再生装置および再生方法、供給装置および供給方法、並びにプログラム
WO2015012140A1 (ja) コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190109

R151 Written notification of patent or utility model registration

Ref document number: 6471922

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees