WO2016084591A1

WO2016084591A1 - 送信装置、送信方法、受信装置および受信方法

Info

Publication number: WO2016084591A1
Application number: PCT/JP2015/081523
Authority: WO
Inventors: 北里　直久; 山岸　靖明; 淳北原
Original assignee: ソニー株式会社
Priority date: 2014-11-26
Filing date: 2015-11-09
Publication date: 2016-06-02
Also published as: EP3226566A1; CA2967245A1; US20170325000A1; EP3226566B1; EP3226566A4; CA2967245C; JPWO2016084591A1; KR20170087868A; MX2017006579A; US20210058680A1; BR112017010575A2; KR102390622B1; US10869099B2; US11678022B2; JP6743704B2

Abstract

　受信側におけるコンポーネント選択の容易性を確保する。　所定のコンポーネントを含む第１の伝送パケットと、この所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを所定の伝送路を通じて送信する。第２の伝送パケットに、コンポーネント選択情報を挿入する。このコンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成されている。アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされる。

Description

送信装置、送信方法、受信装置および受信方法

　本技術は、送信装置、送信方法、受信装置および受信方法に関し、詳しくは、放送・通信のハイブリッドシステムに適用して好適な送信装置等に関する。

　現在の放送システムでは、メディアのトランスポート方式として、ＭＰＥＧ－２　ＴＳ(Moving Picture Experts Group-2 Transport Stream）方式やＲＴＰ（Real Time Protocol）方式が広く使用されている（例えば、特許文献１を参照）。次世代のデジタル放送方式として、ＭＭＴ（MPEG Media Transport）方式（例えば、非特許文献１参照）が検討されている。

特開２０１３－１５３２９１号公報

ISO/IEC DIS 23008-1:2013(E) Information technology-High efficiency coding and media delivery in heterogeneous environments-Part1:MPEG media transport(MMT)

　本技術の目的は、例えば、放送・通信のハイブリッドシステムにおいて、受信側におけるコンポーネント選択の容易性を確保することにある。

　本技術の概念は、
　所定のコンポーネントを含む第１の伝送パケットと、上記所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを生成する伝送ストリーム生成部と、
　上記伝送ストリームを所定の伝送路を通じて送信する送信部と、
　上記第２の伝送パケットに、コンポーネント選択情報を挿入する情報挿入部を備え、
　上記コンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成され、
　上記アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、
　上記アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされる
　送信装置にある。

　本技術において、伝送ストリーム生成部により、所定のコンポーネントを含む第１の伝送パケットと、この所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームが生成される。送信部により、この伝送ストリームが、所定の伝送路を通じて、受信側に送信される。例えば、所定の伝送路は、放送伝送路である、ようにされてもよい。

　情報挿入部により、第２の伝送パケットに、コンポーネント選択情報が挿入される。このコンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成される。そして、アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされる。

　例えば、伝送パケットは、ＭＭＴパケットであり、コンポーネント選択情報は、ＭＰＴに含まれている、ようにされてもよい。この場合、例えば、アダプティブストリーミングのためのデータストリームは、ＭＰＥＧ－ＤＡＳＨベースのデータストリームであり、メタファイルは、ＭＰＤファイルであり、メタファイルの特定の情報位置を指定する情報は、特定のアダプテーションセットあるいは特定のリプレゼンテーションを指定する情報とされる、ようにされてもよい。

　このように本技術においては、第２の伝送パケットに、３レイヤのコンポーネント選択情報が挿入されるものである。そして、アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされる。そのため、例えば放送・通信のハイブリッドシステムにおいて、受信側におけるコンポーネント選択、特にアダプティブレイヤでのコンポーネント選択の容易性を確保することが可能となる。

　また、本技術の他の概念は、
　所定のコンポーネントを含む第１の伝送パケットと、上記所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを、所定の伝送路を通じて受信する受信部を備え、
　上記第２の伝送パケットには、コンポーネント選択情報が挿入されており、
　上記コンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成されており、
　上記アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、
　上記アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされており、
　上記コンポーネント選択情報に基づいて提示すべきコンポーネントを選択するコンポーネント選択部をさらに備える
　受信装置にある。

　本技術において、受信部により、所定の伝送路を通じて、伝送ストリームが受信される。この伝送ストリームには、所定のコンポーネントを含む第１の伝送パケットと、この所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化されている。例えば、第１の伝送路は放送伝送路である、ようにされてもよい。

　第２の伝送パケットには、コンポーネント選択情報が挿入されている。このコンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成されている。そして、アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされている。

　コンポーネント選択部により、コンポーネント選択情報に基づいて提示すべきコンポーネントが選択される。この場合、例えば、アダプティブ切り替えの対象となっているコンポーネントの切り替えはメタファイルに基づいて行われる。

　例えば、伝送パケットは、ＭＭＴパケットであり、各コンポーネントの選択情報は、ＭＰＴに含まれている、ようにされてもよい。この場合、例えば、アダプティブストリーミングのためのデータストリームは、ＭＰＥＧ－ＤＡＳＨベースのデータストリームであり、メタファイルは、ＭＰＤファイルであり、メタファイルの特定の情報位置を指定する情報は、特定のアダプテーションセットあるいは特定のリプレゼンテーションを指定する情報とされている、ようにされてもよい。

　このように本技術においては、第２の伝送パケットに、３レイヤのコンポーネント選択情報が挿入されているものである。そして、アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされている。そのため、例えば放送・通信のハイブリッドシステムにおいて、コンポーネント選択、特にアダプティブレイヤでのコンポーネント選択の容易性を確保することが可能となる。

　なお、本技術において、例えば、メタファイルを取得するメタファイル取得部をさらに備える、ようにされてもよい。この場合、例えば、メタファイルは、放送伝送路あるいは通信伝送路のいずれかを通じて取得される。また、本技術において、コンポーネント選択部は、コンポーネント選択情報にユーザに選択させるべき特定の属性に関するバリエーションが存在する場合、画面上に選択のグラフィクスユーザインタフェースを表示する、ようにされてもよい。

　本技術によれば、例えば放送・通信のハイブリッドシステムにおいて、受信側におけるコンポーネント選択の容易性を確保できる。なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。

実施の形態としての放送・通信ハイブリッドシステムの構成例を示すブロック図である。ＭＭＴ/放送の信号構成例のスタックモデルを示す図である。ＭＭＴ方式放送ストリームの構成例を示す図である。ＭＭＴパケットの構成例とＭＭＴＰペイロード（MMTP payload）の構成例を示す図である。一つのＧＯＰのビデオデータを送るときのＭＭＴファイル（MMT file）とＭＭＴＰペイロード（MMTP payload）との対応関係の一例を示す図である。放送送出システムから受信端末に送信される１つのチャンネル（放送番組）の放送信号のイメージを示す図である。ＭＰＤファイルの階層構造を示す図である。ＭＰＤファイルに含まれる各構造体の一例を時間軸上に並べて示した図である。ＭＰＤファイルに階層的に配置されている各構造体の関係の一例を示す図である。ＭＭＴ/通信の信号構成例のスタックモデルを示す図である。ＰＡメッセージ（Package Access Message）およびＭＰテーブル（ＭＰＴ：MMT Package Table）の構成例を概略的に示す図である。ＰＡメッセージの主要なパラメータの説明を示す図である。ＭＰテーブルの主要なパラメータの説明を示す図である。ＰＡメッセージの構造例（Syntax）を示す図である。ＭＰテーブル（ＭＰＴ）の構造例（Syntax）を示す図である。「MMT_general_location_info()」の構造例（Syntax）の一部を示す図である。受信端末のハイブリッド配信における処理フローを示す図である。コンポーネントレイヤモデルの一例を示す図である。ＭＰＴのコンポーネント選択情報とＭＰＤファイルを説明するための図である。アセット取得先情報としてのＭＰＤファイルの特定の情報位置の指定について説明するための図である。放送・通信ハイブリッドシステムで想定される信号構成の一例を示す図である。ＭＰＴの対応するアセットでＭＰＤファイルの特定のリプレゼンテーションの情報位置を指定する場合におけるＭＰＴとＭＰＤファイルの構成例を概略的に示す図である。ＭＰＴの対応するアセットでＭＰＤファイルの特定のアダプテーションセットの情報位置を指定する場合におけるＭＰＴとＭＰＤファイルの構成例を概略的に示す図である。ビュー記述子の構造例を示す図である。合成コンポーネントタイプ記述子の構造例を示す図である。アセットグループ記述子の構造例を示す図である。依存関係記述子の構造例を示す図である。映像コンポーネント記述子の構造例を示す図である。音声コンポーネント記述子の構造例を示す図である。対象デバイス記述子の構造例を示す図である。対象地域記述子の構造例を示す図である。パレンタルレート記述子の構造例を示す図である。放送・通信ハイブリッドシステムを構成する放送送出システムの構成例を示すブロック図である。放送・通信ハイブリッドシステムを構成する受信端末の構成例を示すブロック図である。コンポーネント選択ＧＵＩの一例を示す図である。受信端末におけるコンポーネント選択・取得プロセスのユースケース（マルチビュー）を説明するための図である。マルチビューの例に対応したコンポーネントレイヤモデルを示す図である。マルチビューの例に対応したＭＰＴとＭＰＤファイルの記載例を概略的に示す図である。受信端末のビュー表示変更の一例を説明するための図である。

　以下、発明を実施するための形態（以下、「実施の形態」とする）について説明する。なお、説明を以下の順序で行う。
　１．実施の形態
　２．変形例

　＜１．実施の形態＞
　［放送・通信ハイブリッドシステムの構成例］
　図１は、放送・通信ハイブリッドシステム１０の構成例を示している。放送・通信ハイブリッドシステム１０において、送信側には放送送出システム１００、配信サーバ３００およびＤＡＳＨセグメントサーバ４００が配置され、受信側には受信端末２００が配置されている。配信サーバ３００およびＤＡＳＨセグメントサーバ４００は、通信ネットワーク５００を通じて受信端末２００に接続される。

　放送送出システム１００は、ビデオ、オーディオ、キャプションなどのコンポーネント（アセット）を伝送メディアとして含むＩＰ（Internet Protocol）方式の放送信号を送信する。配信サーバ３００は、ビデオ、オーディオなどのコンポーネント（アセット）を伝送メディアとして含むＩＰパケットが連続的に配置された伝送ストリームを、受信側からの要求に応じ、通信ネットワーク５００を通じて、受信側に送る。

　ＤＡＳＨセグメントサーバ４００は、ビデオ、オーディオなどのＤＡＳＨ（Dynamic Adaptive Streaming over HTTP）仕様のストリームセグメント（以下、「ＤＡＳＨセグメント」という）を、受信側からの要求に応じ、通信ネットワーク５００を通じて、受信側に送る。すなわち、ＤＡＳＨセグメントサーバ４００は、受信側から送られてくる所定ストリームのセグメントの要求に対応して、そのストリームのセグメントを含むＩＰパケットを、通信ネットワーク５００を通じて、要求元に送信する。

　受信端末２００は、放送送出システム１００から送られてくるＩＰ方式の放送信号を受信すると共に、配信サーバ３００やＤＡＳＨセグメントサーバ４００からＩＰパケットが連続的に配置された伝送ストリームを受信する。受信端末２００は、このような放送・通信のハイブリッド伝送による受信信号から、提示すべきビデオ、オーディオなどの伝送メディア（コンポーネント）を取得し、画像、音声などを提示する。

　図２は、放送送出システム１００からの放送に係るＭＭＴ/放送の信号構成例のスタックモデルを示している。下位レイヤにＴＬＶ（Type Length Value）の伝送パケットが存在する。このＴＬＶの伝送パケットの上にＩＰパケットが載る。なお、伝送制御信号がシグナリング（Signaling）情報として載ったＴＬＶ伝送パケットも存在する。

　ＩＰパケットの上に、ＵＤＰ（User Datagram Protocol）が載る。そして、ＵＤＰの上に、多重化トランスポートパケットとしてのＭＭＴ（MPEG Media Transport）パケットが載る。このＭＭＴパケットのペイロード部には、ビデオ、オーディオ、キャプション等のコンポーネントの符号化データを含むＭＦＵ（MMT Fragment Unit）、あるいは伝送メディアに関する情報を含むシグナリングメッセージ（Signaling Message）が含まれる。なお、ＩＰパケットには、ＵＤＰの上に時刻情報を含むＮＴＰ（Network Time Protocol）パケットが載ったＩＰパケットも存在する。

　図３は、ＭＭＴ方式放送ストリームの構成例を示している。図３（ａ）は、ビデオのエレメンタリストリーム（Video ES）を示している。このビデオのエレメンタリストリームは、所定の大きさの固まりに分割され、図３（ｂ）に示すように、ＭＦＵのペイロード部に配置される。

　図３（ｃ）に示すように、ＭＦＵにＭＭＴペイロードヘッダ（MMT payload header）が付加されてＭＭＴＰペイロード（MMTP payload）が構成される。そして、図３（ｄ）に示すように、このＭＭＴＰペイロードにさらにＭＭＴヘッダ（MMT header）が付加されて、ＭＭＴパケット（MMT packet）が構成される。なお、ペイロード部に、シグナリングメッセージ（Signaling Message）を含むＭＭＴパケットも存在する。図３（ｅ）に示すように、ＭＭＴパケットに、ＵＤＰヘッダ、ＩＰヘッダおよびＴＬＶヘッダが付加されて、ＭＭＴ方式放送ストリームを構成するＴＬＶパケット(TLV packet)が生成される。

　なお、図示は省略されているが、ＴＬＶパケットとしては、さらに、オーディオ、キャプションなどのその他のコンポーネントのＭＭＴパケットを含むＴＬＶパケットも存在する。このＭＭＴ方式放送ストリームは、伝送メディア（コンポーネント）を含む第１のパケット（ＭＭＴパケット）と、シグナリング情報を含む第２のパケット（ＭＭＴパケット）を持つものとなる。

　図４（ａ）は、ＭＭＴパケットの構成例を示している。ＭＭＴパケットは、ＭＭＴパケットヘッダ（MMTP header）と、ＭＭＴＰペイロード（MMTP payload）とからなる。「V」の２ビットフィールドは、ＭＭＴプロトコルのバージョンを示す。ＭＭＴ規格第１版に従う場合、このフィールドは“００”とされる。「C」の１ビットフィールドは、パケットカウンタフラグ（packet_counter_flag）情報を示し、パケットカウンタフラグが存在する場合は“１”となる。「FEC」の２ビットフィールドは、ＦＥＣタイプ（FEC_type）を示す。

　「X」の１ビットフィールドは、拡張ヘッダフラグ（extension_flag）情報を示し、ＭＭＴパケットのヘッダ拡張を行う場合は“１”とされる。この場合、後述する「header_extension」のフィールドが存在する。「R」の１ビットフィールドは、ＲＡＰフラグ（RAP_flag）情報を示し、このＭＭＴパケットが伝送するＭＭＴペイロードがランダムアクセスポイントの先頭を含む場合は“１”とされる。

　「type」の６ビットフィールドは、ペイロードタイプ（payload_type）情報であり、ＭＭＴＰペイロードのデータタイプを示す。例えば、「０ｘ００」はペイロードがＭＰＵ（Media Processing Unit）であることを示し、「０ｘ０２」はペイロードがシグナリングメッセージ（Signaling message）であることを示す。

　「packet_id」の１６ビットフィールドは、ペイロードのデータ種類を識別するためのパケット識別子（packet_id）を示す。「timestamp」の３２ビットフィールドは、伝送のためのタイプスタンプ、すなわちＭＭＴパケットが送信側から出ていくときの時刻を示す。この時刻は、ＮＴＰショートフォーマット（NTP short format）で表される。「packet_sequence_number」の３２ビットフィールドは、同一のパケット識別子（packet_id）を持つＭＭＴパケットのシーケンス番号を示す。「packet_counter」の３２ビットフィールドは、パケット識別子（packet_id）の値に関係なく、同一のＩＰデータフローにおけるＭＭＴパケットの順序を示す。

　上述の「X」の１ビットフラグ情報が「１」であるとき、「packet_counter」の３２ビットフィールドの後に、ＭＭＴ拡張ヘッダである「header_extension」のフィールドが配置される。その後に、ＭＭＴＰペイロード（MMTP payload）を構成する「payload data」のフィールドおよび「source_FEC_payload_ID」のフィールドが存在する。

　図４（ｂ）は、上述のＭＭＴパケットの「payload data」のフィールドに配置されるＭＭＴＰペイロード（MMTP payload）の構成例(Syntax)を示している。なお、この例は、ＭＭＴヘッダの「type」が「０ｘ００」であるＭＰＵモードである場合を示している。最初にヘッダ情報が存在する。「length」の１６ビットフィールドは、ＭＭＴＰペイロード全体のバイトサイズを示す。“FT”の４ビットフィールドは、フィールドタイプを示す。 “０”は「MPU metadata」を含むことを示し、“１”は「Movie Fragment metadata」を含むことを示し、“２”は「ＭＦＵ」を含むことを示す。

　ここで、ＭＦＵ（MMT Fragment Unit）は、ＭＰＵが細分化、すなわちフラグメント（Fragment）化されたものである。例えば、ビデオの場合、このＭＦＵを一つのＮＡＬユニットに相当するように設定できる。また、例えば、通信ネットワーク伝送路で送る場合、このＭＦＵを一つまたは複数のＭＴＵサイズ（MTU size）で構成することもできる。

　また、ＭＰＵは、ランダムアクセスポイント（ＲＡＰ：Random Access Pint）から始まるものであり、１つまたは複数のアクセスユニット（ＡＵ：Access Unit）を含むものである。具体的には、例えば、１つのＧＯＰ（Group Of Picture）のピクチャが、一つのＭＰＵの構成となることがある。このＭＰＵは、アセット別（コンポーネント別）に定義されるものとなっている。したがって、ビデオのアセットからはビデオデータのみを含むビデオのＭＰＵが作成され、オーディオのアセットからはオーディオデータのみを含むオーディオのＭＰＵが作成される。

　「T」の１ビットフラグ情報は、タイムドメディア（Timed Media）を伝送するか、ノンタイムドメディア（Non-Timed Media）を伝送するかを示す。“１”はタイムドメディアを示し、“０”はノンタイムドメディアを示す。

　「f_i」の２ビットフィールドは、「DU payload」のフィールドに、整数個のデータユニット（ＤＵ：Data Unit）が入っているか、データユニットが断片化されて得られたフラグメント（Fragment）の最初（first）、中間、最後（last）のいずれが入っているかを示す。“０”は整数個のデータユニットが入っていることを示し、“１”は最初のフラグメントが入っていることを示し、“２”は中間のフラグメントが入っていることを示し、“３”は最後のフラグメントが入っていることを示す。

　「A」の１ビットフラグ情報は、「DU payload」のフィールドに、複数個のデータユニットが入っているか否かを示す。“１”は入っていることを示し、“０”は入っていないことを示す。「frag_counter」の８ビットフィールドは、「f_i」が１～３であるとき、何番目のフラグメントであるかを示す。

　「MPU_sequence_number」の３２ビットフィールドは、ＭＰＵの順番を示す番号であり、ＭＰＵを識別する情報である。例えば、１つのＧＯＰが１つのＭＰＵを構成する場合、あるＧＯＰの「MPU_sequence_number」が「ｉ」であるとき、次のＧＯＰの「MPU_sequence_number」は「ｉ＋１」となる。

　この「MPU_sequence_number」のフィールドの後に、「DU_length」、「DU_header」、「DU_payload」の各フィールドが配置される。「DU_length」の１６ビットフィールドは、上述の「A=0」である場合、つまり「DU payload」のフィールドに複数個のデータユニットが入っていない場合は存在しない。また、「DU_header」のフィールドは、“FT=0/1”である場合、つまり「MPU metadata」や「Movie Fragment metadata」を含む場合は存在しない。

　ＭＭＴ方式では、ビデオなどの伝送メディアを、フラグメント化されたＩＳＯＢＭＦＦ（ISO Base Media File Format）に基づいたコンテンツフォーマットで伝送する。図５は、一つのＧＯＰのビデオデータを送るときのＭＭＴファイル（MMT file）とＭＭＴＰペイロード（MMTP payload）との対応関係の一例を示している。

　ＭＭＴファイルの構成は、基本的には、ＭＰ４のファイル構成とほぼ同等である。最初に“ftyp”のボックス（Box）がある。続いて、ＭＭＴ独自の“mmpu”のボックスがある。続いて、ファイル全体のメタデータとしての“moov”のボックスがある。続いて、ムービーフラグメント（Movie Fragment）がある。このムービーフラグメントは、制御情報が入る“moof”ボックスと、ビデオの符号化データが入る“mdat”ボックスからなる。ここでは、一つのＧＯＰが一つのＭＰＵの構成となることを想定しているので、ムービーフラグメントは一組だけ存在する。

　“ftyp”，“mmpu”，“moov”の各ボックスのメタデータは、「MPU metadata」として、一つのＭＭＴパケットで伝送される。この場合、“FT=0”である。“moof”ボックスのメタデータは、「Movie Fragment metadata」として、一つのＭＭＴパケットで伝送される。この場合、“FT=1”である。“mdat”ボックスに含まれるビデオの符号化データは、「ＭＦＵ」に断片化され、それぞれが一つのＭＭＴパケットで伝送される。この場合、“FT=2”である。

　図６は、放送送出システム１００から受信端末２００に送信される１つのチャンネル（１つの放送番組）に係る放送信号のイメージの一例を示している。この放送信号には、ビデオ、オーディオなどのＭＭＴパケットと共に、シグナリングメッセージを含むＭＭＴパケットも含まれる。シグナリングメッセージとして、例えば、ＰＡメッセージ（PA message）、ＭＰＩメッセージ（MPI message）などが存在する。

　ＰＡメッセージには、ＭＰテーブル（ＭＰＴ）などの各種テーブルが含まれる。ＭＰＩメッセージには、ＭＰＤ（Media Presentation Description）ファイルそのもの、あるいはＭＰＤファイルを取得するための取得先情報としてのＵＲＬ（Uniform Resource Locator）などが含まれる。このＭＰＤファイルには、上述したＤＡＳＨセグメントサーバ４００から配信されるビデオ、オーディオなどのコンポーネント（アセット）を管理するメタデータが記述されている。このＭＰＤファイルは、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルを構成している。

　ＭＰＤのフォーマットでは、ビデオやオーディオなどのそれぞれのストリーム毎にリプレゼンテーション（Representation）という要素を利用して、それぞれの属性が記述される。例えば、ＭＰＤファイルには、レートの異なる複数のビデオデータストリーム毎に、リプレゼンテーションを分けてそれぞれのレートが記述される。受信側では、そのレートの値を参考にして、ネットワーク環境の状態に応じて、最適なストリームを選択できる。

　ＭＰＤファイルは、図７に示すように、階層構造をとる。このＭＰＤファイルには、ＤＡＳＨセグメントサーバ４００に格納した動画の圧縮方式や符号化速度、画像サイズ、言語などの情報がＸＭＬ形式で階層的に記述される。このＭＰＤファイルには、ピリオド（Period）、アダプテーションセット（AdaptationSet）、リプレゼンテーション（Representation）、セグメントインフォ（SegmentInfo）、イニシャライゼーション・セグメント（Initialization Segment）、メディア・セグメント（Media Segment）などの構造体が、階層的に含まれている。

　ピリオドの構造体は、プログラム（同期を取った１組のビデオやオーディオ等のデータ）の情報を持つ。また、ピリオドの構造体に含まれるアダプテーションセットの構造体は、ストリームの選択範囲（リプレゼンテーション群）をグルーピングする。また、アダプテーションセットの構造体に含まれるリプレゼンテーションの構造体は、ビデオやオーディオの符号化速度、ビデオの画像サイズなどの情報を持つ。

　また、リプレゼンテーションの構造体に含まれるセグメントインフォの構造体は、ビデオやオーディオのセグメント関連の情報を持つ。また、セグメントインフォの構造体に含まれるイニシャライゼーション・セグメントの構造体は、データ圧縮方式などの初期化情報を持つ。また、セグメントインフォの構造体に含まれるメディア・セグメントの構造体は、ビデオやオーディオのセグメントを取得するアドレスなどの情報を持つ。

　図８は、上述のＭＰＤファイルに含まれる各構造体の一例を時間軸上に並べて示したものである。この例においては、ＭＰＤファイルにピリオドが２個含まれ、各ピリオドにセグメントが２個含まれている。また、この例においては、各ピリオドにアダプテーションセットが２個含まれ、各アダプテーションセットにストリーム属性の異なる同一内容のストリームに係るリプレゼンテーションが２個含まれている。

　図９は、ＭＰＤファイルに階層的に配置されている各構造体の関係の一例を示している。図９（ａ）に示すように、ＭＰＤファイル全体としてのメディア・プレゼンテーション（Media Presentation）には、時間間隔で区切られた複数のピリオド（Period）が存在する。例えば、最初のピリオドはスタートが０秒から、次のピリオドはスタートが１００秒から、などとなっている。

　図９（ｂ）に示すように、ピリオドには、複数のアダプテーションセット(AdaptationSet)が存在する。各アダプテーションセットはビデオやオーディオ等のメディアタイプの違いや、同じメディアタイプでも言語の違い、視点の違い等に依存する。図９（ｃ）に示すように、アダプテーションセットには複数のリプレゼンテーション(Representation)が存在する。各リプレゼンテーションはストリーム属性、例えばレートの違い等に依存する。

　図９（ｄ）に示すように、リプレゼンテーションには、セグメントインフォ（SegmentInfo）が含まれている。このセグメントインフォには、図９（e）に示すように、イニシャライゼーション・セグメント（Initialization Segment）と、ピリオドをさらに細かく区切ったセグメント（Segment）毎の情報が記述される複数のメディア・セグメント（Media Segment）が存在する。メディア・セグメントには、ビデオやオーディオなどのセグメントデータを実際に取得するためのアドレス(url)の情報等が存在する。

　なお、アダプテーションセットに含まれる複数のリプレゼンテーションの間では、ストリームのスイッチングを自由に行うことができる。これにより、受信側のネットワーク環境の状態に応じて、最適なレートのストリームを選択でき、途切れのないビデオ配信が可能となる。

　図１０は、配信サーバ３００からの配信に係るＭＭＴ/通信の信号構成例のスタックモデルを示している。ＭＭＴ/通信による配信オプションとして、（Ａ）マルチキャスト配信、（Ｂ）ＭＭＴＰ/ＵＤＰ配信、（Ｃ）ＭＭＴＰ/ＴＣＰ配信、（Ｄ）ＭＭＴＰ/ＨＴＴＰ配信、（Ｅ）ＭＰＵ/ＨＴＴＰ配信が考えられる。

　「（Ａ）マルチキャスト配信」
　マルチキャスト配信の場合、下位レイヤにＩＰパケットが存在する。このＩＰパケットの上に、ＵＤＰ（User Datagram Protocol）が載る。そして、ＵＤＰの上に、ＭＭＴ（MPEG Media Transport）パケットが載る。このＭＭＴパケットのペイロード部には、ビデオ、オーディオ等のコンポーネントの符号化データを含むＭＰＵが含まれる。

　このマルチキャスト配信の場合、放送・通信ハイブリッド利用としては、輻輳対応を考慮すると最も望ましい方式である。また、このマルチキャスト配信の場合、ＵＤＰ伝送なので、伝送効率はよいが、パケットロスの問題があるので、ＡＬ－ＦＥＣ（Application Layer-Forward Error Correction）を必要とする可能性がある。

　また、このマルチキャスト配信の場合、マネージドネットワーク（Managed Network）に直接接続されている受信端末のみが利用可能となる。また、このマルチキャスト配信の場合、マルチキャストＩＰストリームが、複数のアセット（コンポーネント）が多重化されたＭＭＴＰストリームを伝送するケースと、単体のアセットのみを含むＭＭＴＰストリームを伝送するケースとがある。

　「（Ｂ）ＭＭＴＰ/ＵＤＰ配信」
　ＭＭＴＰ/ＵＤＰ配信の場合、下位レイヤにＩＰパケットが存在する。このＩＰパケットの上に、ＵＤＰ（User Datagram Protocol）が載る。そして、ＵＤＰの上に、ＭＭＴパケットが載る。このＭＭＴパケットのペイロード部には、ビデオ、オーディオ等のコンポーネントの符号化データを含むＭＰＵが含まれる。

　このＭＭＴＰ/ＵＤＰ配信の場合、ユニキャスト（Unicast）なので、放送・通信ハイブリッド利用としては、輻輳の問題がある。また、このＭＭＴＰ/ＵＤＰ配信の場合、ＵＤＰ伝送なので、伝送効率はよいが、ＡＬ－ＦＥＣを必要とする可能性がある。また、マルチキャスト配信の場合、トータル遅延や同期の面では、ＴＣＰに比べると良好である。

　また、このＭＭＴＰ/ＵＤＰ配信の場合、ユニキャストなので、広く一般のインターネット接続機器で利用可能となり得るが、ルータ設定によってはデフォルトでは利用できない可能性がある。このＭＭＴＰ/ＵＤＰ配信の場合、ＩＰストリームが、複数のアセット（コンポーネント）が多重化されたＭＭＴＰストリームを伝送するケースと、単体のアセットのみを含むＭＭＴＰストリームを伝送するケースとがある。

　「（Ｃ）ＭＭＴＰ/ＴＣＰ配信」
　ＭＭＴＰ/ＴＣＰ配信の場合、下位レイヤにＩＰパケットが存在する。このＩＰパケットの上に、ＴＣＰ（Transmission Control Protocol）が載る。そして、ＴＣＰの上に、ＭＭＴパケットが載る。このＭＭＴパケットのペイロード部には、ビデオ、オーディオ等のコンポーネントの符号化データを含むＭＰＵが含まれる。

　このＭＭＴＰ/ＴＣＰ配信の場合、ユニキャストなので、広く一般のインターネット接続機器で利用可能となり得る。また、このＭＭＴＰ/ＴＣＰ配信の場合、ユニキャストなので、放送・通信ハイブリッド利用としては、輻輳の問題がある。また、このＭＭＴＰ/ＴＣＰ配信の場合、ＴＣＰ伝送なので効率は犠牲となるが、再送が可能なので、ＡＬ－ＦＥＣは不要となる。

　また、このＭＭＴＰ/ＴＣＰ配信の場合、ＩＰストリームが、複数のアセット（コンポーネント）が多重化されたＭＭＴＰストリームを伝送するケースと、単体のアセットのみを含むＭＭＴＰストリームを伝送するケースとがある。

　「（Ｄ）ＭＭＴＰ/ＨＴＴＰ配信」
　ＭＭＴＰ/ＨＴＴＰ配信の場合、下位レイヤにＩＰパケットが存在する。このＩＰパケットの上に、ＴＣＰが載る。そして、ＴＣＰの上に、ＨＴＴＰ（Hyper Text Transfer Protocol）が載り、さらにその上にＭＭＴパケットが載る。このＭＭＴパケットのペイロード部には、ビデオ、オーディオ等のコンポーネントの符号化データを含むＭＰＵが含まれる。

　このＭＭＴＰ/ＨＴＴＰ配信の場合、ＨＴＴＰなので、広く一般のインターネット接続機器で利用可能となり得る。また、このＭＭＴＰ/ＨＴＴＰ配信の場合、ユニキャストなので、放送・通信ハイブリッド利用としては、輻輳の問題がある。また、このＭＭＴＰ/ＨＴＴＰ配信の場合、ＴＣＰ伝送なので効率は犠牲となるが、再送が可能なので、ＡＬ－ＦＥＣは不要となる。

　また、このＭＭＴＰ/ＨＴＴＰ配信の場合、ＩＰストリームが、複数のアセット（コンポーネント）が多重化されたＭＭＴＰストリームを伝送するケースと、単体のアセットのみを含むＭＭＴＰストリームを伝送するケースとがある。

　「（Ｅ）ＭＰＵ/ＨＴＴＰ配信」
　ＭＰＵ/ＨＴＴＰ配信の場合、下位レイヤにＩＰパケットが存在する。このＩＰパケットの上に、ＴＣＰが載る。そして、ＴＣＰの上に、ＨＴＴＰが載り、このＨＴＴＰパケットのペイロード部には、ビデオ、オーディオ等のコンポーネントの符号化データを含むＭＰＵが含まれる。

　このＭＰＵ/ＨＴＴＰ配信の場合、ＨＴＴＰなので、広く一般のインターネット接続機器で利用可能となり得る。また、このＭＰＵ/ＨＴＴＰ配信の場合、ユニキャストなので、放送・通信ハイブリッド利用としては、輻輳の問題がある。また、このＭＰＵ/ＨＴＴＰ配信の場合、ＴＣＰ伝送なので効率は犠牲となるが、再送が可能なので、ＡＬ－ＦＥＣは不要となる。

　また、このＭＰＵ/ＨＴＴＰ配信の場合、ＭＭＴパケットが介在しないのでＭＭＴＰ/ＨＴＴＰ配信に比べて伝送効率は良くなるが、逆にＭＭＴＰヘッダ等の情報が消失する課題がある。また、このＭＰＵ/ＨＴＴＰ配信の場合、受信端末は、ＨＴＴＰにより、単一のアセット（コンポーネント）の個々のＭＰＵファイルを取得するものとなる。

　図１１は、ＰＡメッセージ（Package Access Message）およびＭＰテーブル（ＭＰＴ：MMT Package Table）の構造を概略的に示している。また、図１２は、ＰＡメッセージの主要なパラメータの説明を示し、図１３は、ＭＰテーブルの主要なパラメータの説明を示している。

　「message_id」は、各種シグナリング情報において、ＰＡメッセージを識別する固定値である。「version」は、ＰＡメッセージのバージョンを示す８ビット整数値である。例えば、ＭＰテーブルを構成する一部のパラメータでも更新した場合には、＋１インクリメントされる。「length」は、このフィールドの直後からカウントされる、ＰＡメッセージのサイズを示すバイト数である。

　「extension」のフィールドには、ペイロード（Payload）のフィールドに配置されるテーブルのインデックス情報が配置される。このフィールドには、「table_id」、「table_version」、「table_length」の各フィールドが、テーブル数だけ配置される。「table_id」は、テーブルを識別する固定値である。「table_version」は、テーブルのバージョンを示す。「table_length」は、テーブルのサイズを示すバイト数である。

　ＰＡメッセージのペイロード（Payload）のフィールドには、ＭＰテーブル（ＭＰＴ）と、所定数のその他のテーブル（Other table）が配置される。以下、ＭＰテーブルの構成について説明する。

　「table_id」は、各種シグナリング情報において、ＭＰテーブルを識別する固定値である。「version」は、ＭＰテーブルのバージョンを示す８ビット整数値である。例えば、ＭＰテーブルを構成する一部のパラメータでも更新した場合には、＋１インクリメントされる。「length」は、このフィールドの直後からカウントされる、ＭＰテーブルのサイズを示すバイト数である。

　「pack_id」は、放送および通信で伝送される全てのアセット（コンポーネント）を構成要素とする全体のパッケージとしての識別情報である。この識別情報は、テキスト情報である。「pack_id_len」は、そのテキスト情報のサイズ（バイト数）を示す。「MPT_descripors」のフィールドは、パッケージ全体に関わる記述子の格納領域である。「MPT_dsc_len」は、そのフィールドのサイズ（バイト数）を示す。

　「num_of_asset」は、パッケージを構成する要素としてのアセット（コンポーネント）の数を示す。この数分だけ、以下のアセットループが配置される。「asset_id」は、アセットをユニークに識別する情報（アセットＩＤ）である。この識別情報は、テキスト情報である。「asset_id_len」は、そのテキスト情報のサイズ（バイト数）を示す。「gen_loc_info」は、アセットの取得先のロケーションを示す情報である。「asset_descriptors」のフィールドは、アセットに関わる記述子の格納領域である。「asset_dsc_len」は、そのフィールドのサイズ（バイト数）を示す。

　なお、図１４は、上述したＰＡメッセージの構造例（Syntax）を示している。また、図１５は、上述したＭＰテーブル（ＭＰＴ）の構造例（Syntax）を示している。図１１における「gen_loc_info」のフィールドは、図１５における「asset_location」のフィールドに対応し、アセットの取得先のロケーションを示す情報として複数の「MMT_general_location_info()」の配置が可能となっている。また、図１１における「asset_descriptors」のフィールドは、図１５における「asset_descriptors」のフィールドに対応している。

　図１６は、「MMT_general_location_info()」の構造例（Syntax）の一部を示している。「location_type」の８ビットフィールドは、アセットの取得先のロケーションを示す情報（以下、適宜、「ロケーション情報」という）のタイプを示している。放送で送られてくるアセットの場合、「location_type」は“０ｘ００”とされ、ロケーション情報として、パケット識別子（packt_id）が挿入される。

　また、上述の（Ａ）マルチキャスト配信のプロトコルで配信されるアセットの場合、「location_type」は“０ｘ０１”あるいは“０ｘ０２”とされ、ロケーション情報として、ソースアドレス（ipv4_src_addr,ipv6_src_addr」と、デストネーションアドレス（ipv4_dst_addr,ipv6_dst_addr）と、デストネーションポート番号（dst_port）と、パケット識別子（packt_id）が挿入される。この場合、「location_type」により、マルチキャスト配信であることが識別される。

　また、上述の（Ｂ）ＭＭＴＰ/ＵＤＰ配信、（Ｃ）ＭＭＴＰ/ＴＣＰ配信、（Ｄ）ＭＭＴＰ/ＨＴＴＰ配信あるいは（Ｅ）ＭＰＵ/ＨＴＴＰ配信のプロトコルで配信されるアセットである場合、「location_type」は“０ｘ０５”とされ、ロケーション情報として、ＵＲＬ（Uniform Resource Locator）が配置される。

　図１７は、受信端末２００の処理フロー、すなわちハイブリッド配信における処理フローを示している。受信端末２００は、ステップＳＴ１において、コンポーネントレイヤモデル（Component Layering Model）に沿って、提示すべきコンポーネントの選択をする。この場合、受信端末２００は、ＭＰＴに挿入されているコンポーネント選択情報（コンポーネントレイヤモデル）に基づいて、コンポーネント選択を行う。

　次に、受信端末２００は、ステップＳＴ２において、選択したコンポーネントのロケーション解決をすると共に、コンポーネントを取得する。この場合、受信端末２００は、シグナリング情報として挿入されているコンポーネントの取得先情報に基づいてコンポーネント取得を行う。そして、受信端末２００は、ステップＳＴ３において、選択したコンポーネントの同期再生を行う。

　コンポーネントレイヤモデルについて説明する。図１８、コンポーネントレイヤモデルの一例を示している。このコンポーネントレイヤモデルは、アダプティブレイヤ（Adaptive layer）、コンポジットレイヤ（Composite layer）、セレクティブレイヤ（Selective layer）の３つのレイヤ構造からコンポーネント選択を行うためのモデルである。

　アダプティブレイヤは、最下位に位置するレイヤであって、適応的にコンポーネントを切り替えるレイヤである。コンポジットレイヤは、真ん中に位置するレイヤであって、信号合成を行って別の信号にするレイヤである。セレクティブレイヤは、最上位に位置するレイヤであって、最終的に提示するコンポーネントを選択するレイヤである。各レイヤについてさらに説明する。

　セレクティブレイヤは、各コンポーネントカテゴリ（component category）において、複数のコンポーネント選択肢から、ユーザ選択、または端末自動選択により固定的にコンポーネントを選択するレイヤである。ここで、コンポーネントカテゴリとは、ビデオとかオーディオとかの選択する単位を意味する。図示の例では、ビデオ、オーディオの２つのカテゴリが示されている。

　このセレクティブレイヤでは、例えば、以下のような利用が想定される。
　（１）属性に基づいて、端末が自動選択するか、あるいは選択のためのＧＵＩ（graphical user interface）が表示されてユーザ選択させることにより、コンポーネントを選択する。
　（２）コンポーネント選択肢が１つだけの場合には選択なしにその１つのコンポーネントを選択する。
　（３）異なるコンポーネントカテゴリの組み合わせで選択するケースもある。
　（４）複数のコンポーネントを選択した場合、映像、キャプション（字幕）の場合には複数画面表示とし、音声の場合にはミキシング出力とする。

　このセレクティブレイヤでは、例えば、以下のような属性が用いられる。
　（１）コンビネーションタグ：１つのビューを構成する異なるコンポーネントカテゴリの組み合わせの識別子（ＩＤ）である。このコンビネーションタグが存在する場合はカテゴリ横断で選択がなされる。
　（２）言語：言語は、言語コードで示される。
　（３）映像パラメータ：映像パラメータは、解像度、フレームレート、３Ｄ情報などである。
　（４）音声パラメータ：音声パラメータは、マルチチャンネルモード、サンプリングレートなどである。
　（５）対象地域：対象地域は、地域コードで示される。
　（６）対象デバイス：対象デバイスは、デバイスタイプで示される。
　（７）ビュータイトル：ビュータイトルは、ビューの選択用タイトルである。
　（８）目的：目的は、例えばナレーションなどである。

　コンポジットレイヤは、各コンポーネントカテゴリにおいて複数のコンポーネントを合成して１つのコンポーネントとして機能させるレイヤである。このコンポジットレイヤの上にセレクティブレイヤがあるということは、合成した信号を１つの信号とみなしてセレクティブレイヤで選択する、ということを意味する。

　このコンポジットレイヤでは、例えば、以下のような利用が想定される。
　（１）合成のタイプを示す属性と合成の位置づけを示す属性値に基づいて合成する。
　（２）コンポーネントが一つだけの場合は、合成動作は不要とする。

　このコンポジットレイヤでは、例えば、以下のような、合成タイプと合成位置づけ情報が属性として用いられる。なお、以下の例は、位置づけが「位置づけ１」と「位置づけ２」の２つの場合を示している。
　（１）合成タイプはスケーラブルである、合成位置づけ情報はベース（Base）、エクステンデッド（Extended）である。例えば、ベースではＨＤ解像度の表示が可能であるが、ベースおよびエクステンデッドの両方で４Ｋ解像度の表示が可能となる。
　（２）合成タイプは３Ｄであり、合成位置づけ情報は左（Left）、右（Right）である。
　（３）合成タイプはタイルであり、合成位置づけ情報は“TileA1”,”TileA2”の画像タイリングの位置である。ここで、タイルは、画像を横とか縦に並べて視野の大きな画像を得ることを意味する。
　（４）合成タイプはレイヤであり、合成位置づけ情報は“Layer1”,”Layer2”の重ね合わせの奥からの順位である。ここで、レイヤとは、画像を奥から順に重ね合わせていくことを意味する。
　（５）合成タイプはミキシングであり、合成位置づけ情報はトラック１、トラック２である。

　アダプティブレイヤは、各コンポーネントカテゴリにおいて複数のコンポーネントを端末の適応的判断に基づきダイナミックに切り替えて１つのコンポーネントとして機能させるレイヤである。

　このアダプティブレイでは、例えば、以下のような利用が想定される。
　（１）いわゆるアダプティブストリーミングとして、一定時間（例えば１０秒）毎に最適なコンポーネントを端末が自動選択し切り替える。
　（２）切り替え対象のコンポーネントが１つのみの場合には適応切り替え動作は不要で、そのコンポーネントを常に選択する。
　（３）通信経路によるコンポーネントのみの場合には、通信路の輻輳状況によって変化する端末の受信バッファの占有状況に応じて、適切なビットレートのコンポーネントを選択する。
　（４）放送経路によるコンポーネントが含まれる場合にはそのビットレートにより通信コンポーネントとの選択を判断する。
　（５）放送経路のコンポーネントが複数存在するケースとしては、物理的な受信信号強度(Robustness)に基づき、天気が良い時は高品質なノーマルロバストネス（Normal Robustness）な信号で伝送されるコンポーネントを選択し、悪天候においては低品質なハイロバストネス（High Robustness）な信号で伝送されるコンポーネントを選択するケースが考えられる。

　このアダプティブレイヤでは、例えば、以下のような属性が用いられる。
　（１）経路：経路は、放送経路、通信経路などである。
　（２）ビットレート
　（３）ロバストネス（Robustness）指標: ノーマルロバストネス、ハイロバストネスなどである。
　（４）映像パラメータ: 映像パラメータは、解像度、フレームレートなどである。
　（５）音声パラメータ：音声パラメータは、マルチチャンネルモード、サンプリングレートなどである。

　図１８に示すコンポーネントレイヤモデルは、ビデオおよびオーディオの各カテゴリにおけるコンポーネント選択情報を示している。セレクティブレイヤでは、カテゴリ毎に、１つまたは複数のコンポーネントの選択が可能であることが示されている。ここで、２つのカテゴリ間にコンビネーションタグで組み合わせられたコンポーネントが存在し、カテゴリ横断で選択すべきことが示されている。

　コンポジットレイヤでは、セレクティブレイヤで選択肢とされる各コンポーネントの合成処理を示している。合成対象のコンポーネントが一つだけの場合は、そのコンポーネントがそのままセレクティブレイヤで選択肢とされることが示されている。アダプティブレイヤでは、コンポジットレイヤで使用される各コンポーネントの適応切り替え処理を示している。切り替え対象のコンポーネントが１つのみの場合、そのコンポーネントが常に選択されることが示されている。

　上述したように、受信端末２００は、シグナリング情報として挿入されているコンポーネント選択情報（コンポーネントレイヤモデル）に基づいて、コンポーネント選択を行う。受信端末２００のコンポーネント選択の動作例を説明する。

　（１）受信端末２００は、コンポーネント選択情報を取得し、その選択肢の中で、まず選択すべきコンポーネントの数を踏まえた上で、コンポーネントの選択を行う。この場合、ユーザに選択させるべき場合には、最上位レイヤのセレクティブレイヤの各コンポーネントの属性情報を基に、選択用ＧＵＩを表示してユーザに選択させる。

　端末に自動選択させる場合には、最上位レイヤのセレクティブレイヤの各コンポーネントの属性情報と受信端末２００が有する個人情報、端末能力情報に基づいて、受信端末２００が選択する。基本的にコンポーネントカテゴリ毎に上記の処理を行うが、アセットグループが設定されている場合にはカテゴリを横断して選択を行う。

　（２）受信端末２００は、セレクティブレイヤで選択したコンポーネントに複数の要素がある場合には、指定されたコンポーネント合成(Composition)を行うべき、アダプティブレイヤで適応切り替えされた複数のコンポーネントを用いて合成提示を行う。

　（３）受信端末２００は、セレクティブレイヤで選択したコンポーネントに要素が１つだけの場合には、アダプティブレイヤで適応切り替えされたコンポーネントにより提示を行う。

　（４）受信端末２００は、上記（２）、（３）でアダプティブレイヤの切り替え対象コンポーネントが１つだけの場合には、切り替えを行わずにそのコンポーネントを提示する。

　「コンポーネント選択情報」
　この実地の形態において、コンポーネント選択情報は、ＰＡメッセージに含まれるＭＰＴ（ＭＰＴテーブル）に挿入されている。ＰＭＴには、ビデオ、オーディオ、キャプションなどの各アセット（コンポーネント）の情報が存在し、コンポーネント選択情報として利用される。各アセットの情報には、種々の記述子も含まれる。

　例えば、コンポーネント選択情報として利用される記述子として、ビュー記述子、合成コンポーネントタイプ記述子、アセットグループ記述子、依存関係記述子、映像コンポーネント記述子、音声コンポーネント記述子、対象デバイス記述子、対象地域記述子、パレンタルレート記述子などがある。これらの記述子の詳細は後述する。

　受信端末２００は、図１９示すように、ＭＰＴに存在する各アセット（コンポーネント）の情報に基づいて、セレクティブレイヤ、コンポジットレイヤおよびアダプティブレイヤにおけるコンポーネント選択を行う。ただし、受信端末２００は、アダプティブレイヤにおいて、アダプティブ切り替えの対象となっているコンポーネントに関しては、その切り替え選択をＭＰＤファイルの情報に基づいて行う。

　そのため、アダプティブ切り替えの対象となっているコンポーネントの取得先として、ＭＰＴには、ＭＰＤファイルの特定のアダプテーションセット、あるいは特定のリプレゼンテーションの情報位置が指定される。この場合、図１９に示すように、ＭＰＴのアセットとして、ＭＰＤファイルのアダプテーションセット、あるいはリプレゼンテーションが位置づけられることとなる。

　この実施の形態において、「location_type」として、「MPEG-DASH segment」を示す値、例えば「０ｘ０Ｄ」を新規定義する。ＭＰＤファイルの特定のリプレゼンテーションの情報位置を取得先とする場合（方法１）、ロケーション情報として、図２０（ａ）に示すように、ピリオドＩＤ（period_id）と、アダプテーションセットＩＤ（adaptationSet_ID）と、リプレゼンテーションＩＤ（representation_ID）を挿入する。

　また、ＭＰＤファイルの特定のアダプテーションセットの情報位置を取得先とする場合（方法２）、ロケーション情報として、図２０（ｂ）に示すように、ピリオドＩＤ（period_id）と、アダプテーションセットＩＤ（adaptationSet_ID）を挿入する。なお、この場合であっても、ロケーション情報として、図２０（ａ）に示すように、ピリオドＩＤ（period_id）と、アダプテーションセットＩＤ（adaptationSet_ID）と、リプレゼンテーションＩＤ（representation_ID）を挿入することも考えられる。その場合には、リプレゼンテーションＩＤはオール０あるいはオール１とされ、アダプテーションセットＩＤでしか指定していないということがわかるようにされる。

　図２１は、図１の放送・通信ハイブリッドシステム１０で想定される信号構成の一例を示している。放送（Broadcast）では、ＭＭＴパケットを用いて、ビデオ１（Video1）、オーディオ１（Audio1）が伝送される共に、シグナリング（Signaling）が伝送される。このシグナリングとして、ＭＰＴを含むＰＡメッセージが存在と共に、ＭＰＤファイルあるいはＭＰＤファイルの取得先情報としてのＵＲＬを含むＭＰＩメッセージが存在する。

　また、通信では、ＤＳＡＨセグメントサーバ４００から、ビデオ２１（Video21）、ビデオ２２（Video22）、オーディオ２（Audio2）の配信が可能とされている。ビデオ２１（Video21）、ビデオ２２（Video22）は、アダプティブ切り替えの対象となっている。これらの取得先として、ＭＰＴの対応するアセットで、ＭＰＤファイルの特定のアダプテーションセット、あるいは特定のリプレゼンテーションの情報位置が指定される。これらの実際の取得先情報は、ＭＰＤファイルに含まれている。

　また、通信では、配信サーバ３００から、ビデオ３（Video3）、オーディオ３（Audio3）の配信が可能とされている。配信プロトコルは、例えば、上述した（Ａ）～（Ｅ）のいずれかとされる。これらの取得先情報は、ＭＰＴの対応するアセットの情報に含まれている。

　図２２は、図２１の信号構成例に対応したＭＰＴとＭＰＤファイルの構成例を概略的に示している。この例は、アダプティブ切り替えの対象となっているビデオ２１（Video21）、ビデオ２２（Video22）の取得先として、ＭＰＴの対応するアセットでＭＰＤファイルの特定のリプレゼンテーションの情報位置が指定される例である（方法１）。

　ＭＰＤファイルには、アダプテーションセット１（AS1）と、アダプテーションセット２（AS2）の情報が含まれる。また、アダプテーションセット１（AS1）の情報には、アダプテーションセットＩＤ（ASID）と、ビデオ２１（Video21）に係るリプレゼンテーション１１（Rep11）と、ビデオ２２（Video22）に係るリプレゼンテーション１２（Rep12）の情報が含まれる。

　また、リプレゼンテーション１（Rep11）の情報には、リプレゼンテーションＩＤ（RepID=r11）と、取得先情報（seg_url=URL1）が含まれる。また、リプレゼンテーション２（Rep12）の情報には、リプレゼンテーションＩＤ（RepID=r12）と、取得先情報（seg_url=URL2）が含まれる。

　また、アダプテーションセット２（AS2）の情報には、アダプテーションセットＩＤ（ASID）と、オーディオ２（Audio2）に係るリプレゼンテーション２１（Rep21）の情報が含まれる。また、リプレゼンテーション２１（Rep21）の情報には、リプレゼンテーションＩＤ（RepID=r21）と、取得先情報（seg_url=URL3）が含まれる。

　ＭＰＴには、ビデオ１（Video1）に係るアセット１（Asset1）、オーディオ１（Audio1）に係るアセット２（Asset2）、ビデオ２１（Video21）に係るアセット３（Asset3）、ビデオ２２（Video22）に係るアセット４（Asset4）、オーディオ２（Audio2）に係るアセット５（Asset5）、ビデオ３（Video3）に係るアセット６（Asset6）、オーディオ３（Audio3）に係るアセット７（Asset7）の情報が含まれる。

　アセット１（Asset1）の情報には、アセットＩＤ(AssetID=A1)と、ロケーション情報（GenLoc）として、パケット識別子（PacketID_A1）が含まれる。アセット２（Asset2）の情報には、アセットＩＤ(AssetID=A2)と、ロケーション情報（GenLoc）として、パケット識別子（PacketID_A2）が含まれる。

　アセット３（Asset3）の情報には、アセットＩＤ(AssetID=A3)と、ロケーション情報（GenLoc）として、アダプテーションセットＩＤ（ASID=a1）と、リプレゼンテーションＩＤ（RepID=r11）が含まれる。アセット４（Asset4）の情報には、アセットＩＤ(AssetID=A4)と、ロケーション情報（GenLoc）として、アダプテーションセットＩＤ（ASID=a1）と、リプレゼンテーションＩＤ（RepID=r12）が含まれる。

　アセット５（Asset5）の情報には、アセットＩＤ(AssetID=A5)と、ロケーション情報（GenLoc）として、アダプテーションセットＩＤ（ASID=a2）と、リプレゼンテーションＩＤ（RepID=r21）が含まれる。アセット６（Asset6）の情報には、アセットＩＤ(AssetID=A6)と、ロケーション情報（GenLoc）として、ＵＲＬ（URL4）が含まれる。アセット７（Asset7）の情報には、アセットＩＤ(AssetID=A7)と、ロケーション情報（GenLoc）として、ＵＲＬ（URL5）が含まれる。

　図２３は、図２１の信号構成例に対応したＭＰＴとＭＰＤファイルの構成例を概略的に示している。この例は、アダプティブ切り替えの対象となっているビデオ２１（Video21）、ビデオ２２（Video22）の取得先として、ＭＰＴの対応するアセットでＭＰＤファイルの特定のアダプテーションセットの情報位置が指定される例である（方法２）。

　ＭＰＤファイルには、図２２と同様の情報が含まれる。ＭＰＴには、ビデオ１（Video1）に係るアセット１（Asset1）、オーディオ１（Audio1）に係るアセット２（Asset2）、ビデオ２２（Video21,Video22）に係るアセット３（Asset3）、オーディオ２（Audio2）に係るアセット４（Asset4）、ビデオ３（Video3）に係るアセット５（Asset5）、オーディオ３（Audio3）に係るアセット６（Asset6）の情報が含まれる。

　アセット３（Asset3）の情報には、アセットＩＤ(AssetID=A3)と、ロケーション情報（GenLoc）として、アダプテーションセットＩＤ（ASID=a1）が含まれる。アセット４（Asset4）の情報には、アセットＩＤ(AssetID=A4)と、ロケーション情報（GenLoc）として、アダプテーションセットＩＤ（ASID=a2）が含まれる。アセット５（Asset5）の情報には、アセットＩＤ(AssetID=A5)と、ロケーション情報（GenLoc）として、ＵＲＬ（URL4）が含まれる。アセット６（Asset6）の情報には、アセットＩＤ(AssetID=A6)と、ロケーション情報（GenLoc）として、ＵＲＬ（URL5）が含まれる。

　上述したように、コンポーネント選択情報として利用される記述子として、ビュー記述子、合成コンポーネントタイプ記述子、アセットグループ記述子、依存関係記述子、映像コンポーネント記述子、音声コンポーネント記述子、対象デバイス記述子、対象地域記述子、パレンタルレート記述子などがある。

　ビュー記述子は、映像のビューに関するメタ情報が記述される記述子である。合成コンポーネントタイプ記述子は、合成のタイプを示す情報が記述される記述子である。アセットグループ記述子は、アセットのグループの関係とグループ内での優先度を示す情報が記述される記述子である。依存関係記述子は、依存関係にあるアセットのアセットＩＤを提供する記述子である。

　映像コンポーネント記述子は、映像コンポーネントに関するパラメータ、説明を示す記述子である。音声コンポーネント記述子は、音声エレメンタリストリームの各パラメータを示す記述子である。対象デバイス記述子は、当該コンポーネントを再生する対象のデバイス情報が記述される記述子である。対象地域記述子は、当該コンポーネントを再生する対象の地域を示す情報が記述される記述子である。パレンタルレート記述子は、当該コンポーネントのレーティング情報が記述される記述子である。

　図２４は、ビュー記述子の構造例（Syntax）を示している。このビュー記述子は、この実施の形態において、新規定義する記述子である。「descriptor_tag」の１６ビットフィールドは、記述子タグを示す。ここでは、ビュー記述子であることを示す。「descriptor_length」の８ビットフィールドは、記述子長を示し、このフィールド以降のバイト数を示す。

　「view_tag」の８ビットフィールドは、映像内容の識別情報であるビュータグを示す。同じ映像内容だがレートが違う、コーデックが違うなどということもある。ビュータグが同じであれば、同じ映像内容であることが示される。「view_name_byte」のフィールドには、映像内容の名称であるビュー名の文字列データが配される。

　図２５は、合成コンポーネントタイプ記述子の構造例（Syntax）を示している。この合成コンポーネントタイプ記述子は、この実施の形態において、新規定義する記述子である。「descriptor_tag」の１６ビットフィールドは、記述子タグを示す。ここでは、合成コンポーネントタイプ記述子であることを示す。「descriptor_length」の８ビットフィールドは、記述子長を示し、このフィールド以降のバイト数を示す。「composite_component_type」の８ビットフィールドは、合成コンポーネントタイプを示す。例えば、スケーラブル、３Ｄ、タイル、レイヤ、ミキシングなどのタイプを示す。

　図２６は、アセットグループ記述子の構造例（Syntax）を示している。このアセットグループ記述子は、既存の記述子である。「descriptor_tag」の１６ビットフィールドは、記述子タグを示す。ここでは、アセットグループ記述子であることを示す。「descriptor_length」の８ビットフィールドは、記述子長を示し、このフィールド以降のバイト数を示す。

　「group_identification」の８ビットフィールドは、グループＩＤを示す。例えば、ビデオやオーディオなどのアセットをグループ化したＩＤを示す。「selection_level」の８ビットフィールドは、選択レベルを示す。選択レベル値が“０”のアセットをデフォルトで選択する。デフォルトのアセットを選択てきない場合、グループ内で数字が小さいアセットから順に優先して選択していく候補であることを示す。

　図２７は、依存関係記述子の構造例（Syntax）を示している。この依存関係記述子は、既存の記述子である。「descriptor_tag」の１６ビットフィールドは、記述子タグを示す。ここでは、依存関係記述子であることを示す。「descriptor_length」の１６ビットフィールドは、記述子長を示し、このフィールド以降のバイト数を示す。

　「num_dependencies」の８ビットフィールドは、依存アセット数を示す。この記述子が挿入されるアセットと相補的な関係にあるアセットの数を示す。このフィールド以降がforループとなっており、各相補的なアセットの情報になっている。「asset_id_scheme」の３２ビットフィールドは、相補的なアセットのアセットＩＤの形式を示す。「asset_id_length」の８ビットフィールドは、相補的なアセットのアセットＩＤバイトの長さをバイト単位で示す。「asset_id_byte」のフィールドは、相補的なアセットのアセットＩＤを示す。

　図２８は、映像コンポーネント記述子の構造例（Syntax）を示している。この映像コンポーネント記述子は、既存の記述子である。「descriptor_tag」の１６ビットフィールドは、記述子タグを示す。ここでは、映像コンポーネント記述子であることを示す。「descriptor_length」の１６ビットフィールドは、記述子長を示し、このフィールド以降のバイト数を示す。

　「video_resolution」の４ビットフィールドは、垂直方向の解像度を示す。例えば、“１”は「１８０」を示し、“２”は「２４０」を示し、“３”は「４８０」を示し、“４”は「７２０」を示し、“５”は「１０８０」を示し、“６”は「２１６０」を示し、“７”は「４３２０」を示す。「video_aspect_ratio」の４ビットフィールドは、アスペクト比を示す。例えば、“１”は「４：３」を示し、“２”は「ＰＶ（パンベクター）有りの１６：９」を示し、“３”は「ＰＶ（パンベクター）無しの１６：９」を示し、“４”は「１６：９以上」を示す。

　「video_scan_flag」の１ビットフィールドは、スキャンフラグを示す。例えば、“０”はインターレースを示し、“１”はプログレッシブを示す。「video_frame_rate」の５ビットフィールドは、フレームレートを示す。例えば、 “４”は「２５フレーム」を示し、“５”は「３０/１．００１フレーム」を示し、“６”は「３０フレーム」を示し、“７”は「５０フレーム」を示し、“８”は「６０/１．００１フレーム」を示し、“９”は「６０フレーム」を示す。

　「component_tag」の１６ビットフィールドは、コンポーネントタグを示す。コンポーネントタグは、コンポーネントストリームを識別するためのラベルである。「ISO_639_language_code」の２４ビットフィールドは、言語コードを示す。「text_char」のフィールドは、コンポーネントストリームの文字記述を規定する。

　図２９は、音声コンポーネント記述子の構造例（Syntax）を示している。この音声コンポーネント記述子は、既存の記述子である。「descriptor_tag」の１６ビットフィールドは、記述子タグを示す。ここでは、音声コンポーネント記述子であることを示す。「descriptor_length」の１６ビットフィールドは、記述子長を示し、このフィールド以降のバイト数を示す。

　「stream_content」の４ビットフィールドは、ストリームの種別を示す。「component_type」の８ビットフィールドは、音声コンポーネントの種別を規定する。「component_tag」の１６ビットフィールドは、コンポーネントストリームを識別するためのラベルである。「stream_type」の８ビットフィールドは、音声ストリームの形式をＩＳＯ/ＩＥＣ１３８１８－１に規定される“stream_type”で示す。

　「simulcast_group_tag」の８ビットフィールドは、サイマルキャストグループ識別である。サイマルキャスト（同一内容を異なる符号化方式で伝送）を行っているコンポーネントに対して同じ番号を与える。サイマルキャストを行っていないコンポーネントに対いて“０ｘＦＦ”を与える。「ES_multi_lingual_flag」の１ビットフィールドは、ＥＳ多言語フラグを示す。例えば、“１”はデュアルモノ（dual mono）で２言語多重されている場合を示す。「main_component_flag」の１ビットフィールドは、当該音声コンポーネントが主音声であるかを示し、主音声であるときは“１”を与える。

　「quality_indicator」の２ビットフィールドは、音質モードを示す。例えば、“１”は「モード１」を示し、“２”は「モード２」を示し、“３”は「モード３」を示す。「sampling_rate」の３ビットフィールドは、サンプリング周波数を示す。例えば、“１”は「１６ｋＨｚ」を示し、“２”は「２２．０５ｋＨｚ」を示し、“３”は「２４ｋＨｚ」を示し、“５”は「３２ｋＨｚ」を示し、“６”は「４４．１ｋＨｚ」を示し、“７”は「４８ｋＨｚ」を示す。

　「ISO_639_language_code」の２４ビットフィールドは、言語コードを示す。そして、「ES_multi-lingual_flag」が“１”であるとき、「ISO_639_language_code_2」の２４ビットフィールドが存在し、言語コード２を示す。「text_char」のフィールドは、コンポーネントストリームの文字記述を規定する。

　図３０は、対象デバイス記述子の構造例（Syntax）を示している。この対象デバイス記述子は、この実施の形態において、新規定義する記述子である。「descriptor_tag」の１６ビットフィールドは、記述子タグを示す。ここでは、対象デバイス記述子であることを示す。「descriptor_length」の８ビットフィールドは、記述子長を示し、このフィールド以降のバイト数を示す。

　「number_of_taget_device」の８ビットフィールドは、対象デバイス数を示す。対象デバイス毎に、「target_device_type」の８ビットフィールドが存在し、対象デバイスタイプを示す。例えば、大きなスクリーンのテレビを想定したものか、もう少し小さなスクリーンのタブレットを想定したものか、さらにはもっと小さなスクリーンのスマートフォンを想定したものか、などのタイプを示す。

　図３１は、対象地域記述子の構造例（Syntax）を示している。この対象地域記述子は、既存の記述子である。「descriptor_tag」の１６ビットフィールドは、記述子タグを示す。ここでは、対象地域記述子であることを示す。「descriptor_length」の８ビットフィールドは、記述子長を示し、このフィールド以降のバイト数を示す。

　「region_spec_type」の８ビットフィールドは、地域記述方式指定を示す。例えば、“１”は県域指定であることを示す。そして、「target_region_spec()」のフィールドに、指定された記述方式による地域指定子（地域指定データ）が記述される。

　図３２は、パレンタルレート記述子の構造例（Syntax）を示している。このパレンタルレート記述子は、既存の記述子である。「descriptor_tag」の１６ビットフィールドは、記述子タグを示す。ここでは、パレンタルレート記述子であることを示す。「descriptor_length」の８ビットフィールドは、記述子長を示し、このフィールド以降のバイト数を示す。

　国毎に、レーティングの指定が可能となっている。「country_code」の２４ビットフィールドは、国コードを示す。「rating」の８ビットフィールドは、レーティングを示す。この「レーティング＋３歳」が最小年齢を示す。

　［放送送出システムの構成］
　図３３は、放送送出システム１００の構成例を示している。この放送送出システム１００は、時計部１１１と、信号送出部１１２と、ビデオエンコーダ１１３と、オーディオエンコーダ１１４と、キャプションエンコーダ１１５と、シグナリング発生部１１６を有している。また、この放送送出システム１００は、ＴＬＶシグナリング発生部１１８と、Ｎ個のＩＰサービス・マルチプレクサ１１９-1～１１９-Nと、ＴＬＶ・マルチプレクサ１２０と、変調/送信部１２１を有している。

　時計部１１１は、図示しないＮＴＰ（Network Time Protocol）サーバから取得された時刻情報に同期した時刻情報（ＮＴＰ時刻情報）を生成し、この時刻情報を含むＩＰパケットをＩＰサービス・マルチプレクサ１１９-1に送る。信号送出部１１２は、例えば、ＴＶ局のスタジオとか、ＶＴＲ等の記録再生機であり、タイムドメディアであるビデオ、オーディオ、字幕等のストリームデータ、ノンタイムドメディアであるＨＴＭＬ文書データ等のファイル（ファイルデータ）を各エンコーダに送出する。

　ビデオエンコーダ１１３は、信号送出部１１２から送出されるビデオ信号を符号化し、さらにパケット化して、ビデオのＭＭＴパケットを含むＩＰパケットをＩＰサービス・マルチプレクサ１１９-1に送る。オーディオエンコーダ１１４は、信号送出部１１２から送出されるオーディオ信号を符号化し、さらにパケット化して、オーディオのＭＭＴパケットを含むＩＰパケットをＩＰサービス・マルチプレクサ１１９-1に送る。

　キャプションエンコーダ１１５は、信号送出部１１２から送出されるキャプション信号（字幕信号）を符号化し、さらにパケット化して、キャプションのＭＭＴパケットを含むＩＰパケットをＩＰサービス・マルチプレクサ１１９-1に送る。

　シグナリング発生部１１６は、シグナリングメッセージを発生し、ペイロード部にこのシグナリングメッセージが配置されたＭＭＴパケットを含むＩＰパケットをＩＰサービス・マルチプレクサ１１９-1に送る。この際、シグナリング発生部１１６は、少なくとも、ＭＰテーブル（ＭＰＴ）を含むＰＡメッセージと、ＭＰＤファイルを含むＭＰＩメッセージを発生する。

　ＩＰサービス・マルチプレクサ１１９-1は、各エンコーダ等から送られてくるＩＰパケットの時分割多重化を行う。この際、ＩＰサービス・マルチプレクサ１１９-1は、各ＩＰパケットにＴＬＶヘッダを付加して、ＴＬＶパケットとする。

　ＩＰサービス・マルチプレクサ１１９-1は、一つのトランスポンダの中にいれる一つのチャネル部分を構成する。ＩＰサービス・マルチプレクサ１１９-2～１１９-Nは、ＩＰサービス・マルチプレクサ１１９-1と同様の機能を持ち、その１つのトランスポンダの中にいれる他のチャネル部分を構成する。

　ＴＬＶシグナリング発生部１１８は、シグナリング（Signaling）情報を発生し、このシグナリング（Signaling）情報をペイロード部に配置するＴＬＶパケットを生成する。ＴＬＶ・マルチプレクサ１２０は、ＩＰサービス・マルチプレクサ１１９-1～１１９-NおよびＴＬＶシグナリング発生部１１８で生成されるＴＬＶパケットを多重化して、放送ストリームを生成する。変調/送信部１２１は、ＴＬＶ・マルチプレクサ１２０で生成される放送ストリームに対して、ＲＦ変調処理を行って、ＲＦ伝送路に送出する。

　図３３に示す放送送出システム１１０の動作を簡単に説明する。時計部１１１では、ＮＴＰサーバから取得された時刻情報に同期した時刻情報が生成され、この時刻情報を含むＩＰパケットが生成される。このＩＰパケットは、ＩＰサービス・マルチプレクサ１１９-1に送られる。

　信号送出部１１２から送出されるビデオ信号は、ビデオエンコーダ１１３に供給される。このビデオエンコーダ１１３では、ビデオ信号が符号化され、さらにパケット化されて、ビデオのＭＭＴパケットを含むＩＰパケットが生成される。このＩＰパケットは、ＩＰサービス・マルチプレクサ１１９-1に送られる。また、信号送出部１１２から送出されるオーディオ信号に対しても同様の処理が行われる。そして、オーディオエンコーダ１１４で生成されるオーディオのＭＭＴパケットを含むＩＰパケットがＩＰサービス・マルチプレクサ１１９-1に送られる。

　また、信号送出部１１２から送出されるオーディオ信号、キャプション信号に対しても同様の処理が行われる。そして、オーディオエンコーダ１１４で生成されるオーディオのＭＭＴパケットを含むＩＰパケットがＩＰサービス・マルチプレクサ１１９-1に送られ、キャプションエンコーダ１１５で生成されるキャプションのＭＭＴパケットを含むＩＰパケットがＩＰサービス・マルチプレクサ１１９-1に送られる。

　また、シグナリング発生部１１６では、シグナリングメッセージが発生され、ペイロード部にこのシグナリングメッセージが配置されたＭＭＴパケットを含むＩＰパケットが生成される。このＩＰパケットは、ＩＰサービス・マルチプレクサ１１９-1に送られる。この際、シグナリング発生部１１６では、少なくとも、ＭＰテーブル（ＭＰＴ）を含むＰＡメッセージと、ＭＰＤファイルを含むＭＰＩメッセージが発生される。

　ＩＰサービス・マルチプレクサ１１９-1では、各エンコーダおよびシグナリング発生部１１６から送られてくるＩＰパケットの時分割多重化が行われる。この際、各ＩＰパケットにＴＬＶヘッダが付加されて、ＴＬＶパケットとされる。このＩＰサービス・マルチプレクサ１１９-1では、一つのトランスポンダの中にいれる１つのチャネル部分の処理が行われ、ＩＰサービス・マルチプレクサ１１９-2～１１９-Nでは、その一つのトランスポンダの中にいれる他のチャネル部分の処理が同様に行われる。

　ＩＰサービス・マルチプレクサ１１９-1～１１９-Nで得られるＴＬＶパケットは、ＴＬＶ・マルチプレクサ１２０に送られる。このＴＬＶ・マルチプレクサ１２０には、さらに、ＴＬＶシグナリング発生部１１８から、シグナリング（Signaling）情報をペイロード部に配置するＴＬＶパケットも送られる。

　ＴＬＶ・マルチプレクサ１２０では、ＩＰサービス・マルチプレクサ１１９-1～１１９-NおよびＴＬＶシグナリング発生部１１８で生成されるＴＬＶパケットが多重化されて、放送ストリームが生成される。この放送ストリームは、変調/送信部１２１に送られる。変調/送信部１２１では、この放送ストリームに対してＲＦ変調処理を行われ、そのＲＦ変調信号がＲＦ伝送路に送出される。

　［受信端末の構成］
　図３４は、受信端末２００の構成例を示している。この受信端末２００は、ＣＰＵ２０１と、チューナ/復調部２０２と、ネットワークインタフェース部２０３と、デマルチプレクサ２０４と、システムクロック生成部２０５を有している。また、この受信端末２００は、ビデオデコーダ２０６と、オーディオデコーダ２０７と、キャプションデコーダ２０８と、合成部２１０を有している。

　ＣＰＵ２０１は、制御部を構成し、受信端末２００の各部の動作を制御する。チューナ/復調部２０２は、ＲＦ変調信号を受信し、復調処理を行って、放送ストリームを得る。ネットワークインタフェース部２０３は、配信サーバ３００やＤＡＳＨセグメントサーバ４００から通信ネットワーク５００を介して配信されるサービスの伝送ストリームを受信する。

　デマルチプレクサ２０４は、チューナ/復調部２０２で得られる放送ストリームおよびネットワークインタフェース部２０３で得られる伝送ストリームに対して、デマルチプレクス処理およびデパケット化処理を行って、ＮＴＰ時刻情報、シグナリング情報、ビデオ、オーディオの符号化信号を出力する。

　システムクロック生成部２０５は、デマルチプレクサ２０４で得られるＮＴＰ時刻情報に基づき、この時刻情報に同期したシステムクロックＳＴＣを発生する。ビデオデコーダ２０６は、デマルチプレクサ２０４で得られる符号化ビデオ信号の復号化を行ってベースバンドのビデオ信号を得る。

　オーディオデコーダ２０７は、デマルチプレクサ２０４で得られる符号化オーディオ信号の復号化を行ってベースバンドのオーディオ信号を得る。さらに、キャプションデコーダ２０８は、デマルチプレクサ２０４で得られる符号化キャプション信号の復号化を行って、キャプション（字幕）の表示信号を得る。

　ＣＰＵ２０１は、各デコーダにおけるデコードタイミングをＰＴＳ（提示時刻情報）に基づいて制御し、ビデオ、オーディオの提示タイミングを調整する。合成部２１０は、ビデオデコーダ２０６で得られるベースバンドのビデオ信号に、キャプションの表示信号を合成し、映像表示用のビデオ信号を得る。なお、オーディオデコーダ２０７で得られるベースバンドのオーディオ信号は、音声出力用のオーディオ信号となる。

　図３４に示す受信端末２００の動作を簡単に説明する。チューナ/復調部２０２では、ＲＦ伝送路を通じて送られてくるＲＦ変調信号が受信され、復調処理が行われて、放送ストリームが得られる。この放送ストリームは、デマルチプレクサ２０４に送られる。また、ネットワークインタフェース部２０３では、配信サーバ３００やＤＡＳＨセグメントサーバ４００から通信ネットワーク３００を介して配信されるサービスの伝送ストリームが受信され、デマルチプレクサ２０４に送られる。

　デマルチプレクサ２０４では、チューナ/復調部２０２からの放送ストリームやネットワークインタフェース部２０３からの伝送ストリームに対して、デマルチプレクス処理およびデパケット化処理が行われ、ＮＴＰ時刻情報、シグナリング情報、ビデオ、オーディオの符号化信号などが抽出される。

　デマルチプレクサ２０４で抽出される各種のシグナリング情報はＣＰＵバス２１１を介してＣＰＵ２０１に送られる。このシグナリング情報には、ＴＬＶ－ＳＩ、ＭＭＴ－ＳＩが含まれる。上述したように、ＴＬＶ－ＳＩはＴＬＶの伝送パケットの上に載る伝送制御信号（ＴＬＶ－ＮＩＴ/ＡＭＴ）であり、ＭＭＴ－ＳＩはＭＭＴパケットのペイロード部に含まれるシグナリング情報としてのシグナリングメッセージである（図２参照）。ＣＰＵ２０１は、このシグナリング情報に基づいて、受信端末２００の各部の動作を制御する。

　デマルチプレクサ２０４で抽出されるＮＴＰ時刻情報は、システムクロック生成部２０５に送られる。このシステムクロック生成部２０５では、このＮＴＰ時刻情報に基づき、この時刻情報に同期したシステムクロックＳＴＣが生成される。このシステムクロックＳＴＣは、ビデオデコーダ２０６、オーディオデコーダ２０７、キャプションデコーダ２０８に供給される。

　デマルチプレクサ２０４で抽出される符号化ビデオ信号はビデオデコーダ２０６に送られて復号化され、ベースバンドのビデオ信号が得られる。また、デマルチプレクサ２０４で抽出される符号化キャプション信号はキャプションデコーダ２０８に送られて復号化され、キャプションの表示信号が得られる。

　ビデオデコーダ２０６で得られるビデオ信号は合成部２１０に供給される。また、キャプションデコーダ２０８で得られるキャプションの表示信号は合成部２１０に供給される。合成部２１０では、これらの信号が合成され、映像表示用のビデオ信号が得られる。また、デマルチプレクサ２０３で抽出される符号化オーディオ信号はオーディオデコーダ２０７に送られて復号化され、音声出力用のベースバンドのオーディオ信号が得られる。

　受信端末２００は、ＭＰＴのコンポーネント選択情報（各アセットの情報）に基づいて、放送・通信のハイブリッド伝送による受信信号から、提示すべきビデオ、オーディオなどの伝送メディア（コンポーネント）を選択的に取得し、画像、音声などを提示する。

　受信端末２００におけるコンポーネント選択・取得プロセスの概要を説明する。受信端末２００（ＣＰＵ２０１）は、ＭＰＴの各アセット（コンポーネント）の情報を解析する。受信端末２００は、セレクティブレイヤのコンポーネント選択において、必要に応じてユーザ選択のＧＵＩを表示して、ユーザに選択させる。

　図３５（ａ）は、コンポーネント選択ＧＵＩの一例を示している。このＧＵＩは、ユーザに、ビュー（View）選択、言語（language）選択をさせるためのものである。図３５（ｂ）に示すように、ＧＵＩ上のビューボタン４０１を操作すると、ビュー選択のためのドロップダウンメニューが表示され、ユーザは、「全ビュー表示」、「メイン」、「サブ１」、「サブ２」のいずれかを選択することが可能となる。

　図３５（ｃ）に示すように、ＧＵＩ上の言語ボタン４０２を操作すると、言語選択のためのドロップダウンメニューが表示され、ユーザは、「日本語」、「英語」、「中国語」、「韓国語」のいずれかを選択することが可能となる。

　さらに、受信端末２００は、セレクティブレイヤのコンポーネント選択において、能力や設定に従って自動的に一つまたは複数のコンポーネントを選択する。なお、選局時、電源オン時は、受信端末２００は、デフォルトのコンポーネントを自動的に選択する。

　受信端末２００は、セレクティブレイヤで選択されるコンポーネント内にアダプティブレイヤの複数のコンポーネントが存在する場合、コンポーネント選択情報に基づき、合成、適応切り替えの対象となるコンポーネントを割り出す。そして、受信端末２００は、ＭＰＴのアセット記述の「General location Info（）」のフィールドにより、指定された取得先（放送・通信のＭＭＴパケット、通信ネットワーク上のファイル）を認識し、信号データを取得し、再生する。

　上述は映像について説明したが、音声、字幕などについても同様のプロセスを実行する。

　受信端末２００におけるコンポーネント選択・取得プロセスのユースケースを説明する。このユースケースは、図３６に示すように、マルチビューの例である。このマルチビューの例は、１つの番組が、メインビュー（Main View）/サブビュー１（Sub View1）/サブビュー２（Sub View2）の３つの“映像＋音声”から構成されている。

　メインビュー映像は、デフォルトで選局時に表示する映像であり、３８４０＊２１６０の解像度(４Ｋ)か１９２０＊１０８０の解像度(２Ｋ)の映像を受信端末の能力によって自動で選択する想定である。４Ｋの場合には、２Ｋ映像信号(base)と差分信号(extended)を合成するスケーラブル符号化が行われている。２Ｋ映像信号(base)は放送で伝送され、差分信号(extended)はネット配信される。

　メイン映像に付随する音声は、２２．２ｃｈかステレオを受信端末の能力と接続環境により自動で選択する想定である。２２．２ｃｈの場合にはステレオ信号(base)と差分信号(extended)を合成するスケーラブル符号化が行われている。ステレオ信号は、放送(base)で伝送され、差分信号(extended)はネット配信される。

　サブビュー１は、映像信号も音声信号もそれぞれ１系統でネット配信される。このサブビュー１において、映像信号は２Ｋ映像信号であり、音声信号はステレオ信号である。サブビュー２は、映像信号に関してはいくつかのレート・解像度の信号を適応的に切り替えるネット配信であり、音声信号は１系統のネット配信である。このサブビュー２において、映像信号は２Ｋ映像信号であり、音声信号はステレオ信号である。

　図３７は、図３６のマルチビューの例に対応したコンポーネントレイヤモデルを示している。コンポーネントカテゴリとしては、映像（Video）と音声（Audio）がある。映像のセレクティブレイヤでは、メインビューとして４Ｋ映像信号または２Ｋ映像信号の選択が可能であることが示され、さらに、サブ１ビュー、サブビュー２の選択が可能であることが示されている。

　また、映像のコンポジットレイヤおよびアダプティブレイヤでは、セレクティブレイヤでの選択肢であるメインビュー（４Ｋ映像信号）が、スケーラブル符号化されたものであり、放送伝送されるベース信号（２Ｋ映像信号）と、通信伝送されるエクステンド信号（差分信号）との合成信号であることが示されている。

　また、映像のコンポジットレイヤおよびアダプティブレイヤでは、セレクティブレイヤでの選択肢であるメインビュー（２Ｋ映像信号）が、放送伝送されるベース信号（２Ｋ映像信号）であることが示されている。また、映像のコンポジットレイヤおよびアダプティブレイヤでは、セレクティブレイヤでの選択肢であるサブビュー１が、通信伝送される映像信号であることが示されている。また、映像のコンポジットレイヤおよびアダプティブレイヤでは、セレクティブレイヤでの選択肢であるサブビュー２が、通信伝送される複数の映像信号が適応的に切り替えられて得られる映像信号であることが示されている。

　また、音声のセレクティブレイヤでは、メインビューとして２２．２ｃｈ信号またはステレオ信号の選択が可能であることが示され、さらに、サブ１ビュー、サブビュー２の選択が可能であることが示されている。

　また、音声のコンポジットレイヤおよびアダプティブレイヤでは、セレクティブレイヤでの選択肢であるメインビュー（２２．２ｃｈ信号）が、スケーラブル符号化されたものであり、放送伝送されるステレオ信号と、通信伝送される差分信号との合成信号であることが示されている。

　また、音声のコンポジットレイヤおよびアダプティブレイヤでは、セレクティブレイヤでの選択肢であるメインビュー（ステレオ信号）が、放送伝送されるステレオ信号であることが示されている。また、音声のコンポジットレイヤおよびアダプティブレイヤでは、セレクティブレイヤでの選択肢であるサブビュー１、サブビュー２が、それぞれ、通信伝送されるステレオ信号であることが示されている。

　また、映像、音声のセレクティブレイヤでは、各ビューがアセットグループで組み合わせられており、カテゴリ横断で選択すべきことが示されている。すなわち、映像のメインビュー、サブビュー１、サブビュー２の選択に伴って、音声のメインビュー、サブビュー１、サブビュー２も選択すべきことが示されている。

　図３８は、図３６のマルチビューの例に対応したＭＰＴとＭＰＤファイルの記載例を概略的に示している。ＭＰＤファイルには、ピリオドＩＤ「period_id」が“pd1”で示されるピリオドの情報に、アダプテーションセットＩＤ「As_id」が“as1”で示される第１のアダプテーションセットの情報と、アダプテーションセットＩＤ「As_id」が“as2”で示される第２のアダプテーションセットの情報が存在する。

　第１のアダプテーションセットは、いくつかのレート・解像度の信号が適応的に切り替えられるネット配信のサブビュー３の映像信号に対応する。この第１のアダプテーションセットの情報には、各レート・解像度の信号に対応する複数（Ｎ個）のリプレゼンテーションの情報が存在する。第２のアダプテーションセットは、ネット配信のサブビュー３の音声信号に対応する。この第２のアダプテーションセットの情報には、その音声信号に対応する１つのリプレゼンテーションの情報が存在する。

　ＭＰＴには、ビデオ、オーディオの２つのコンポーネントカテゴリの選択情報が含まれている。ビデオに関して、ビデオ１１（Video11）、ビデオ１２（Video12）、ビデオ２（Video2）、ビデオ３（Video3）の各アセット（コンポーネント）の情報が存在している。各アセットの情報には、コンポーネント選択情報として、記述子を含む種々の情報が存在する。

　ビデオ１１（Video11）のアセットは、放送で伝送されメインビューの２Ｋ映像信号(base)に対応している。このアセットの情報として、ロケーションタイプ「Loc_type」が“０”とされ、ロケーション情報「GenLoc」として、パケット識別子「pid」が挿入されている。また、このアセットの情報として、ビュー記述子「View_desc」、合成コンポーネントタイプ記述子「Compsite_desc」、アセットグループ記述子「Asset_Gp_desc」、映像コンポーネント記述子「V_comp_desc」などが挿入されている。

　ビデオ１２（Video12）のアセットは、ネット配信されるメインビューの差分信号(extended)に対応している。このアセットの情報として、ロケーションタイプ「Loc_type」が“１”とされ、ロケーション情報「GenLoc」として、ＩＰアドレス「IPadd」と、ポート番号「pn」と、パケット識別子「pid」が挿入されている。このアセットは、マルチキャスト配信される。また、このアセットの情報として、依存関係記述子「Dependency_desc」、映像コンポーネント記述子「V_comp_desc」などが挿入されている。

　ビデオ２（Video2）のアセットは、ネット配信されるサブビュー１の２Ｋ映像信号に対応している。このアセットの情報として、ロケーションタイプ「Loc_type」が“５”とされ、ロケーション情報「GenLoc」として、ＵＲＬ「url」が挿入されている。このアセットは、ＭＰＵ/ＨＴＴＰ配信される。また、このアセットの情報として、ビュー記述子「View_desc」、アセットグループ記述子「Asset_Gp_desc」、映像コンポーネント記述子「V_comp_desc」などが挿入されている。

　ビデオ３（Video3）のアセットは、ネット配信されるいくつかのレート・解像度の信号が適応的に切り替えられるサブビュー２の２Ｋ映像信号に対応している。このアセットの情報として、ロケーションタイプ「Loc_type」が“Ｄ”とされ、ロケーション情報「GenLoc」として、ＭＰＤファイルの特定のアダプテーションセットの情報位置が、ピリオドＩＤ「pid」とアダプテーションセットＩＤ「asid」で指定される。

　ここでは、ピリオドＩＤ「pid」は“pd1”とされ、アダプテーションセットＩＤ「asid」は“as1”とされ、いくつかのレート・解像度の信号が適応的に切り替えられるネット配信のサブビュー３の映像信号に対応したアダプテーションセットの情報位置が指定される。これにより、サブビュー３の映像信号のアダプティブな切り替えは、ＭＰＤファイルに基づいて行われることとなる。また、このアセットの情報として、ビュー記述子「View_desc」、アセットグループ記述子「Asset_Gp_desc」、映像コンポーネント記述子「V_comp_desc」などが挿入されている。

　また、オーディオに関して、オーディオ１１（Audio11）、オーディオ１２（Audio12）、オーディオ２（Audio2）、オーディオ３（Audio3）の各アセット（コンポーネント）の情報が存在している。各アセットの情報には、コンポーネント選択情報として、記述子を含む種々の情報が存在する。

　オーディオ１１（Audio11）のアセットは、放送で伝送されメインビューのステレオ信号(base)に対応している。このアセットの情報として、ロケーションタイプ「Loc_type」が“０”とされ、ロケーション情報「GenLoc」として、パケット識別子「pid」が挿入されている。また、このアセットの情報として、合成コンポーネントタイプ記述子「Compsite_desc」、アセットグループ記述子「Asset_Gp_desc」、音声コンポーネント記述子「A_comp_desc」などが挿入されている。

　オーディオ１２（Audio12）のアセットは、ネット配信されるメインビューの差分信号(extended)に対応している。このアセットの情報として、ロケーションタイプ「Loc_type」が“１”とされ、ロケーション情報「GenLoc」として、ＩＰアドレス「IPadd」と、ポート番号「pn」と、パケット識別子「pid」が挿入されている。このアセットは、マルチキャスト配信される。また、このアセットの情報として、依存関係記述子「Dependency_desc」、音声コンポーネント記述子「A_comp_desc」などが挿入されている。

　オーディオ２（Audio2）のアセットは、ネット配信されるサブビュー１のステレオ信号に対応している。このアセットの情報として、ロケーションタイプ「Loc_type」が“５”とされ、ロケーション情報「GenLoc」として、ＵＲＬ「url」が挿入されている。このアセットは、ＭＰＵ/ＨＴＴＰ配信される。また、このアセットの情報として、アセットグループ記述子「Asset_Gp_desc」、音声コンポーネント記述子「A_comp_desc」などが挿入されている。

　オーディオ３（Audio3）のアセットは、サブビュー２のステレオ信号に対応している。このアセットの情報として、ロケーションタイプ「Loc_type」が“Ｄ”とされ、ロケーション情報「GenLoc」として、ＭＰＤファイルの特定のアダプテーションセットの情報位置が、ピリオドＩＤ「pid」とアダプテーションセットＩＤ「asid」で指定される。

　ここでは、ピリオドＩＤ「pid」は“pd1”とされ、アダプテーションセットＩＤ「asid」は“as2”とされ、サブビュー２の音声信号に対応したアダプテーションセットの情報位置が指定される。また、このアセットの情報として、アセットグループ記述子「Asset_Gp_desc」、音声コンポーネント記述子「A_comp_desc」などが挿入されている。

　上述のＭＰＴとＭＰＤファイルの記載例に基づくコンポーネントの選択、再生は、例えば、以下のように行われる。最初に、ビューの選択が行われる。この選択は、ビデオ１１、ビデオ２、ビデオ３の各アセットの情報に挿入されているビュー記述子「View_desc」に基づいて行われる。例えば、デフォルトでメインビューが選択され、ビデオ１１が選ばれたとする。そのときに、ビデオ１１のアセット情報には、合成コンポーネントタイプ記述子「Compsite_desc」があるので、何かと組み合わせて合成されるものであることがわかる。

　また、ビデオ１２のアセット情報には、依存関係記述子「Dependency_desc」が存在する。この記述子により、ビデオ１２は、単独では機能せず、他のアセット、つまりビデオ１１に依存して使用されるものであることがわかる。これにより、合成コンポーネントタイプ記述子「Compsite_desc」と依存関係記述子「Dependency_desc」の組み合わせで、ビデオ１１とビデオ１２はスケーラブルビデオの関係にあることがわかる。

　さらに、ビデオ１１、ビデオ１２のアセット情報には、映像コンポーネント記述子「V_comp_desc」が存在し、例えば、ビデオ１１に関しては“２Ｋ”、ビデオ１２に関しては“４Ｋ”との解像度記述がなされている。受信端末２００が４Ｋ対応であればビデオ１１およびビデオ１２の双方が選択合成され、４Ｋでの映像再生が行われる。一方、受信端末２００が２Ｋ対応であればビデオ１１のみが選択され、２Ｋでの映像再生が行われる。

　また、ビデオ１１のアセット情報には、アセットグループ記述子「Asset_Gp_desc」が存在する。この記述子により、ビデオ１１とオーディオ１１が組み合わされていることがわかる。ビデオ１１が選ばれることで、オーディオ１１も選ばれる。このオーディオ１１が選ばれることで、オーディオ１１のアセット情報に存在する合成コンポーネントタイプ記述子「Compsite_desc」と、オーディオ１２のアセット情報に存在する依存関係記述子「Dependency_desc」の組み合わせで、オーディオ１１とオーディ１２はスケーラブルオーディオの関係にあることがわかる。

　さらに、オーディオ１１、オーディオ１２のアセット情報には、音声コンポーネント記述子「A_comp_desc」が存在し、例えば、オーディオ１１に関しては“ステレオ”、オーディオ１２に関しては“２２．２チャネル”とのモード記述がなされている。受信端末２００が２２．２チャネル対応であればオーディオ１１およびオーディオ１２の双方が選択合成され、２２．２チャネルでの音声再生が行われる。一方、受信端末２００がステレオ対応であればオーディオ１１のみが選択され、ステレオでの音声再生が行われる。

　次に、ビュー選択で、サブビュー２が選択され、ビデオ３が選ばれたとする。このビデオ３のアセット情報では、ロケーション情報として、アダプテーションセットＩＤ「asid」が“as1”であるＭＰＤファイルのアダプテーションセットの情報位置が指定されている。この場合、ＤＡＳＨセグメントサーバ４００から映像信号の取得が行われるが、ＭＰＤファイルに基づいて映像信号のアダプティブな切り替えが時々刻々に行われ、２Ｋでの映像再生が行われる。

　また、ビデオ３のアセット情報には、アセットグループ記述子「Asset_Gp_desc」が存在する。この記述子により、ビデオ３とオーディオ３が組み合わされていることがわかる。ビデオ３が選ばれることで、オーディオ３も選ばれる。このオーディオ３のアセット情報では、ロケーション情報として、アダプテーションセットＩＤ「asid」が“as2”であるＭＰＤファイルのアダプテーションセットの情報位置が指定されている。この場合、ＭＰＤファイルに基づいて、ＤＡＳＨセグメントサーバ４００から音声信号が取得され、ステレオでの音声再生が行われる。

　次に、受信端末２００のビュー表示変更の一例について説明する。図３９(ａ)は、選局操作により番組再生が開始されたときの状態を示している。この状態では、デフォルトのメインビューが表示されると共に、マルチビュー対応番組なので、ユーザ選択のためのＧＵＩ表示も現れる。

　図３９(ｂ)は、ユーザが「マルチビュー」の表示を選択したときの状態を示している。この状態では、メインビュー、サブビュー１、サブビュー２のマルチビュー表示となる。図３９(ｃ)は、ユーザが「サブビュー１」の表示を選択したときの状態を示している。この状態では、サブビュー１の映像の全画面表示となる。

　上述したように、図１に示す放送・通信ハイブリッドシステム１０においては、ＭＰテーブル（ＭＰＴ）に、３レイヤのコンポーネント選択情報が挿入されている。そして、アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、ＭＰＤファイルの特定のアダプテーションセットあるいはリプレゼンテーションの情報位置を指定するものとされる。そのため、例えば放送・通信のハイブリッドシステムにおいて、受信側におけるコンポーネント選択、特にアダプティブレイヤでのコンポーネント選択の容易性を確保することが可能となる。

　＜２．変形例＞
　なお、上述実施の形態においては、受信端末２００がＭＰＤファイルを放送から取得し得る例を示した。しかし、本技術は、これに限定されるものではなく、受信端末２００は、ＭＰＤファイルを他の方法で取得してもよい。例えば、放送送出システム１００に関連したネットワークサーバから通信により取得することも考えられる。

　また、本技術は、以下のような構成を取ることもできる。
　（１）所定のコンポーネントを含む第１の伝送パケットと、上記所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを生成する伝送ストリーム生成部と、
　上記伝送ストリームを所定の伝送路を通じて送信する送信部と、
　上記第２の伝送パケットに、コンポーネント選択情報を挿入する情報挿入部を備え、
　上記コンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成され、
　上記アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、
　上記アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされる
　送信装置。
　（２）上記伝送パケットは、ＭＭＴパケットであり、
　上記コンポーネント選択情報は、ＭＰＴに含まれている
　前記（１）に記載の送信装置。
　（３）上記アダプティブストリーミングのためのデータストリームは、ＭＰＥＧ－ＤＡＳＨベースのデータストリームであり、
　上記メタファイルは、ＭＰＤファイルであり、
　上記メタファイルの特定の情報位置を指定する情報は、特定のアダプテーションセットあるいは特定のリプレゼンテーションを指定する情報とされる
　前記（２）に記載の送信装置。
　（４）上記所定の伝送路は、放送伝送路である
　前記（１）から（３）のいずれかに記載の送信装置。
　（５）所定のコンポーネントを含む第１の伝送パケットと、上記所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを生成する伝送ストリーム生成ステップと、
　送信部により、上記伝送ストリームを所定の伝送路を通じて送信する送信ステップと、
　上記第２の伝送パケットに、コンポーネント選択情報を挿入する情報挿入ステップを有し、
　上記コンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成され、
　上記アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、
　上記アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされる
　送信方法。
　（６）所定のコンポーネントを含む第１の伝送パケットと、上記所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを、所定の伝送路を通じて受信する受信部を備え、
　上記第２の伝送パケットには、コンポーネント選択情報が挿入されており、
　上記コンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成されており、
　上記アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、
　上記アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされており、
　上記コンポーネント選択情報に基づいて提示すべきコンポーネントを選択するコンポーネント選択部をさらに備える
　受信装置。
　（７）上記メタファイルを取得するメタファイル取得部をさらに備える
　前記（６）に記載の受信装置。
　（８）上記コンポーネント選択部は、
　上記コンポーネント選択情報に上記ユーザに選択させるべき特定の属性に関するバリエーションが存在する場合、画面上に選択のグラフィクスユーザインタフェースを表示する
　前記（６）または（７）に記載の受信装置。
　（９）上記伝送パケットは、ＭＭＴパケットであり、
　上記各コンポーネントの選択情報は、ＭＰＴに含まれている
　前記（６）から（７）のいずれかに記載の受信装置。
　（１０）上記アダプティブストリーミングのためのデータストリームは、ＭＰＥＧ－ＤＡＳＨベースのデータストリームであり、
　上記メタファイルは、ＭＰＤファイルであり、
　上記メタファイルの特定の情報位置を指定する情報は、特定のアダプテーションセットあるいは特定のリプレゼンテーションを指定する情報とされている
　前記（９）に記載の受信装置。
　（１１）上記所定の伝送路は、放送伝送路である
　前記（６）から（１０）のいずれかに記載の受信装置。
　（１２）受信部により、所定のコンポーネントを含む第１の伝送パケットと、上記所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを、所定の伝送路を通じて受信する受信ステップを有し、
　上記第２の伝送パケットには、コンポーネント選択情報が挿入されており、
　上記コンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成されており、
　上記アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、
　上記アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされており、
　上記コンポーネント選択情報に基づいて提示すべきコンポーネントを選択するコンポーネント選択ステップをさらに有する
　受信方法。

　１０・・・放送・通信ハイブリッドシステム
　１００・・・放送送出システム
　１１１・・・時計部
　１１２・・・信号送出部
　１１３・・・ビデオエンコーダ
　１１４・・・オーディオエンコーダ
　１１５・・・キャプションエンコーダ
　１１６・・・シグナリング発生部
　１１８・・・ＴＬＶシグナリング発生部
　１１９-1～１１９-N・・・ＩＰサービス・マルチプレクサ
　１２０・・・ＴＬＶ・マルチプレクサ
　１２１・・・変調/送信部
　１２０・・・配信サーバ
　２００・・・受信端末
　２０１・・・ＣＰＵ
　２０２・・・チューナ/復調部
　２０２・・・デマルチプレクサ
　２０３・・・ネットワークインタフェース部
　２０４・・・デマルチプレクサ
　２０５・・・システムクロック生成部
　２０６・・・ビデオデコーダ
　２０７・・・オーディオデコーダ
　２０８・・・キャプションデコーダ
　２１０・・・合成部
　２１１・・・ＣＰＵバス
　３００・・・配信サーバ
　４００・・・ＤＡＳＨセグメントサーバ
　５００・・・通信ネットワーク

Claims

　所定のコンポーネントを含む第１の伝送パケットと、上記所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを生成する伝送ストリーム生成部と、
　上記伝送ストリームを所定の伝送路を通じて送信する送信部と、
　上記第２の伝送パケットに、コンポーネント選択情報を挿入する情報挿入部を備え、
　上記コンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成され、
　上記アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、
　上記アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされる
　送信装置。
　上記伝送パケットは、ＭＭＴパケットであり、
　上記コンポーネント選択情報は、ＭＰＴに含まれている
　請求項１に記載の送信装置。
　上記アダプティブストリーミングのためのデータストリームは、ＭＰＥＧ－ＤＡＳＨベースのデータストリームであり、
　上記メタファイルは、ＭＰＤファイルであり、
　上記メタファイルの特定の情報位置を指定する情報は、特定のアダプテーションセットあるいは特定のリプレゼンテーションを指定する情報とされる
　請求項２に記載の送信装置。
　上記所定の伝送路は、放送伝送路である
　請求項１に記載の送信装置。
　所定のコンポーネントを含む第１の伝送パケットと、上記所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを生成する伝送ストリーム生成ステップと、
　送信部により、上記伝送ストリームを所定の伝送路を通じて送信する送信ステップと、
　上記第２の伝送パケットに、コンポーネント選択情報を挿入する情報挿入ステップを有し、
　上記コンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成され、
　上記アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、
　上記アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされる
　送信方法。
　所定のコンポーネントを含む第１の伝送パケットと、上記所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを、所定の伝送路を通じて受信する受信部を備え、
　上記第２の伝送パケットには、コンポーネント選択情報が挿入されており、
　上記コンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成されており、
　上記アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、
　上記アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされており、
　上記コンポーネント選択情報に基づいて提示すべきコンポーネントを選択するコンポーネント選択部をさらに備える
　受信装置。
　上記メタファイルを取得するメタファイル取得部をさらに備える
　請求項６に記載の受信装置。
　上記コンポーネント選択部は、
　上記コンポーネント選択情報に上記ユーザに選択させるべき特定の属性に関するバリエーションが存在する場合、画面上に選択のグラフィクスユーザインタフェースを表示する
　請求項６に記載の受信装置。
　上記伝送パケットは、ＭＭＴパケットであり、
　上記各コンポーネントの選択情報は、ＭＰＴに含まれている
　請求項６に記載の受信装置。
　上記アダプティブストリーミングのためのデータストリームは、ＭＰＥＧ－ＤＡＳＨベースのデータストリームであり、
　上記メタファイルは、ＭＰＤファイルであり、
　上記メタファイルの特定の情報位置を指定する情報は、特定のアダプテーションセットあるいは特定のリプレゼンテーションを指定する情報とされている
　請求項９に記載の受信装置。
　上記所定の伝送路は、放送伝送路である
　請求項６に記載の受信装置。
　受信部により、所定のコンポーネントを含む第１の伝送パケットと、上記所定のコンポーネントに関するシグナリング情報を含む第２の伝送パケットとが時分割的に多重化された伝送ストリームを、所定の伝送路を通じて受信する受信ステップを有し、
　上記第２の伝送パケットには、コンポーネント選択情報が挿入されており、
　上記コンポーネント選択情報は、上位から、固定的な選択を行うセレクティブレイヤ情報、合成を行うコンポジットレイヤ情報および動的な切り替えを行うアダプティブレイヤ情報により構成されており、
　上記アダプティブレイヤで選択し得る各コンポーネントの情報には取得先情報が含まれており、
　上記アダプティブレイヤで選択し得る各コンポーネントのうち、アダプティブ切り替えの対象となっているコンポーネントの取得先情報は、アダプティブストリーミングのためのデータストリーム取得情報を持つメタファイルの特定の情報位置を指定する情報とされており、
　上記コンポーネント選択情報に基づいて提示すべきコンポーネントを選択するコンポーネント選択ステップをさらに有する
　受信方法。