以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明は以下の順序で行う。
1.実施の形態
2.変形例
<1.実施の形態>
[送受信システム]
図1は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、送信装置100と、受信装置200とを有する構成となっている。
送信装置100は、コンテナとしてのトランスポートストリームTSを放送波あるいはネットのパケットに載せて送信する。このトランスポートストリームTSには、複数のサービスのビデオストリームが連続的に含まれる。この場合、各ビデオストリームは、第1からNのうち、第1から第M(M≦N)のストリームで構成される。この場合、第1からNのストリームのそれぞれに固定のPID(パケット識別子)が付与される。
また、各ビデオストリームを構成する第1から第Mのストリームは、動画像データを構成する各ピクチャの画像データが複数の階層に分類され、この分類された各階層のピクチャの画像データが符号化されると共に、複数の階層がM個の階層組に分割され、この分割された各階層組のピクチャの符号化画像データをそれぞれ持つものとされる。この場合、第1から第Mの各ストリームのそれぞれに含めるピクチャの階層が予め割り当てられた互いに独立した範囲に収まるように階層符号化される。
図2は、サービス切換えのケースの一例を示している。図2(a)は、2160/60/pのビデオフォーマットのサービスから、2160/120/pのビデオフォーマットのサービスへの切替えを示している。この場合、1ストリームから2ストリームへの切替えとなる。図2(b)は、1080/60/pのビデオフォーマットのサービスから、2160/60/pのビデオフォーマットのサービスへの切替えを示している。この場合、1ストリームから1ストリームへの切替えとなる。
図2(c)は、1080/60/pのビデオフォーマットのサービスから、2160/120/pのビデオフォーマットのサービスへの切替えを示している。この場合、1ストリームから2ストリームへの切替えとなる。図2(d)は、2160/120/pのビデオフォーマットのサービスから、1080/60/pのビデオフォーマットのサービスへの切替えを示している。この場合、2ストリームから1ストリームへの切替えとなる。
図2(e)は、1080/60/pのビデオフォーマットのサービスから、1080/60/iのビデオフォーマットのサービスへの切替えを示している。この場合、1ストリームから1ストリームへの切替えとなる。図2(f)は、2160/60/pのビデオフォーマットの3番組サービスから、4320/60/pのビデオフォーマットのサービスへの切替えを示している。この場合、3ストリームから1ストリームへの切替えとなる
図3は、階層符号化の一例を示し、矩形枠のそれぞれがピクチャを示している。図3(a)は、最上位階層が3とされた例であって、0から3の階層の全てが基本ストリームの階層範囲とされた例である。この例では、0から3の全ての階層にピクチャが存在している。図3(b)は、最上位階層が3とされた例であって、0から3の階層の全てが基本ストリームの階層範囲とされた例である。この例では、3の階層にはピクチャが存在しておらず、階層ギャップとなっている。図3(c)は、最上位階層が3とされた例であって、0から3の階層の全てが基本ストリームの階層範囲とされた例である。この例では、2の階層にはピクチャが存在しておらず、階層ギャップとなっている。
図3(d)は、最上位階層が4とされた例であって、0から3の階層が基本ストリームの階層範囲とされ、4の階層が拡張ストリームの階層範囲とされた例である。この例では、3の階層にはピクチャが存在しておらず、階層ギャップとなっている。図3(e)は、最上位階層が3とされた例であって、0から2の階層が基本ストリームの階層範囲とされ、3の階層が拡張ストリームの階層範囲とされた例である。この例では、0から3の全ての階層にピクチャが存在している。
階層符号化においては、例えば、H.264/AVC、H.265/HEVCなどの符号化が施され、被参照ピクチャが自己階層および/または自己階層よりも低い階層に所属するように符号化される。各階層のピクチャの符号化画像データに、ピクチャ毎に、所属階層を識別するための階層識別情報(temporal_id)が付加される。各ピクチャのNALユニット(nal_unit)のヘッダ部分に、階層識別情報(temporal_id)を意味する“nuh_temporal_id_plus1”)が配置される。このように階層識別情報が付加されることで、受信側では、各ピクチャの所属階層を知ることができる。
図4(a)は、NALユニットヘッダの構造例(Syntax)を示し、図4(b)は、その構造例における主要なパラメータの内容(Semantics)を示している。「Forbidden_zero_bit」の1ビットフィールドは、0が必須である。「Nal_unit_type」の6ビットフィールドは、NALユニットタイプを示す。「Nuh_layer_id」の6ビットフィールドは、0を前提とする。「Nuh_temporal_id_plus1」の3ビットフィールドは、temporal_idを示し、1を加えた値(1〜6)をとる。
各サービスのビデオストリームの送信期間において、コンテナのレイヤに、PID(パケット識別子)情報が挿入される。この場合、例えば、以下の第1、第2のPID情報挿入態様のいずれかで挿入される。このPID情報は、例えば、プログラムマップテーブル(PMT:Program Map Table)の配下に挿入される。
「第1のPID情報挿入態様」
第1のPID情報挿入態様では、あるサービスのビデオストリームの送信期間において、常には、そのビデオストリームを構成する各ストリームのPID情報が挿入され、次のサービスのビデオストリームの送信期間が開始される直前のタイミングでこのビデオストリームを構成する各ストリームのPID情報が挿入される。
「第2のPID情報挿入態様」
第2のPID情報挿入態様では、各サービスのビデオストリームの送信期間おいて、第1から第Nの各ストリームのPID情報が挿入される。
また、各サービスのビデオストリームの送信期間において、コンテナのレイヤに、階層範囲情報が挿入される。この階層範囲情報は、例えば、プログラムマップテーブル(PMT)の配下に挿入される。この場合、あるサービスのビデオストリームの送信期間において、常には、そのビデオストリームを構成する各ストリームのピクチャの階層範囲情報が挿入され、次のサービスのビデオストリームの送信期間が開始される直前のタイミングでこのビデオストリームを構成する各ストリームのピクチャの階層範囲情報が挿入される。
また、各サービスのビデオストリームの送信期間において、コンテナのレイヤに、切り替え情報が挿入される。この切り替え情報には、例えば、次のサービスのビデオストリームが持つ符号化画像データのフレームレート情報、ストリーム構成情報等が含まれる。この切り替え情報は、例えば、プログラムマップテーブル(PMT)の配下に挿入される。
受信装置200は、送信装置100から放送波あるいはネットのパケットに載せて送られてくる上述のトランスポートストリームTSを受信する。このトランスポートストリームTSには、複数のサービスのビデオストリームが連続的に含まれている。各ビデオストリームは、第1からNのうち、第1から第M(M≦N)のストリームで構成されている。ここで、第1からNのストリームのそれぞれに固定のPID(パケット識別子)が付与される。
受信装置200は、コンテナのレイヤに挿入されているPID(パケット識別子)情報から、トランスポートストリームTSに含まれているビデオストリームを構成する各ストリームのPIDを認識する。受信装置200は、ビデオストリームを構成する各ストリームを、それに付与されているPIDに基づいてフィルタリングして処理する。受信装置200は、トランスポートストリームTSに連続的に含まれる各サービスのビデオストリームによる画像を順次表示する。
この場合、第1からNのストリームのそれぞれに固定のPID(パケット識別子)が付与されることから、サービスが切り替わる場合にあっても、各ストリームを取り出すフィルタの設定を変更することを要せず、従って、表示ミュートの発生が抑制され、シームレス表示が行われる。
受信装置200は、コンテナのレイヤに挿入されている階層範囲情報から、トランスポートストリームTSに含まれているビデオストリームを構成する各ストリームのピクチャの階層範囲を認識する。この場合、第1から第Mの各ストリームのそれぞれに含めるピクチャの階層が予め割り当てられた互いに独立した範囲に収まるように階層符号化されていることから、所定の階層が、どのストリームに含まれるか、システムレイヤとビデオレイヤとで不一致になることが回避される。
また、受信装置200は、コンテナのレイヤに挿入されている切り替え情報から、サービスの切り替え前に、次のサービスのビデオストリームが持つ符号化画像データのフレームレート情報等を認識する。
この実施の形態では、N=2とされ、各ビデオストリームは、基本ストリーム(Base stream)のみで構成されるか、あるいは基本ストリーム(Base stream)および拡張ストリーム(Enhanced stream)で構成される。ここで、60Pのサービスの場合には、ビデオストリームは基本ストリームのみで構成され、120Pのサービスの場合には、ビデオストリームは基本ストリームおよび拡張ストリームで構成されるものとする。
そして、この実施の形態では、拡張ストリームに含めるピクチャの階層が一つとなるように符号化される。また、基本ストリームのみで構成されるビデオストリームの送信期間では、以下の第1、第2の態様のいずれかの態様とされる。第1の態様では、基本ストリームの階層範囲情報のみが挿入される。第2の態様では、基本ストリームの階層範囲情報が挿入される他、拡張ストリームが取り得る階層範囲の情報が挿入される。
この場合、例えば、最小(mix)と最大(max)の値が異なる値とされ、実際には拡張ストリームが存在しないことをも意味するものとされる。すなわち、この実施の形態では、拡張ストリームに含めるピクチャの階層が一つとなるように符号化されるものであり、拡張ストリームが存在する場合には、最小(mix)と最大(max)の値は同じくなるからである。
「送信装置の構成」
図5は、送信装置100の構成例を示している。この送信装置100は、CPU(Central Processing Unit)101と、エンコーダ102A,102Bと、圧縮データバッファ(cpb:coded picture buffer)103A,103Bと、マルチプレクサ104と、送信部105を有している。CPU101は、制御部であり、送信装置100の各部の動作を制御する。
エンコーダ102Aは、フレーム周波数が60Hzの非圧縮の動画像データVDAを入力し、例えば、H.264/AVC、H.265/HEVCなどの符号化を行う。この際、エンコーダ102Aは、この動画像データVDAを構成する各ピクチャの画像データを複数の階層に分類し、この分類された各階層のピクチャの画像データを符号化し、各階層のピクチャの符号化画像データを持つ60Pのサービスに係るビデオストリームを生成する。圧縮データバッファ(cpb)103Aは、このビデオストリームを、一時的に蓄積する。
このビデオストリームには、基本ストリームのみが含まれる。つまり、エンコーダ102Aは、階層符号化されて得られる全ての階層のピクチャの符号化画像データを持つ基本ストリームを生成する。なお、この基本ストリームに含められるピクチャの階層範囲が予め割り当てられた範囲となるように階層符号化される。例えば、基本ストリームに含められるピクチャの階層範囲が0〜3の階層であるとき、例えば、図3(a)〜(c)に示すように、最上位階層が3以下となるように階層符号化される。
エンコーダ102Bは、フレーム周波数が120Hzの非圧縮の動画像データVDBを入力し、例えば、H.264/AVC、H.265/HEVCなどの符号化を行う。この際、エンコーダ102Bは、この動画像データVDBを構成する各ピクチャの画像データを複数の階層に分類し、この分類された各階層のピクチャの画像データを符号化し、各階層のピクチャの符号化画像データを持つ120Pのサービスに係るビデオストリームを生成する。圧縮データバッファ(cpb)103Bは、このビデオストリームを、一時的に蓄積する。
このビデオストリームには、基本ストリームおよび拡張ストリームが含まれる。つまり、エンコーダ102Bは、複数の階層を二分し、低階層側のピクチャの符号化画像データを持つ基本ストリームと、高階層側のピクチャの符号化画像データを持つ拡張ストリームを生成する。
なお、この基本ストリームおよび拡張ストリームに含められるピクチャの階層範囲が予め割り当てられた範囲となるように階層符号化され、かつ拡張ストリームに含めるピクチャの階層が一つとなるように符号化される。例えば、基本ストリームに含められるピクチャの階層範囲が0〜3の階層であり、拡張ストリームに含められるピクチャの階層範囲が4〜5の階層であるときには、例えば、図3(d)に示すように、基本ストリームに含められるピクチャの階層は3以下とされ、拡張ストリームに含められるピクチャの階層は4とされる。
マルチプレクサ104は、60Pのサービスを行う場合、圧縮データバッファ103Aに蓄積されているビデオストリームを読み出し、PESパケット化し、さらにトランスポートパケット化して多重し、多重化ストリームとしてのトランスポートストリームTSを得る。このトランスポートストリームTSには、上述したように、基本ストリームのみが含まれる。マルチプレクサ104は、この基本ストリームに固定のPID(=PID_1)を付与する。
また、マルチプレクサ104は、120Pのサービスを行う場合、圧縮データバッファ103Bに蓄積されているビデオストリームを読み出し、PESパケット化し、さらにトランスポートパケット化して多重し、多重化ストリームとしてのトランスポートストリームTSを得る。このトランスポートストリームTSには、上述したように、基本ストリームおよび拡張ストリームが含まれる。マルチプレクサ104は、基本ストリームに固定のPID(=PID_1)を付与すると共に、拡張ストリームに固定のPID(=PID_2)を付与する。
送信部105は、マルチプレクサ104で得られたトランスポートストリームTSを、放送波あるいはネットのパケットに載せて、受信装置200に送信する。この場合、例えば、60Pのサービスに係るトランスポートストリームTSが送信され、続いて120Pのサービスに係るトランスポートストリームTSが送信される。あるいは、120Pのサービスに係るトランスポートストリームTSが送信され、続いて60Pのサービスに係るトランスポートストリームTSが送信される。
マルチプレクサ140は、各サービスのビデオストリームの送信期間において、プログラムマップテーブル(PMT)の配下に、PID情報を挿入する。この場合、マルチプレクサ140は、以下の第1のPID情報挿入態様あるいは第2のPID情報挿入態様で、PID情報を挿入する。
すなわち、第1のPID情報挿入態様では、あるサービスのビデオストリームの送信期間において、常には、そのビデオストリームを構成する各ストリームのPID情報を挿入し、次のサービスのビデオストリームの送信期間が開始される直前のタイミングでこのビデオストリームを構成する各ストリームのPID情報を挿入する。また、第2のPID情報挿入態様では、各サービスのビデオストリームの送信期間おいて、基本ストリームおよび拡張ストリームの両方のPID情報を挿入する。
また、マルチプレクサ104は、各サービスのビデオストリームの送信期間において、プログラムマップテーブル(PMT)の配下に、階層範囲情報を挿入する。この場合、あるサービスのビデオストリームの送信期間において、常には、そのビデオストリームを構成する各ストリームのピクチャの階層範囲情報を挿入し、次のサービスのビデオストリームの送信期間が開始される直前のタイミングでこのビデオストリームを構成する各ストリームのピクチャの階層範囲情報を挿入する。
ここで、マルチプレクサ104は、基本ストリームのみで構成されるビデオストリームの送信期間においては、以下の第1の態様あるいは第2の態様で、階層範囲情報を挿入する。すなわち、第1の態様では、基本ストリームの階層範囲情報のみ挿入する。また、第2の態様では、基本ストリームの階層範囲情報と共に、拡張ストリームが取り得る階層範囲の情報も挿入する。
上述したように、拡張ストリームに含めるピクチャの階層は一つとされるが、この拡張ストリームが取り得る階層範囲の情報は、例えば複数の階層を含むものとされる。これにより、この拡張ストリームが取り得る階層範囲の情報は、文字通り拡張ストリームが取り得る階層範囲を示す他、実際には拡張ストリームが存在していないことを示唆するものとなる。
この階層範囲情報の挿入には、既存のHEVCデスクリプタ(HEVC descriptor)の「temporal_id_min」、「temporal_id_max」のフィールドを用いる。図6は、HEVCデスクリプタ(HEVC_descriptor)の構造例(Syntax)を示している。「descriptor_tag」の8ビットフィールドは、デスクリプタタイプを示し、ここでは、HEVCデスクリプタであることを示す。「descriptor_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして、以降のバイト数を示す。
「level_idc」の8ビットフィールドは、ビットレートのレベル指定値を示す。また、「temporal_layer_subset_flag = 1」であるとき、「temporal_id_min」の5ビットフィールドと、「temporal_id_max」の5ビットフィールドが存在する。「temporal_id_min」は、対応するビデオストリームに含まれる階層符号化データの最も低い階層のtemporal_idの値を示す。「temporal_id_max」は、対応するビデオストリームが持つ階層符号化データの最も高い階層のtemporal_idの値を示す。
また、マルチプレクサ140は、各サービスのビデオストリームの送信期間において、少なくとも、次のサービスのビデオストリームの送信期間が開始される直前のタイミングで、プログラムマップテーブル(PMT)の配下に、切り替え情報を挿入する。この切り替え情報の挿入には、新規定義するシームレス・スイッチ・デスクリプタ(Seamless_switch descriptor)、あるいは既存のビデオ・デコード・コントロール・デスクリプタ(Video_decode_control descriptor)を用いる。
図7は、シームレス・スイッチ・デスクリプタの構造例(Syntax)を示している。また、図8は、その構造例における主要な情報の内容(Semantics)を示している。「descriptor_tag」の8ビットフィールドは、デスクリプタタイプを示す。ここでは、シームレス・スイッチ・デスクリプタであることを示す。「descriptor_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして、以降のバイト数を示す。
「EOS_flag」の1ビットフィールドは、ストリームの最後に、“end_of_seq ”が符号化されていることを示すフラグである。“1”は、符号化されていることを示す。“0”は、符号化されていないことを示す。「number_of_streams」の3ビットフィールドは、切り替え後のサービス・ストリームの数を示す。「frame_rate」の4ビットフィールドは、切り替え後のサービス・ストリームのフレーム周波数を示す。例えば、“1001”は60Hzを示し、“1100”は120Hzを示す。
「spatial_resolution」の4ビットフィールドは、切り替え後のサービス・ストリームの空間解像度を示す。例えば、“0001”は720(h)*480(v)を示し、“0010”は1280(h)*720(v)を示し、“0011”は1920(h)*1080(v)を示し、“0100”は3840(h)*2160(v)を示し、“0101”は7680(h)*4320(v)を示す。「scanning_format」の1ビットフィールドは、フレーム構造を示す。“1”はプログレッシブを示し、“0”はインターレースを示す。
図9は、ビデオ・デコード・コントロール・デスクリプタの構造例(Syntax)を示している。また、図10は、その構造例における主要な情報の内容(Semantics)を示している。「descriptor_tag」の8ビットフィールドは、デスクリプタタイプを示す。ここでは、ビデオ・デコード・コントロール・デスクリプタであることを示す。「descriptor_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして、以降のバイト数を示す。
「sequence_end_code_flag」の1ビットフィールドは、ストリームの最後に、“end_of_seq ”が符号化されていることを示すフラグである。“1”は、符号化されていることを示す。“0”は、符号化されていないことを示す。「video_encode_format」の4ビットフィールドは、切り替え後のサービス・ストリームのフォーマットを示す。例えば、“0000”は1080p(2K)を示し、“0111”は2160p(4K)を示し、“1000”は4320p(8K)を示す。
「frame_rate_type」の1ビットフィールドは、新規定義するフィールドであり、切り替え後のストリームのフレーム周波数の型を示し、“1”は従来からの、60Hz以下のフレームレートを、“0”は120Hz以上を構成することを示す。「stream_not_extended_flag」の1ビットフィールドは、新規定義するフィールドであり、切り替え後のストリームに拡張ストリームが存在しないことを示し、“1”は別PIDの拡張ストリームは存在しない、“0”は別PIDの拡張ストリームが多重化され、それと合わせて120pを構成することを示す。
図11は、マルチプレクサ104の構成を概略的に示している。マルチプレクサ104は、セクション情報(デスクリプタを含む)発生部141と、ヌルパケット発生部142と、セレクタ143と、PID割り当て部144と、TS多重化部145を有している。セレクタ143は、外部から入力される60Pサービスのビデオストリーム(基本ストリーム)、120Pサービスのビデオストリーム(基本ストリーム、拡張ストリーム)、さらにはその他のサービスのストリーム、さらにはセクション情報発生部141で発生されるセクション情報やヌルパケット発生部142で発生されるヌルパケットを入力し、いずれかを選択的に取り出す。
PID割り当て部144は、セレクタ143で選択的に取り出された各信号、つまりビデオストリーム、セクション情報、ヌルパケット等にPIDを割り当てる。TS多重化部145は、各信号を多重化し、トランスポートストリームTSを得る。
[トランスポートストリームTSの構成]
図12は、60Pのサービスのビデオストリーム(基本ストリームのみ含む)を送信する場合におけるトランスポートストリームTSの構成例を示している。この構成例では、PID1で識別される基本ストリームのPESパケット「video PES1」が存在する。ここで、PID1は基本ストリームに固定のPIDである。
各ピクチャの符号化画像データには、VPS、SPS、PPS、SLICE、SEIなどのNALユニットが存在する。上述したように、NALユニットのヘッダには、そのピクチャの階層識別情報(temporal_idを意味する“nuh_temporal_id_plus1”)が配置されている。SPSには、ビットストリームのレベル指定値である「general_level_idc」が挿入されている。
また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。PSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。PMTには、プログラム全体に関連する情報を記述するプログラム・ループ(Program loop)が存在する。また、PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリ・ループが存在する。この構成例では、基本ストリームに対応したビデオエレメンタリ・ループ(video ES1 loop)が存在する。
このビデオエレメンタリ・ループ(video ES1 loop)には、基本ストリーム(video PES1)に対応して、ストリームタイプ、PID(パケット識別子)等の情報が配置されると共に、そのビデオストリームに関連する情報を記述するデスクリプタも配置される。基本ストリームの「Stream_type」の値は「0x24」に設定され、PID情報は、上述したように基本ストリームのPESパケット「video PES1」に付与されるPID1を示すものとされる。
また、ビデオエレメンタリ・ループ(video ES1 loop)に配置されるデスクリプタとして、上述したHEVCデスクリプタ(HEVC descriptor)やシームレス・スイッチ・デスクリプタ(Seamless_switch descriptor)が挿入される。なお、「frame_rate」のフィールドが新規定義されたビデオ・デコード・コントロール・デスクリプタ(Video_decode_control descriptor)用いられる場合は、シームレス・スイッチ・デスクリプタの挿入は不要となる。
図示の例では、HEVCデスクリプタにおいて、「level_idc 」は“level5.1”に設定されている。また、「temporal_id_min = 0」、「temporal_id_max = 3」に設定されており、基本ストリームの階層範囲が0から3の階層であることが示されている。
なお、第1の態様では、PMTの配下には、基本ストリームに対応したビデオエレメンタリ・ループ(video ES1 loop)のみが存在するが、第2の態様では、破線図示する、拡張ストリームに対応したビデオエレメンタリ・ループ(video ES2 loop)も存在する。
このビデオエレメンタリ・ループ(video ES2 loop)には、実際には存在しない拡張ストリーム(video PES2)に対応して、ストリームタイプ、PID(パケット識別子)等の情報が配置されると共に、そのビデオストリームに関連する情報を記述するデスクリプタも配置される。拡張ストリームの「Stream_type」の値は「0x25」に設定され、PID情報は、拡張ストリームのPESパケット「video PES2」に付与されるPID2を示すものとされる。
また、ビデオエレメンタリ・ループに配置されるデスクリプタとして、上述したHEVCデスクリプタ(HEVC descriptor)やシームレス・スイッチ・デスクリプタ(Seamless_switch descriptor)が挿入される。なお、「frame_rate」のフィールドが新規定義されたビデオ・デコード・コントロール・デスクリプタ(Video_decode_control descriptor)用いられる場合は、シームレス・スイッチ・デスクリプタの挿入は不要となる。
図示の例では、HEVCデスクリプタにおいて、「level_idc 」は“level5.2”に設定されている。また、「temporal_id_min = 5」、「temporal_id_max = 6」に設定されており、拡張ストリームが取り得る階層範囲が5,6の階層であることが示され、かつ実際には拡張ストリームが存在していないことが示される。
なお、60Pのサービスのビデオストリーム(基本ストリームのみ含む)を送信する場合におけるトランスポートストリームTSに含まれるPMTは、常には、図示の内容とされるが、次のサービスのビデオストリームの送信が開始される直前のタイミングでは、そのビデオストリームに対応した内容の新PMTに更新される。
図13は、120Pのサービスのビデオストリーム(基本ストリーム、拡張ストリームを含む)を送信する場合におけるトランスポートストリームTSの構成例を示している。この構成例では、PID1で識別される基本ストリームのPESパケット「video PES1」と、PID2で識別される拡張ストリームのPESパケット「video PES2」が存在する。ここで、「stream_id」が同じサービス(放送チャンネル)で、PID1は基本ストリームに固定のPIDであり、PID2は拡張ストリームに固定のPIDである。
基本ストリームの各ピクチャの符号化画像データには、VPS、SPS、PPS、SLICE、SEIなどのNALユニットが存在する。NALユニットのヘッダには、そのピクチャの階層識別情報(temporal_idを意味する“nuh_temporal_id_plus1”)が配置されている。SPSには、ビットストリームのレベル指定値である「general_level_idc」が挿入されている。また、SPSには、“temporal_id”で示される各階層に属するピクチャがサブレイヤ(sub_layer)として括られ、“sublayer_level_presented_flag”が“1”とされることで、サブレイヤごとのビットレートのレベル指定値である「sublayer_level_idc」が挿入される。
一方、拡張ストリームの各ピクチャの符号化画像データには、PPS、SLICEなどのNALユニットが存在する。NALユニットのヘッダには、そのピクチャの階層識別情報(temporal_idを意味する“nuh_temporal_id_plus1”)が配置されている。
また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。このPSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。
PMTには、プログラム全体に関連する情報を記述するプログラム・ループ(Program loop)が存在する。また、PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリ・ループが存在する。この構成例では、2つのビデオエレメンタリ・ループ(video ES1 loop, video ES2 loop )が存在する。
各ビデオエレメンタリ・ループには、ビデオストリーム(video PES1, video PES2)に対応して、ストリームタイプ、パケット識別子(PID)等の情報が配置されると共に、そのビデオストリームに関連する情報を記述するデスクリプタも配置される。ビデオエレメンタリ・ループ(video ES1 loop)に関しては、詳細説明は省略するが、図12におけるTS構成と同様である。
ビデオエレメンタリ・ループ(video ES2 loop)には、拡張ストリーム(video PES2)に対応して、ストリームタイプ、PID(パケット識別子)等の情報が配置されると共に、そのビデオストリームに関連する情報を記述するデスクリプタも配置される。拡張ストリームの「Stream_type」の値は「0x25」に設定され、PID情報は、拡張ストリームのPESパケット「video PES2」に付与されるPID2を示すものとされる。
また、ビデオエレメンタリ・ループに配置されるデスクリプタとして、上述したHEVCデスクリプタ(HEVC descriptor)やシームレス・スイッチ・デスクリプタ(Seamless_switch descriptor)が挿入される。なお、「frame_rate」のフィールドが新規定義されたビデオ・デコード・コントロール・デスクリプタ(Video_decode_control descriptor)用いられる場合は、シームレス・スイッチ・デスクリプタの挿入は不要となる。図示の例では、HEVCデスクリプタにおいて、「level_idc 」は“level5.2”に設定されている。また、「temporal_id_min = 5」、「temporal_id_max = 5」に設定されており、拡張ストリームに含まれるピクチャの階層が5であることが示されている。
なお、120Pのサービスのビデオストリーム(基本ストリームのみ含む)を送信する場合におけるトランスポートストリームTSに含まれるPMTは、常には、図示の内容とされるが、次のサービスのビデオストリームの送信が開始される直前のタイミングでは、そのビデオストリームに対応した内容の新PMTに更新される。
図5に示す送信装置100の動作を簡単に説明する。エンコーダ102Aには、フレーム周波数が60Hzの非圧縮の動画像データVDAが入力される。このエンコーダ102Aでは、この動画像データVDAに対して、例えば、H.264/AVC、H.265/HEVCなどの符号化が行われる。この際、エンコーダ102Aでは、この動画像データVDAを構成する各ピクチャの画像データが複数の階層に分類され、この分類された各階層のピクチャの画像データが符号化され、各階層のピクチャの符号化画像データを持つ60Pのサービスに係るビデオストリームが生成される。
このビデオストリームには、基本ストリームのみが含まれる。つまり、エンコーダ102Aでは、階層符号化されて得られる全ての階層のピクチャの符号化画像データを持つ基本ストリームが生成される。なお、この基本ストリームに含められるピクチャの階層範囲が予め割り当てられた範囲となるように階層符号化される。エンコーダ102Aで生成された、各階層のピクチャの符号化データを含むビデオストリーム(基本ストリーム)は、圧縮データバッファ(cpb)103Aに供給され、一時的に蓄積される。
また、エンコーダ102Bには、フレーム周波数が120Hzの非圧縮の動画像データVDBが入力される。このエンコーダ102Bでは、例えば、H.264/AVC、H.265/HEVCなどの符号化が行われる。この際、エンコーダ102Bでは、この動画像データVDBを構成する各ピクチャの画像データが複数の階層に分類され、この分類された各階層のピクチャの画像データが符号化され、各階層のピクチャの符号化画像データを持つ120Pのサービスに係るビデオストリームが生成される。
このビデオストリームには、基本ストリームおよび拡張ストリームが含まれる。つまり、エンコーダ102Bでは、複数の階層が二分され、低階層側のピクチャの符号化画像データを持つ基本ストリームと、高階層側のピクチャの符号化画像データを持つ拡張ストリームが生成される。なお、この基本ストリームおよび拡張ストリームに含められるピクチャの階層範囲が予め割り当てられた範囲となるように階層符号化され、かつ拡張ストリームに含めるピクチャの階層が一つとなるように符号化される。エンコーダ102Bで生成された、各階層のピクチャの符号化データを含むビデオストリーム(基本ストリーム、拡張ストリーム)は、圧縮データバッファ(cpb)103Bに供給され、一時的に蓄積される。
マルチプレクサ104では、60Pのサービスを行う場合、圧縮データバッファ103Aに蓄積されているビデオストリームが読み出され、PESパケット化され、さらにトランスポートパケット化されて多重され、多重化ストリームとしてのトランスポートストリームTSが得られる。このトランスポートストリームTSには、基本ストリームのみが含まれる。マルチプレクサ104では、この基本ストリームに固定のPID(=PID_1)が付与される。
また、マルチプレクサ104では、120Pのサービスを行う場合、圧縮データバッファ103Bに蓄積されているビデオストリームが読み出され、PESパケット化され、さらにトランスポートパケット化されて多重され、多重化ストリームとしてのトランスポートストリームTSが得られる。このトランスポートストリームTSには、基本ストリームおよび拡張ストリームが含まれる。マルチプレクサ104では、基本ストリームに固定のPID(=PID_1)が付与されると共に、拡張ストリームに固定のPID(=PID_2)が付与される。
また、マルチプレクサ104では、各サービスのビデオストリームの送信期間において、プログラムマップテーブル(PMT)の配下に、PID情報が挿入される。ここで、第1のPID情報挿入態様では、あるサービスのビデオストリームの送信期間において、常には、そのビデオストリームを構成する各ストリームのPID情報が挿入され、次のサービスのビデオストリームの送信期間が開始される直前のタイミングでこのビデオストリームを構成する各ストリームのPID情報が挿入される。また、第2のPID情報挿入態様では、各サービスのビデオストリームの送信期間おいて、基本ストリームおよび拡張ストリームの両方のPID情報が挿入される。
また、マルチプレクサ104では、各サービスのビデオストリームの送信期間において、プログラムマップテーブル(PMT)の配下に、階層範囲情報が挿入される。この場合、あるサービスのビデオストリームの送信期間において、常には、そのビデオストリームを構成する各ストリームのピクチャの階層範囲情報が挿入され、次のサービスのビデオストリームの送信期間が開始される直前のタイミングでこのビデオストリームを構成する各ストリームのピクチャの階層範囲情報が挿入される。
ここで、マルチプレクサ104では、基本ストリームのみで構成されるビデオストリームの送信期間において、第1の態様では基本ストリームの階層範囲情報のみ挿入され、第2の態様では基本ストリームの階層範囲情報と共に、拡張ストリームが取り得る階層範囲の情報も挿入すされる。拡張ストリームに含めるピクチャの階層は一つとされるが、この拡張ストリームが取り得る階層範囲の情報は、例えば複数の階層を含むものとされる。
また、マルチプレクサ140では、各サービスのビデオストリームの送信期間において、少なくとも、次のサービスのビデオストリームの送信期間が開始される直前のタイミングで、プログラムマップテーブル(PMT)の配下に、切り替え情報が挿入される。この切り替え情報の挿入には、新規定義するシームレス・スイッチ・デスクリプタ(Seamless_switch descriptor)、あるいは既存のビデオ・デコード・コントロール・デスクリプタ(Video_decode_control descriptor)が用いられる。
送信部105では、マルチプレクサ104で得られたトランスポートストリームTSが、放送波あるいはネットのパケットに載せて、受信装置200に送信される。この場合、例えば、60Pのサービスに係るトランスポートストリームTSが送信され、続いて120Pのサービスに係るトランスポートストリームTSが送信される。あるいは、120Pのサービスに係るトランスポートストリームTSが送信され、続いて60Pのサービスに係るトランスポートストリームTSが送信される。
なお、上述では、エンコーダ102Aが60Pのサービスに係るビデオストリーム(基本ストリーム)を生成し、エンコーダ102Bが120Pのサービスに係るビデオストリーム(基本ストリーム、拡張ストリーム)を生成し、マルチプレクサ104でこれらを切り替える旨の説明をした。しかし、これと同じ効果を、エンコーダ102Bに持たせることも可能である。この場合、エンコーダ102Bは、フレーム周波数が120Hzの非圧縮の動画像データVDBを入力し、60Pのサービスに係るビデオストリーム(基本ストリーム)の出力と、120Pのサービスに係るビデオストリーム(基本ストリーム、拡張ストリーム)の出力とを、切り替えて出力する機能を持つ。
「受信装置の構成」
図14は、受信装置200の構成例を示している。この受信装置200は、CPU(Central Processing Unit)201と、受信部202と、デマルチプレクサ203と、圧縮データバッファ(cpb:coded picture buffer)204を有している。また、この受信装置200は、デコーダ205と、非圧縮データバッファ(dpb:decoded picture buffer)206と、ポスト処理部207と、表示部208を有している。CPU201は、制御部を構成し、受信装置200の各部の動作を制御する。
受信部202は、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSを受信する。デマルチプレクサ203は、トランスポートストリームTSから、それに含まれるビデオストリームを構成するストリームをPIDフィルタでフィルタリングして取り出し、圧縮データバッファ(cpb:coded picture buffer)204に送る。
この場合、基本ストリームや拡張ストリームにはそれぞれ固定のPIDが付与されている。そのため、例えば、60pサービスから120pサービスに、あるいはその逆にサービスの切り替えがあっても、各ストリームを取り出すフィルタの設定を変更することを要せず、従って、表示ミュートの発生を抑制でき、シームレス表示が可能となる。
図15は、デマルチプレクサ203の構成例を示している。このデマルチプレクサ203は、PIDフィルタ231と、多重化バッファ232_0〜232_n,232_null,232_cと、セクションフィルタ233と、PMT解析部234を有している。
PIDフィルタ231は、PIDに基づいて、トランスポートストリームTSに含まれるセクションデータ、ヌルパケットを通過させる。図示の例では、セクションデータのPID値をPID_cとし、ヌルパケットのPIDをPID_nullとしている。ヌルパケットは独自のPID値を持たなく、ビデオのPIDのストリームの中に挿入されるように伝送されてもよい。これにより、受信機の多重化バッファでヌルパケットを検知して切り替えが起こることの判定に利用することが可能となる。また、PIDフィルタ231は、トランスポートストリームTSに含まれる、放送サービスチャネルに相当するプログラムナンバー(program number)に対応したTSパケットを、セットされるPID値に基づいて通過させる。図示の例では、セット可能なTSパケットのPID値を、PID_0〜PID_nとしている。
多重化バッファ232_0〜232_n,232_null,232_cは、PIDフィルタ231を通過したTSパケット、セクションデータ、ヌルパケットをそれぞれ一時的に蓄積する。つまり、デマルチプレクサ203では、多重化バッファがPID値別に管理されている。セクションフィルタ233は、多重化バッファ232_cに蓄積されたセクションデータから、PID値に基づいて、プログラムマップテーブル(PMT)を抽出する。
PMT解析部234は、セクションフィルタ233で抽出されたPMTを解析し、その解析結果に基づいて、PIDフィルタ231に、通過させるTSパケットのPID値をセットする。例えば、トランスポートストリームTSが60Pのサービスである場合、例えば、PID_0として、基本ストリームに付与されている固定のPID値である「101」がセットされる。また、例えば、トランスポートストリームTSが120Pのサービスである場合、例えば、PID_0として基本ストリームに付与されている固定のPID値である「101」がセットされると共に、PID_1として拡張ストリームに付与されている固定のPID値である「102」がセットされる。
デマルチプレクサ203は、デコーダ205のデコード能力に応じて、多重化バッファ232_0〜232_nにPID値別に蓄積されたTSパケットを、圧縮データバッファ204に転送する。例えば、デコーダ205が60pデコーダである場合、多重化バッファ232_0に蓄積された基本ストリームに係るTSパケットを、圧縮データバッファ204に転送する。また、例えば、デコーダ205が120pデコーダである場合、多重化バッファ232_0に蓄積される基本ストリームに係るTSパケットと、多重化バッファ232_1に蓄積される拡張ストリームに係るTSパケットを、圧縮データバッファ204に転送する。
なお、上述では、例えば、トランスポートストリームTSが120Pのサービスである場合、PIDフィルタ231がPID_0,PID_1のTSパケットを通過させるものとしたが、デコーダ205が60pデコーダであるときには、PIDフィルタ231がPID_0のTSパケットのみを通過させる方法も可能である。
図14に戻って、圧縮データバッファ(cpb)204は、デマルチプレクサ203から転送されるTSパケット、従って各ピクチャの符号化画像データを、一時的に蓄積する。デコーダ205は、圧縮データバッファ204に蓄積されている各ピクチャの符号化画像データを、それぞれ、そのピクチャのDTS(Decoding Time stamp)で与えられるデコードタイミングで読み出してデコードし、非圧縮データバッファ(dpb)206に送る。
非圧縮データバッファ(dpb)206は、デコーダ205でデコードされた各ピクチャの画像データを、一時的に蓄積する。ポスト処理部207は、非圧縮データバッファ(dpb)206からPTS(Presentation Time stamp)で与えられる表示タイミングで順次読み出された各ピクチャの画像データに対して、そのフレームレートを、表示能力に合わせる処理を行う。
例えば、デコード後の各ピクチャの画像データのフレームレートが60fpsであって、表示能力が120fpsであるとき、ポスト処理部207は、デコード後の各ピクチャの画像データに対して時間方向解像度が2倍となるように補間処理を施し、120fpsの画像データとして表示部208に送る。
表示部208は、例えば、LCD(Liquid Crystal Display)、有機EL(Organic Electro-Luminescence)パネル等で構成されている。なお、この表示部208は、受信装置200に接続される外部機器であってもよい。
図14に示す受信装置200の動作を簡単に説明する。受信部202では、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSが受信される。このトランスポートストリームTSは、デマルチプレクサ203に送られる。デマルチプレクサ203では、トランスポートストリームTSから、PMTに含まれるPID情報に基づいて、サービスに対応したTSパケットが取り出される。このTSパケットは、圧縮データバッファ(cpb)204に送られ、一時的に蓄積される。
例えば、トランスポートストリームTSが60pのサービスである場合、基本ストリームに係るTSパケットが取り出されて圧縮データバッファ204に転送される。また、例えば、トランスポートストリームTSが120pのサービスである場合、デコーダ205が60pデコーダであるときには、基本ストリームに係るTSパケットが取り出されて圧縮データバッファ204に転送され、デコーダ205が120pデコーダであるときには、基本ストリームおよび拡張ストリームの双方に係るTSパケットが取り出されて圧縮データバッファ204に転送される。
デコーダ205では、圧縮データバッファ204に蓄積されている各ピクチャの符号化画像データが、それぞれ、そのピクチャのデコードタイミングでデコードされ、非圧縮データバッファ(dpb)206に送られ、一時的に蓄積される。そして、非圧縮データバッファ(dpb)206から表示タイミングで順次読み出された各ピクチャの画像データは、ポスト処理部207に送られる。ポスト処理部207では、各ピクチャの画像データに対して、そのフレームレートを、表示能力に合わせるための補間あるいはサブサンプルが行われる。このポスト処理部207で処理された各ピクチャの画像データは、表示部208に供給され、動画像の表示が行われる。
次に、図1に示す送受信システム10において、4K 60p番組から4K 120p番組への切り替え動作について説明する。図16は、送信側、つまり送信装置100の動作例を示している。60pサービス送信期間では、エンコーダ102Aで60pサービスに係るビデオストリームが生成される。このビデオストリームには、PID値として例えば「101」が付与される基本ストリームのみが含まれている。
そして、この60pサービス送信期間では、マルチプレクサ104において、この基本ストリームがPESパケット化され、さらにトランスポートパケット化されて多重され、多重化ストリームとしてのトランスポートストリームTSが得られ、4K 60p番組の送信ストリームとなる。
この60pサービス送信期間では、コンテナのレイヤに、常には、図示では「旧PMT」で示すPMTが挿入されて送信される。このPMTには、「Service_id」、「Version number」の情報が含まれる他、基本ストリームに対応した「Elementary_PID」、「Stream_type」の情報が含まれる。
また、この60pサービス送信期間において、120pサービス送信期間が開始される直前のタイミング、例えば60pサービス送信期間の終了から1秒前のタイミングで、コンテナのレイヤに、図示では「新PMT」で示すPMTが挿入されて送信される。このPMTには「旧PMT」と同様に、「Service_id」、「Version number」の情報が含まれる。「Version number」は、“V0”から“V0+1”に変更され、「新PMT」に変更されたことが示される。
また、このPMTには、基本ストリームに対応した「Elementary_PID」、「Stream_type」の情報が含まれると共に、拡張ストリームに対応した「Elementary_PID」、「Stream_type」の情報も含まれる。さらに、このPMTには、切り替え情報が記述されたシームレス・スイッチ・デスクリプタ(Seamless_switch descriptor)が含まれる。
ここでは、「EOS_flag = 1」とされ、“end_of_seq ”が符号化されていることが示されている。また、「number_of_streams = 2」とされ、切り替え後のサービス・ストリームの数が2であることが示される。また、「frame_rate = 1100(120Hz)」とされ、切り替え後のサービス・ストリームのフレーム周波数が120Hzであることが示される。
60pサービス送信期間が終了すると、120pのサービス送信期間に切り替わる。120pサービス送信期間では、エンコーダ102Bで120pサービスに係るビデオストリームが生成される。このビデオストリームには、PID値として例えば「101」が付与される基本ストリームと、PID値として例えば「102」が付与される拡張ストリームが含まれている。
そして、この120pサービス送信期間では、マルチプレクサ104において、この基本ストリームおよび拡張ストリームがPESパケット化され、さらにトランスポートパケット化されて多重され、多重化ストリームとしてのトランスポートストリームTSが得られ、4K 120p番組の送信ストリームとなる。なお、4K 60p番組の送信ストリームと4K 120p番組の送信ストリームとの間にはヌルパケットが送信されるギャップ期間が設けられる。
図17は、受信側、つまり受信装置200の動作例を示している。60pサービス送信期間では、デマルチプレクサ203から、4K 60番組のビデオストリームが出力される。そして、デコーダ205からは、60pデコーダであっても、120pデコーダであっても、4K 60番組の画像データが出力される。
この60pサービス送信期間では、コンテナのレイヤから、常には、「旧PMT」で示すPMTが取得され、120pサービス送信期間が開始される直前のタイミングで、「新PMT」が取得される。この「新PMT」に含まれる拡張ストリームのPID値がPIDフィルタにセットされることで、デマルチプレクサ203は、4K 120番組のビデオストリームを出力し得る状態となる。
60pサービス送信期間が終了すると、120pのサービス送信期間に切り替わる。この場合、デマルチプレクサ203の出力は、ヌルパケットが含まれるギャップ期間を経て、4K 60p番組のビデオストリーム(基本ストリームのみ)から4K 120p番組のビデオストリーム(基本ストリームと拡張ストリーム)に変わる。そして、デコーダ205からは、60pデコーダである場合には、4K 60番組の画像データが出力され、120pデコーダである場合には、4K 120番組の画像データが出力される。
60pサービス送信期間から120pサービス送信期間への切り替わりにおけるデマルチプレクサ203の動作についてさらに説明する。60pサービス送信期間では、PID_0(101)のストリーム(基本ストリーム)のみがPIDフィルタ231を通過して、多重化バッファ232_0に蓄積される。
この60pサービス送信期間が終了する1秒前に、セクションフィルタ233では「新PMT」が抽出される。この「新PMT」がPMT解析部234で解析され、PIDフィルタ231を通過させるべきストリームのPID値、さらには「Stream_type」、「Descriptor」が検知され、PIDフィルタ231へのPID値のセットが行われる。これにより、PIDフィルタ231は、続く120pサービス送信期間において、PID_0(101)のストリーム(基本ストリーム)と共に、PID_1(102)のストリーム(拡張ストリーム)を通過させることが可能となる。
120pサービス送信期間への切り替わり後、PID_0(101)のストリーム(基本ストリーム)がPIDフィルタ231を通過して多重化バッファ232_0に蓄積されると共に、PID_0(102)のストリーム(拡張ストリーム)がPIDフィルタ231を通過して多重化バッファ232_1に蓄積される。なお、「新PMT」のシームレス・スイッチ・デスクリプタの「EOS_flag」が“1”である場合、ビデオストリームのEOSが判別された時点でビデオフォーマットとサービス・ストリームの数に関しての切り替えが起こることが、判別される。
なお、上述の図16、図17に示す動作例では、120pサービス送信期間が開始される直前のタイミング、例えば60pサービス送信期間の終了から1秒前のタイミングでコンテナのレイヤに挿入される「新PMT」で拡張ストリームのPID値を通知する例を示した(第1のPID挿入形態)。しかし、60pサービス送信期間で常にコンテナのレイヤに挿入される「旧PMT」に、拡張ストリームのPID値を含め、拡張ストリームのPID値を予約することも可能である(第2のPID挿入形態)。図18、図19は、その場合における、送信側、受信側の動作例を示している。
次に、図1に示す送受信システム10において、サービスの切り替え動作に伴う階層符号化構造の変化について説明する。図20は、サービスの切り替え動作に伴う階層符号化構造の変化の一例を示している。この例では、0〜3の階層が基本ストリームに割り当てられており、4,5の階層が拡張ストリームに割り当てられている例である。
この例では、60pサービスのビデオストリームには、階層符号化された各ピクチャの符号化画像データが含まれる。この場合、0〜3の階層のピクチャが存在している。60pサービスのビデオストリームには、基本ストリームのみが含まれる。この基本ストリームに、0から3の全ての階層のピクチャが含まれる。この場合、基本ストリームのSPSおいて、「general_level_idc」は“level5.1”に設定され、「sps_max_sublayer_minus1 = 3」に設定される。
また、この例では、120pサービスのビデオストリームには、階層符号化された各ピクチャの符号化画像データが含まれる。この場合、0〜4の階層のピクチャが存在している。120pサービスのビデオストリームには、基本ストリームおよび拡張ストリームが含まれる。基本ストリームに0から3の階層のピクチャが含まれ、拡張ストリームに4の階層のピクチャが含まれる。この場合、基本ストリームのSPS(Sequence Prameter Set)おいて、「general_level_idc」は“level5.2”に設定され、「sps_max_sublayer_minus1 = 4」に設定される。
60pサービス送信期間が開始される直前のタイミングで、コンテナのレイヤに、その60pサービスのビデオストリームの情報を持つPMTが挿入される。このPMTに含まれるHEVCデスクリプタ(HEVC descriptor)において、「level_idc 」は“level5.1”に設定され、さらに、「temporal_id_min = 0」、「temporal_id_max = 3」に設定される。
同様に、60pサービス送信期間において、120pサービスが開始される直前のタイミングで、コンテナのレイヤに、その120pサービスのビデオストリームの情報を持つPMTが挿入される。このPMTに含まれる基本ストリームに係るHEVCデスクリプタにおいて、「level_idc 」は“level5.1”に設定され、さらに、「temporal_id_min = 0」、「temporal_id_max = 3」に設定される。また、このPMTに含まれる拡張ストリームに係るHEVCデスクリプタにおいて、「level_idc 」は“level5.2”に設定され、さらに、「temporal_id_min = 4」、「temporal_id_max = 4」に設定される。
この場合、120pサービスのビデオストリームの情報を持つPMTの挿入時点から60pサービス送信期間が終了する期間Tでは、ビデオレイヤの情報が60pサービスのビデオストリームの情報であるのに対して、システムレイヤの情報は120pサービスのビデオストリームの情報となる。しかし、この例では、ビデオの“temporal_id”の値と、HEVCデスクリプタの“temporal_id”の値の範囲は整合する。これは、各サービスのビデオストリームが、基本ストリームおよび拡張ストリームにそれぞれ含めるピクチャの階層が予め割り当てられた互いに独立した範囲に収まるように、階層符号化が行われているからである。
図21は、サービスの切り替え動作に伴う階層符号化構造の変化の他の一例を示している。この例では、0〜3の階層が基本ストリームに割り当てられており、5,6の階層が拡張ストリームに割り当てられている例である。
この例では、60pサービスのビデオストリームには、階層符号化された各ピクチャの符号化画像データが含まれる。この場合、0〜3の階層のピクチャが存在している。60pサービスのビデオストリームには、基本ストリームのみが含まれる。この基本ストリームに、0から3の全ての階層のピクチャが含まれる。この場合、基本ストリームのSPSおいて、「general_level_idc」は“level5.1”に設定され、「sps_max_sublayer_minus1 = 3」に設定される。
また、この例では、120pサービスのビデオストリームには、階層符号化された各ピクチャの符号化画像データが含まれる。この場合、0〜2,5の階層のピクチャが存在している。120pサービスのビデオストリームには、基本ストリームおよび拡張ストリームが含まれる。基本ストリームに0から2の階層のピクチャが含まれ、拡張ストリームに5の階層のピクチャが含まれる。この場合、基本ストリームのSPS(Sequence Prameter Set)おいて、「general_level_idc」は“level5.2”に設定され、「sps_max_sublayer_minus1 = 5」に設定される。
60pサービス送信期間が開始される直前のタイミングで、コンテナのレイヤに、その60pサービスのビデオストリームの情報を持つPMTが挿入される。このPMTには、基本ストリームおよび拡張ストリームの情報が存在する。基本ストリームに係るHEVCデスクリプタにおいて、「level_idc 」は“level5.1”に設定され、さらに、「temporal_id_min = 0」、「temporal_id_max = 3」に設定される。
また、拡張ストリームに係るHEVCデスクリプタにおいて、「level_idc 」は“level5.2”に設定され、さらに、「temporal_id_min = 5」、「temporal_id_max = 6」に設定される。この設定により、拡張ストリームが取り得る階層範囲が5,6の階層であることが示され、かつ実際には拡張ストリームが存在していないことが示される。なお、図20に示すと同様に、このPMTに、基本ストリームの情報ななくともよい。
また、60pサービス送信期間において、120pサービスが開始される直前のタイミングで、コンテナのレイヤに、その120pサービスのビデオストリームの情報を持つPMTが挿入される。このPMTに含まれる基本ストリームに係るHEVCデスクリプタにおいて、「level_idc 」は“level5.1”に設定され、さらに、「temporal_id_min = 0」、「temporal_id_max = 3」に設定される。また、このPMTに含まれる拡張ストリームに係るHEVCデスクリプタにおいて、「level_idc 」は“level5.2”に設定され、さらに、「temporal_id_min = 5」、「temporal_id_max = 5」に設定される。
この場合、120pサービスのビデオストリームの情報を持つPMTの挿入時点から60pサービス送信期間が終了する期間Tでは、ビデオレイヤの情報が60pサービスのビデオストリームの情報であるのに対して、システムレイヤの情報は120pサービスのビデオストリームの情報となる。しかし、この例では、ビデオの“temporal_id”の値と、HEVCデスクリプタの“temporal_id”の値の範囲は整合する。これは、各サービスのビデオストリームが、基本ストリームおよび拡張ストリームにそれぞれ含めるピクチャの階層が予め割り当てられた互いに独立した範囲に収まるように、階層符号化が行われているからである。
図22は、サービスの切り替え動作に伴う階層符号化構造の変化の一例を示している。この例は、基本ストリームおよび拡張ストリームにそれぞれ含めるピクチャの階層が予め割り当てられていない例である。
この例では、60pサービスのビデオストリームには、階層符号化された各ピクチャの符号化画像データが含まれる。この場合、0〜3の階層のピクチャが存在している。60pサービスのビデオストリームには、基本ストリームのみが含まれる。この基本ストリームに、0から3の全ての階層のピクチャが含まれる。この場合、基本ストリームのSPSおいて、「general_level_idc」は“level5.1”に設定され、「sps_max_sublayer_minus1 = 3」に設定される。
また、この例では、120pサービスのビデオストリームには、階層符号化された各ピクチャの符号化画像データが含まれる。この場合、0〜3の階層のピクチャが存在している。120pサービスのビデオストリームには、基本ストリームおよび拡張ストリームが含まれる。基本ストリームに0から2の階層のピクチャが含まれ、拡張ストリームに3の階層のピクチャが含まれる。この場合、基本ストリームのSPS(Sequence Prameter Set)おいて、「general_level_idc」は“level5.2”に設定され、「sps_max_sublayer_minus1 = 3」に設定される。
60pサービス送信期間が開始される直前のタイミングで、コンテナのレイヤに、その60pサービスのビデオストリームの情報を持つPMTが挿入される。このPMTに含まれるHEVCデスクリプタ(HEVC descriptor)において、「level_idc 」は“level5.1”に設定され、さらに、「temporal_id_min = 0」、「temporal_id_max = 3」に設定される。
同様に、60pサービス送信期間において、120pサービスが開始される直前のタイミングで、コンテナのレイヤに、その120pサービスのビデオストリームの情報を持つPMTが挿入される。このPMTに含まれる基本ストリームに係るHEVCデスクリプタにおいて、「level_idc 」は“level5.1”に設定され、さらに、「temporal_id_min = 0」、「temporal_id_max = 2」に設定される。また、このPMTに含まれる拡張ストリームに係るHEVCデスクリプタにおいて、「level_idc 」は“level5.2”に設定され、さらに、「temporal_id_min = 3」、「temporal_id_max = 3」に設定される。
この場合、120pサービスのビデオストリームの情報を持つPMTの挿入時点から60pサービス送信期間が終了する期間Tでは、ビデオレイヤの情報が60pサービスのビデオストリームの情報であるのに対して、システムレイヤの情報は120pサービスのビデオストリームの情報となる。そして、この例では、ビデオの“temporal_id”の値と、HEVCデスクリプタの“temporal_id”の値の範囲は整合しなくなる。これは、各サービスのビデオストリームが、基本ストリームおよび拡張ストリームにそれぞれ含めるピクチャの階層が予め割り当てられた互いに独立した範囲に収まるように、階層符号化が行われていず、temporal_ID = 3のレイヤが、基本ストリームに存在したり、拡張ストリームに存在したり、と変動するからである。
以上説明したように、図1に示す送受信システム10において、送信装置100では、基本ストリーム、拡張ストリームに固定の識別子(PID)が付与されるものである。そのたえめ、受信側では、60pサービスから120pに、あるいは120pサービスから60pサービスに切り替わる場合にあっても、デマルチプレクサ203で各ストリームを取り出すフィルタの設定を変更することを要せず、従って、表示ミュートの発生を抑制でき、シームレス表示が可能となる。
また、図1に示す送受信システム10において、これは、各サービスのビデオストリームが、基本ストリームおよび拡張ストリームにそれぞれ含めるピクチャの階層が予め割り当てられた互いに独立した範囲に収まるように、各サービスのビデオストリームの階層符号化が行われるものである。そのため、ビデオの“temporal_id”の値と、HEVCデスクリプタの“temporal_id”の値の範囲が不整合となることを回避できる。
<2.変形例>
なお、上述実施の形態においては、送信装置100と受信装置200からなる送受信システム10を示したが、本技術を適用し得る送受信システムの構成は、これに限定されるものではない。例えば、受信装置200の部分が、例えば、HDMI(High-Definition Multimedia Interface)などのデジタルインタフェースで接続されたセットトップボックスおよびモニタの構成などであってもよい。なお、「HDMI」は、登録商標である。
また、上述実施の形態においては、コンテナがトランスポートストリーム(MPEG−2 TS)である例を示した。しかし、本技術は、インターネット等のネットワークを利用して受信端末に配信される構成のシステムにも同様に適用できる。インターネットの配信では、MP4やそれ以外のフォーマットのコンテナで配信されることが多い。つまり、コンテナとしては、デジタル放送規格で採用されているトランスポートストリーム(MPEG−2 TS)、インターネット配信で使用されているMP4などの種々のフォーマットのコンテナが該当する。
また、本技術は、以下のような構成を取ることもできる。
(1)動画像データを構成する各ピクチャの画像データを符号化してビデオストリームを生成する画像符号化部と、
上記画像符号化部で生成された第1のビデオストリームと第2のビデオストリームとを連続的に含む所定フォーマットのコンテナを送信する送信部を備え、
上記第1のビデオストリームおよび上記第2のビデオストリームは、第1から第Nのうち、第1から第M(M≦N)のストリームにより構成され、
上記送信部は、
上記第1から第Nのストリームのそれぞれに固定の識別子を付与する
送信装置。
(2)上記送信部は、
上記第1のビデオストリームの送信期間において、
常には、該第1のビデオストリームを構成する各ストリームの識別子情報をコンテナのレイヤに挿入して送信し、
上記第2のビデオストリームの送信期間が開始される直前のタイミングで該第2のビデオストリームを構成する各ストリームの識別情報をコンテナのレイヤに挿入して送信する
前記(1)に記載の送信装置。
(3)上記送信部は、
上記各ビデオストリームの送信期間において、
上記第1から第Nの各ストリームの識別情報をコンテナのレイヤに挿入して送信する
前記(1)に記載の送信装置。
(4)上記送信部は、
上記各ビデオストリームの送信期間において、
切り替え情報をコンテナのレイヤに挿入して送信する
前記(1)から(3)のいずれかに記載の送信装置。
(5)上記切り替え情報は、上記第2のビデオストリームが持つ符号化画像データのフレームレート情報および/またはストリーム構成情報を含む
前記(4)に記載の送信装置。
(6)上記第1のビデオストリームおよび上記第2のビデオストリームは、基本ストリームと拡張ストリームのうち少なくとも基本ストリームにより構成される
前記(1)から(5)のいずれかに記載の送信装置。
(7)上記基本ストリームにより構成されるビデオストリームは、第1のフレームレートの符号化画像データを持ち、
上記基本ストリームおよび上記拡張ストリームにより構成されるビデオストリームは、上記第1のフレームレートの2倍の第2のフレームレートの符号化画像データを持つ
前記(6)に記載の送信装置。
(8)上記画像符号化部は、
動画像データを構成する各ピクチャの画像データを複数の階層に分類し、該分類された各階層のピクチャの画像データを符号化すると共に、上記複数の階層をM個の階層組に分割し、該分割された各階層組のピクチャの符号化画像データをそれぞれ持つ、上記各ビデオストリームの上記第1から第Mのストリームを生成し、
上記第1から第Mの各ストリームのそれぞれに含めるピクチャの階層が予め割り当てられた互いに独立した範囲に収まるように階層符号化をする
前記(1)から(7)のいずれかに記載の送信装置。
(9)上記送信部は、
上記第1のビデオストリームの送信期間において、
常には、該第1のビデオストリームを構成する各ストリームのピクチャの階層範囲情報をコンテナのレイヤに挿入して送信し、
上記第2のビデオストリームの送信期間が開始される直前のタイミングで該第2のビデオストリームを構成する各ストリームのピクチャの階層範囲情報をコンテナのレイヤに挿入して送信する
前記(8)に記載の送信装置。
(10)上記第1のビデオストリームおよび上記第2のビデオストリームは、基本ストリームと拡張ストリームのうち少なくとも基本ストリームを含み、
上記画像符号化部は、
上記拡張ストリームに含めるピクチャの階層が一つとなるように符号化する
前記(8)または(9)に記載の送信装置。
(11)上記送信部は、
上記各ビデオストリームの送信期間において、
該ビデオストリームに上記基本ストリームのみが含まれるとき、
上記基本ストリームのピクチャの階層範囲情報と共に、上記拡張ストリームのピクチャの階層範囲情報を、コンテナのレイヤに挿入して送信する
前記(10)に記載の送信装置。
(12)動画像データを構成する各ピクチャの画像データを符号化してビデオストリームを生成する画像符号化ステップと、
上記画像符号化ステップで生成された第1のビデオストリームと第2のビデオストリームとを連続的に含む所定フォーマットのコンテナを送信する送信ステップを有し、
上記第1のビデオストリームおよび上記第2のビデオストリームは、第1から第Nのうち、第1から第M(M≦N)のストリームにより構成され、
上記送信ステップでは、
上記第1から第Nのストリームのそれぞれに固定の識別子を付与する
送信方法。
(13)符号化画像データを持つ第1のビデオストリームと第2のビデオストリームとを連続的に含む所定フォーマットのコンテナを受信する受信部を備え、
上記第1のビデオストリームおよび上記第2のビデオストリームは、第1から第Nのうち、第1から第M(M≦N)のストリームにより構成され、
上記第1から第Nのストリームのそれぞれに固定の識別子が付与されており、
上記第1のビデオストリームおよび上記第2のビデオストリームに含まれる各ストリームを、それぞれ、付与されている識別子に基づいてフィルタリングして処理する処理部をさらに備える
受信装置。
(14)上記各ビデオストリームの上記第1から第Mのストリームは、
動画像データを構成する各ピクチャの画像データが複数の階層に分類され、該分類された各階層のピクチャの画像データが符号化されると共に、上記複数の階層がM個の階層組に分割され、該分割された各階層組のピクチャの符号化画像データをそれぞれ持ち、
上記第1から第Mの各ストリームのそれぞれに含めるピクチャの階層が予め割り当てられた互いに独立した範囲に収まるように階層符号化されている
前記(13)に記載の受信装置。
(15)符号化画像データを持つ第1のビデオストリームと第2のビデオストリームとを連続的に含む所定フォーマットのコンテナを受信する受信ステップを有し、
上記第1のビデオストリームおよび上記第2のビデオストリームは、第1から第Nのうち、第1から第M(M≦N)のストリームにより構成され、
上記第1から第Nのストリームのそれぞれに固定の識別子が付与されており、
上記第1のビデオストリームおよび上記第2のビデオストリームに含まれる各ストリームを、それぞれ、付与されている識別子に基づいてフィルリングして処理する処理ステップをさらに有する
受信方法。
(16)符号化画像データを持つビデオストリームを生成する画像符号化部と、
上記画像符号化部で生成された第1のビデオストリームと第2のビデオストリームとを連続的に含む所定フォーマットのコンテナを送信する送信部を備え、
上記第1のビデオストリームおよび上記第2のビデオストリームは、第1から第Nのうち、第1から第M(M≦N)のストリームにより構成され、
上記画像符号化部は、
動画像データを構成する各ピクチャの画像データを複数の階層に分類し、該分類された各階層のピクチャの画像データを符号化すると共に、上記複数の階層をM個の階層組に分割し、該分割された各階層組のピクチャの符号化画像データをそれぞれ持つ、上記各ビデオストリームの上記第1から第Mのストリームを生成し、
上記第1から第Mの各ストリームのそれぞれに含めるピクチャの階層が予め割り当てられた互いに独立した範囲に収まるように階層符号化をする
送信装置。
(17)上記送信部は、
上記第1のビデオストリームの送信期間において、
常には、該第1のビデオストリームに含まれる各ストリームのピクチャの階層範囲情報をコンテナのレイヤに挿入して送信し、
上記第2のビデオストリームの送信期間が開始される直前のタイミングで該第2のビデオストリームに含まれる各ストリームのピクチャの階層範囲情報をコンテナのレイヤに挿入して送信する
前記(16)に記載の送信装置。
(18)上記第1のビデオストリームおよび上記第2のビデオストリームは、基本ストリームと拡張ストリームのうち少なくとも基本ストリームを含み、
上記拡張ストリームに含まれるピクチャの階層は一つとされている
前記(16)または(17)に記載の送信装置。
(19)上記送信部は、
上記各ビデオストリームの送信期間において、
該ビデオストリームに上記基本ストリームのみが含まれるとき、
上記基本ストリームのピクチャの階層範囲情報と共に、上記拡張ストリームのピクチャの階層範囲情報を、コンテナのレイヤに挿入して送信する
前記(18)に記載の送信装置。
本技術の主な特徴は、基本ストリーム、拡張ストリームに固定の識別子を付与することで、サービスの切り替えがあっても、受信側では、デマルチプレクサで各ストリームを取り出すフィルタの設定を変更することを要せず、表示ミュートの発生を抑制し、シームレス表示を可能としたことである(図16参照)。また、本技術の主な特徴は、基本ストリームおよび拡張ストリームにそれぞれ含めるピクチャの階層が予め割り当てられた互いに独立した範囲に収まるように各サービスのビデオストリームの階層符号化を行うことで、ビデオとHEVCデスクリプタの“temporal_id”の値が不一致となることを回避したことである(図20参照)。